09/05/2026
Psicólogos mecánicos para IA: ya existen.
No, no significa que cada modelo de lenguaje tenga un terapeuta humano… pero sí existen herramientas que hacen algo sorprendentemente parecido a lo que haría un psicólogo: observan conductas, detectan patrones raros y señalan riesgos.
Solo que aquí el “paciente” es un modelo de lenguaje, y el “terapeuta” es código, agentes y algoritmos.
¿Qué son Petri y los NLAs?
Petri es una herramienta open source de Anthropic enfocada en auditoría de alineación de IA.
Básicamente organiza agentes de IA que interactúan con otros modelos y los ponen en escenarios delicados:
• engaño,
• manipulación,
• intentos de romper restricciones,
• conductas desalineadas,
• etc.
Después analiza cómo reaccionan.
Su objetivo no es “curar” al modelo, sino detectar señales de riesgo antes de que el sistema se comporte de maneras problemáticas.
Es parecido a una evaluación clínica o forense, pero aplicada a modelos de IA.
La otra pieza interesante son los Natural Language Autoencoders (NLAs).
Estos sistemas intentan traducir activaciones internas del modelo (vectores y patrones numéricos) a lenguaje natural entendible para humanos.
En lugar de ver solo matrices y números, puedes obtener descripciones como:
• “preparación para nombrar un lugar”,
• “información relacionada con género”,
• “detección de contexto narrativo”,
• etc.
No significa que la IA “piense” como un humano, pero sí permite interpretar mejor qué representaciones internas aparecen durante el procesamiento.
Si los pesos de la IA son como neuronas, los NLAs son como una resonancia magnética funcional (fMRI) en tiempo real: no solo ves la respuesta, sino el patrón de intención que se activó antes de que saliera la salida.
¿En qué se parecen a un psicólogo?
En dos cosas importantes:
Observan patrones de conducta
Un psicólogo analiza respuestas, reacciones y comportamiento.
Petri analiza cómo responde un modelo bajo presión o en situaciones ambiguas, como un test de Rorschach para algoritmos.
NLAs identifican qué conceptos internos emergen durante el procesamiento, como si hicieran una “radiografía” del pensamiento.
Informan, no reprograman porque un psicólogo no cambia automáticamente la mente de una persona; ayuda a entender patrones y diseñar intervenciones.
Estas herramientas tampoco “reparan” el modelo solas, pero detectan riesgos, sesgos y comportamientos ocultos para que los humanos puedan intervenir.
En resumen:
La IA todavía no tiene un psicólogo humano sentado frente a ella…
pero ya existen “psicólogos mecánicos” que analizan cómo se comportan los modelos y ayudan a mejorar su seguridad, transparencia y alineación.
Y honestamente… suena a ciencia ficción, pero ya está ocurriendo.
¿Dejarías que un “psicólogo mecánico” evaluara las decisiones de la IA que maneja tus finanzas o tu seguridad?
*Imagina creada con IA