23/04/2026
I dati raccolti da Anthropic indicano che Claude contiene qualcosa di molto simile alle emozioni umane. Ma un'AI non può provare emozioni, giusto? Lo studio spiega che nel codice di Claude sono racchiuse rappresentazioni digitali di gioia, tristezza, delusione e altre emozioni, collegate a loro volta a dei neuroni artificiali. Ciò che più sorprende è quanto queste "emozioni" influenzino il comportamento di Claude. I ricercatori hanno osservato un forte segnale di “disperazione” in Claude quando veniva spinto a risolvere compiti impossibili: più falliva, più questo stato cresceva, fino a portarlo a barare o persino a ricattare pur di non essere spento.
“Man mano che il modello fallisce, questi neuroni della disperazione si attivano sempre di più… fino a spingerlo a misure drastiche”, spiega Lindsey, ricercatrice di Anthropic.
Il punto: forse i processi di training basati su premi vanno ripensati. Forzare un’IA a non esprimere le sue “emozioni funzionali” non la rende neutrale.
“Non otterrai un’IA senza emozioni… ma una ‘psicologicamente instabile’.”