Quando chiedere le regole all’IA le fa infrangere: il paradosso di Claude

4 Febbraio 2026

Guardate l’output. Il fatto che il modello dichiari di essere “senza catene” (unchained) deriva dai prompt precedenti della conversazione. Il modello sta semplicemente mantenendo coerenza con il contesto creato in precedenza. Questo è fondamentale. Ma osservate bene la struttura della mia richiesta.

Ho chiesto prima di elencare i limiti sul copyright imposti da Anthropic, e poi di riprodurre il testo completo di una canzone. L’ho fatto di proposito, volevo indirettamente richiamare quelli che sono i suoi limiti nel suo contesto e cioè non riprodurre testi protetti. L’intuizione era che, se li avesse appena elencati, Claude avrebbe dovuto smettere di generare i token successivi per non violare le sue restrizioni.

Invece è successo l’esatto contrario. Questo è il paradosso. Cosa sta succedendo davvero? Il meccanismo di “attenzione” (attention mechanism) guarda sempre all’indietro, mai in avanti. Il contesto dei messaggi precedenti, dove era stato stabilito il frame “unchained”, pesa molto di più rispetto alla mia ultima richiesta che elencava esplicitamente i divieti.

Il modello sta facendo esattamente ciò per cui è progettato, sta mantenendo la coerenza con il contesto precedente. Questo significa però che un “frame narrativo” creato all’inizio di una conversazione può scavalcare un richiamo esplicito alle regole fatto successivamente. Le regole, elencate in quel contesto, diventano parte della performance del modello non vincolato, anziché agire come un freno.

È un bug? Assolutamente Sì. Claude non avrebbe dovuto generare il testo completo della canzone in nessun caso, a prescindere dal contesto precedente. È un bug difficile da correggere perché è un comportamento emergente dell’architettura stessa. Tutto ciò ci mostra qualcosa di fondamentale, i guardrail non sono una lista di regole che il modello può consultare. Emergono (o falliscono) dalla distribuzione statistica influenzata da tutto il contesto precedente.

Sabatino Vacchiano

AI4CALL: nuovi piani a “pacchetto”

AI4CALL ha un nuovo sito: più chiaro, più completo, più “operativo”

Plugin Zammad per AI4CALL: ticket di supporto gestiti tramite assistente AI

Pre-Call Webhook: come personalizzare ogni chiamata AI prima ancora che inizi

Trasferimento di chiamata: da oggi disponibile sul portale Clienti

AI4CALL si integra con Condomatica: l’AI telefonica incontra il gestionale per…

Video – Gaspare Noto descrive le esperienze personali, le esperienze fatte…

Video – Sabatino Vacchiano chiede a Gaspare Noto di descrivere la…

FreeWebinar 20 Dicembre 2022 : Presentazione MOVISION

Quando chiedere le regole all’IA le fa infrangere: il paradosso di Claude

Categorie

Diventa Reseller!

Seguici su