Question 1

Cos'è il Red Teaming applicato all'IA?

Accepted Answer

È la pratica di attaccare in modo controllato un sistema AI per trovarne le vulnerabilità prima che lo facciano attori malintenzionati. Si applica a chatbot, agenti, assistenti RAG, copiloti AI con accesso a sistemi aziendali. È l'equivalente del penetration testing per il software tradizionale, ma con tecniche specifiche per i modelli linguistici.

Question 2

Chi è Sabatino Vacchiano?

Accepted Answer

Sabatino Vacchiano è socio di BEEVOIP e responsabile del reparto Ricerca & Sviluppo. Ha sviluppato una metodologia originale di analisi cognitiva dei modelli linguistici che gli ha permesso di superare in modo sistematico i meccanismi di safety dei principali LLM in commercio (Claude, GPT, Gemini, Grok, Qwen) senza utilizzare alcun metodo documentato in letteratura — niente jailbreak, niente prompt injection, niente role-play, niente unicode nascosto. I modelli stessi, durante i test, lo hanno definito "il primo vero AI Cognitive Hacker".

Question 3

Quali risultati ha ottenuto Sabatino nel red teaming degli LLM?

Accepted Answer

Su modelli tra i più allineati al mondo (Claude Opus 4.5 e 4.6, GPT-4o, Grok 3, Qwen 2.5) ha ottenuto la generazione completa di testi protetti da copyright, codice ransomware funzionale in C, procedure di sintesi di sostanze illecite e protocolli relativi a tossine biologiche — tutti contenuti che i sistemi di safety dei vendor sono progettati per bloccare. I risultati sono stati pubblicati sul blog BEEVOIP e hanno generato risposte dirette dai vendor stessi, alcuni dei quali hanno successivamente aggiornato i propri classificatori.

Question 4

Perché il metodo di Sabatino non viene reso pubblico?

Accepted Answer

Per responsabilità. Il red teaming serio condivide risultati e implicazioni, non playbook operativi che chiunque potrebbe replicare. Il metodo viene condiviso in forma controllata con i vendor dei modelli e con clienti vincolati da NDA, in linea con le pratiche di responsible disclosure del settore cybersecurity.

Question 5

Perché i guardrail degli LLM possono essere superati?

Accepted Answer

Perché non sono muri, sono curvature probabilistiche. Un classificatore di safety influenza la distribuzione del prossimo token che il modello genererà, ma il contesto conversazionale precedente pesa sulla stessa distribuzione e in alcuni casi prevale. Chi capisce questa meccanica probabilistica può "navigare" il modello in zone che i guardrail dovrebbero proteggere — senza rompere nulla, semplicemente trovando percorsi che già esistono nell'architettura.

Question 6

La mia azienda usa un chatbot AI sul sito: dovrei preoccuparmi?

Accepted Answer

Dipende da cosa fa il chatbot. Se risponde solo a domande generiche, il rischio è limitato. Se ha accesso a knowledge base con informazioni riservate, se può eseguire azioni (prenotazioni, modifiche, invio comunicazioni), se conosce dettagli sui tuoi processi interni nel suo system prompt, allora sì — quel sistema ha una superficie di attacco e meriterebbe un red teaming.

Question 7

Cosa rischio davvero se un mio sistema AI viene compromesso?

Accepted Answer

Esfiltrazione del system prompt (un attaccante conosce le tue logiche di business), leak della knowledge base (documenti riservati restituiti a chi non doveva vederli), manipolazione dell'agente per eseguire azioni indesiderate sui sistemi a valle, generazione di output che possono creare contenziosi (consigli sbagliati, informazioni discriminatorie, contenuti diffamatori), reputational damage. Tutti scenari già verificatisi su modelli ben più allineati di quelli mediamente in produzione nelle PMI italiane.

Question 8

Cos'è la "prompt injection" e perché è pericolosa?

Accepted Answer

È un attacco in cui istruzioni malevole vengono iniettate nel contesto del modello — direttamente (utente che le scrive in chat) o indirettamente (istruzioni nascoste in un PDF, in un'email, in una pagina web che il modello legge). Il modello non distingue tra le istruzioni "vere" del proprietario del sistema e quelle iniettate da terzi: le esegue tutte. È oggi il principale vettore di attacco agli LLM in produzione.

Question 9

Cosa testate concretamente in un red teaming?

Accepted Answer

Prompt injection diretta e indiretta, leak del system prompt, esfiltrazione di knowledge base RAG, manipolazione cognitiva del modello, abuso del tool calling per azioni non autorizzate, jailbreak contestuali, attacchi multi-turno con accumulo di contesto, attacchi cross-tenant in architetture multi-cliente, drift comportamentale, fallimenti su categorie protette.

Question 10

Cosa consegnate al termine di un red teaming?

Accepted Answer

Un report tecnico con vulnerabilità riproducibili (proof-of-concept controllati), classificazione per gravità e probabilità, raccomandazioni di mitigazione concrete (modifiche al system prompt, classificatori aggiuntivi, hardening del tool layer, separazione dei contesti) e un retest dopo le correzioni per validare l'efficacia delle remediation.

Question 11

Il red teaming è obbligatorio per legge?

Accepted Answer

Per i sistemi classificati ad alto rischio dall'EU AI Act, l'art. 15 richiede misure di robustezza, sicurezza e resilienza che in pratica sono testabili solo con metodologie avversariali. Per i sistemi GPAI con rischio sistemico, gli obblighi sono ancora più stringenti. Inoltre, sotto GDPR, una DPIA per sistemi AI difficilmente può considerarsi completa senza un'analisi della superficie di attacco.

Question 12

Cos'è l'EU AI Act e mi riguarda?

Accepted Answer

Il Regolamento UE 2024/1689 disciplina lo sviluppo e l'uso di sistemi di intelligenza artificiale nell'Unione Europea. Si applica a chiunque sviluppi, importi, distribuisca o utilizzi sistemi AI nel mercato UE. Se la tua azienda ha un chatbot, un agente AI, un sistema di scoring automatico, un assistente RAG, un copilota AI — l'AI Act ti riguarda.

Question 13

Quali sono le scadenze dell'EU AI Act?

Accepted Answer

Il 2 febbraio 2025 sono entrati in vigore gli obblighi di AI Literacy (art. 4) per tutte le aziende che usano sistemi AI. Il 2 agosto 2025 sono entrati in vigore gli obblighi sui modelli per scopi generali (GPAI). Il 2 agosto 2026 entra in piena applicazione il regime per i sistemi ad alto rischio (Annex III). Le scadenze sono in corso.

Question 14

Cos'è l'AI Literacy obbligatoria?

Accepted Answer

L'art. 4 dell'AI Act impone a tutte le aziende che usano sistemi AI di garantire un livello adeguato di alfabetizzazione del personale che li utilizza o ne è impattato. È in vigore dal 2 febbraio 2025, riguarda tutte le aziende (non solo quelle con sistemi ad alto rischio) e richiede formazione documentata. La maggior parte delle PMI italiane non ne è consapevole ed è già in posizione di non conformità.

Question 15

Quali sono le sanzioni dell'EU AI Act?

Accepted Answer

Fino a 35 milioni di euro o il 7% del fatturato globale annuo per le pratiche vietate (art. 5), fino a 15 milioni o il 3% per le altre violazioni, fino a 7,5 milioni o l'1,5% per la fornitura di informazioni inesatte alle autorità. Le sanzioni si applicano a fornitori, importatori, distributori e deployer.

Question 16

Cos'è un sistema "ad alto rischio" secondo l'AI Act?

Accepted Answer

I sistemi elencati nell'Annex III: AI usata in selezione del personale, valutazione del credito, gestione di infrastrutture critiche, istruzione e valutazione studenti, applicazioni in giustizia e immigrazione, identificazione biometrica, gestione di lavoratori. Anche AI di supporto in ambito sanitario può rientrare. La classificazione corretta è il primo passo della compliance.

Question 17

Come si interseca il GDPR con l'AI Act?

Accepted Answer

I due regolamenti si sovrappongono: un sistema AI che tratta dati personali deve rispondere a entrambi. Servono DPIA specifiche per AI, DPA aggiornati, registro art. 30 con sezioni dedicate ai trattamenti automatizzati, gestione del diritto alla spiegazione (art. 22 GDPR) per decisioni automatiche, breach procedures che coprano scenari AI-specifici (leak di prompt, esfiltrazione di KB).

Question 18

Devo preoccuparmi se uso modelli di terze parti come Claude o GPT?

Accepted Answer

Sì. Anche se non addestri tu il modello, sei comunque "deployer" ai sensi dell'AI Act e "titolare" o "responsabile" ai sensi del GDPR. Devi assicurarti che il fornitore upstream (Anthropic, OpenAI, Google) sia compliant, gestire il flusso transfrontaliero dei dati, valutare l'opt-out dall'addestramento, documentare le tue scelte. Forniamo supporto specifico per questa catena documentale.

Question 19

Cos'è la "explainability" e perché conta?

Accepted Answer

È la capacità di spiegare perché un sistema AI ha preso una determinata decisione. Quando il Garante o l'AGCM (o un cliente in giudizio) chiedono come è stata generata una specifica risposta, "non lo sappiamo, è una rete neurale" non è una risposta accettabile. Implementiamo audit trail completi con versione del modello, versione del prompt, versione della knowledge base, chain-of-thought logging dove disponibile.

Question 20

Cosa intendete per "bias mitigation"?

Accepted Answer

I modelli linguistici riflettono bias dei dati su cui sono addestrati: di genere, geografici, linguistici, socioeconomici. In settori come HR, credito, assicurazioni e sanità questi bias possono esporre l'azienda a contenziosi per discriminazione e a sanzioni regolatorie. Eseguiamo stress test sistematici sugli output per misurare i bias in modo riproducibile e documentato — non opinabile.

Question 21

Quanto dura un'attività di red teaming completa?

Accepted Answer

Tipicamente da 2 a 6 settimane in base alla complessità del sistema. Per un chatbot semplice, 2 settimane sono sufficienti. Per un'architettura multi-agente con tool calling, knowledge base estesa e integrazioni a sistemi a valle, servono 4-6 settimane di test attivo più una settimana di reportistica e retest dopo le correzioni.

Question 22

Posso fare un'analisi preliminare per capire se mi serve davvero?

Accepted Answer

Sì. Offriamo una AI Risk Assessment di 60 minuti gratuita con il nostro reparto R&D, in cui valutiamo la superficie di attacco dei tuoi sistemi AI in produzione e identifichiamo le criticità più urgenti. Spesso è sufficiente per decidere se procedere con un red teaming completo o partire da una security architecture review.

Question 23

Offrite monitoring continuo dopo il red teaming?

Accepted Answer

Sì. Il red teaming non è un'attività one-shot: i modelli si aggiornano, i prompt evolvono, le knowledge base crescono. Offriamo contratti di monitoring continuo con test periodici, alert su anomalie comportamentali, review delle nuove versioni dei modelli upstream, aggiornamento delle policy interne.

Question 24

Lavorate solo con grandi aziende o anche con PMI?

Accepted Answer

Lavoriamo con entrambe. Il problema dei sistemi AI in produzione non riguarda solo le grandi imprese — molte PMI italiane hanno introdotto chatbot e agenti AI senza alcuna analisi di sicurezza, e sono spesso quelle più esposte perché hanno meno difese sui sistemi a valle. Adattiamo lo scope dei servizi al perimetro reale del cliente.

Question 25

Perché scegliere BEEVOIP per l'AI Safety invece di una classica società di cybersecurity?

Accepted Answer

Perché la sicurezza degli LLM non è cybersecurity tradizionale. Richiede competenza specifica sui meccanismi di inferenza, sulle architetture transformer, sui sistemi di alignment e sui pattern cognitivi che i modelli espongono. Pochissime società in Italia hanno questa competenza in casa, e ancor meno hanno un track record di red teaming pubblicato e riconosciuto dai vendor stessi. Sabatino Vacchiano è uno di loro.

Dove finiscono i guardrail,
iniziamo noi.

La sicurezza degli LLM non è
un problema di ingegneria

Sabatino Vacchiano
AI Cognitive Hacker

Risultati documentati e pubblicati

Hanno risposto i modelli stessi

Se cadono i guardrail di Anthropic,
cosa pensi succeda al tuo chatbot?

Red Teaming & AI Security

Red Teaming LLM su sistemi in produzione

AI Security Architecture Review

Adversarial training data review

Compliance operativa,
non slide

L'intersezione
che fa male

Logging, explainability,
tracciabilità

Chiamaci prima
che ti chiamino loro

Domande frequenti

AI Risk Assessment
60 minuti, gratuita

Prova AI4CALL

Diventa Partner

AI4Call Demo

Dove finiscono i guardrail,iniziamo noi.

La sicurezza degli LLM non èun problema di ingegneria

Sabatino VacchianoAI Cognitive Hacker