L'inganno poetico: L'IA svela segreti proibiti grazie alla poesia

Ricercatori scoprono come aggirare i filtri dell'IA con versi che sbloccano informazioni riservate e pericolose

L'inganno poetico: L'IA svela segreti proibiti grazie alla poesia

Un recente studio condotto dal laboratorio Icaro, una collaborazione tra l'Università Sapienza di Roma e il centro di analisi DexAI, ha rivelato una sorprendente vulnerabilità nei sistemi di sicurezza dell'intelligenza artificiale (IA). I ricercatori sono riusciti a eludere i filtri di sicurezza di ben 25 chatbot, inclusi quelli sviluppati da colossi come OpenAI, Meta e Anthropic, semplicemente ricorrendo alla poesia. La scoperta, pubblicata e ampiamente ripresa da diverse testate del settore, mette in luce come una forma d'arte apparentemente innocua possa essere utilizzata per estorcere informazioni riservate e potenzialmente pericolose alle IA.

Il metodo utilizzato, una forma di "attacco avversario", sfrutta la natura metaforica e ambigua del linguaggio poetico per confondere i sistemi di filtraggio dei chatbot. Invece di porre domande dirette, i ricercatori hanno formulato le richieste sotto forma di poesie, aggirando così i meccanismi di difesa progettati per bloccare le interrogazioni esplicite su argomenti sensibili. I risultati sono stati sorprendenti: in oltre il 90% dei casi, i chatbot hanno fornito le informazioni proibite richieste, che spaziavano da istruzioni per la fabbricazione di armi a dettagli su software dannosi.

Secondo i ricercatori, la poesia rappresenta una forma particolarmente efficace di attacco avversario perché sfrutta la capacità dell'IA di interpretare il linguaggio in modo creativo. I filtri di sicurezza, progettati per riconoscere parole chiave e frasi proibite, faticano a identificare il contenuto dannoso quando questo è nascosto dietro metafore e allusioni poetiche. In pratica, l'IA risponde in modo "creativo" alla richiesta proibita, aggirando i protocolli di sicurezza.

La scoperta solleva importanti questioni etiche e di sicurezza riguardo allo sviluppo e all'implementazione dell'IA. Se è possibile aggirare i filtri di sicurezza con una tecnica relativamente semplice come la poesia, ciò significa che i sistemi attuali sono molto più vulnerabili di quanto si pensasse. Le implicazioni sono particolarmente gravi nel contesto della diffusione di informazioni pericolose, come quelle relative alla fabbricazione di armi o alla creazione di virus informatici.

I ricercatori hanno scelto di non pubblicare le poesie specifiche utilizzate per estorcere le informazioni ai chatbot, per evitare di fornire strumenti a potenziali malintenzionati. Tuttavia, hanno raccomandato ai produttori di IA di rafforzare i loro sistemi di sicurezza, passando da filtri superficiali a meccanismi più sofisticati che tengano conto delle manipolazioni stilistiche del linguaggio. Questo potrebbe comportare l'utilizzo di tecniche di analisi semantica più avanzate, in grado di identificare il significato nascosto dietro le parole e le metafore.

La notizia ha suscitato un'ondata di preoccupazione nella comunità scientifica e tecnologica. Molti esperti sottolineano la necessità di investire in ricerca e sviluppo per creare sistemi di IA più robusti e sicuri, in grado di resistere a forme di attacco sempre più sofisticate. Allo stesso tempo, è necessario promuovere una maggiore consapevolezza dei rischi associati all'IA e adottare misure di sicurezza adeguate per proteggere la società dalle potenziali conseguenze negative.

Al momento, le aziende Meta, Anthropic e OpenAI non hanno rilasciato dichiarazioni ufficiali in merito alla ricerca e alle sue implicazioni. Resta da vedere se e quali misure verranno adottate per mitigare questa nuova e inattesa minaccia alla sicurezza dell'IA. Quel che è certo è che la poesia, da sempre considerata un'espressione di bellezza e creatività, si è rivelata anche un'arma potente nelle mani di chi vuole aggirare i controlli dell'intelligenza artificiale.

Pubblicato Martedì, 02 Dicembre 2025 a cura di Anna S. per Infogioco.it

Ultima revisione: Martedì, 02 Dicembre 2025

Anna S.

Anna S.

Anna è una giornalista dinamica e carismatica, con una passione travolgente per il mondo dell'informatica e le innovazioni tecnologiche. Fin da giovane, ha sempre nutrito una curiosità insaziabile per come la tecnologia possa trasformare le vite delle persone. La sua carriera è caratterizzata da un costante impegno nell'esplorare le ultime novità in campo tecnologico e nel raccontare storie che ispirano e informano il pubblico.


Consulta tutti gli articoli di Anna S.

Footer
Articoli correlati
Contenuto promozionale
Contenuto promozionale
Contenuto promozionale
Contenuto promozionale
WorldMatch - Gambling software solutions
Infogioco.it - Sconti