Viviamo in un’epoca in cui la fascinazione per l’automazione cognitiva si scontra brutalmente con la realtà della qualità del dato, un paradosso che nel mondo giuridico rischia di trasformarsi da semplice inconveniente tecnico a vero e proprio vulnus democratico.
Nel mio osservatorio settimanale, dove analizziamo l’impatto delle nuove tecnologie sulla professione forense, è giunto il momento di affrontare senza mezzi termini il principio informatico più antico e, paradossalmente, più attuale: Garbage In, Garbage Out.
Se immettiamo spazzatura nel sistema, ne otterremo spazzatura in uscita, indipendentemente dalla raffinatezza dell’algoritmo che la elabora.
Tuttavia, quando questa “spazzatura” viene processata dai moderni Large Language Models (LLM), non assume l’aspetto di un errore evidente o di un glitch grafico, ma si veste di autorevolezza, logica sintattica e persuasività, dando vita al fenomeno insidioso delle allucinazioni artificiali.
Per l’avvocato, il magistrato o il funzionario della pubblica amministrazione, comprendere questo meccanismo non è più un optional da appassionati di tecnologia, ma un dovere deontologico.
Per addentrarci in questa disamina, dobbiamo partire dalla natura stessa dello strumento che abbiamo tra le mani.
Come emerge chiaramente dagli studi tecnici più recenti, i sistemi di intelligenza artificiale generativa sono, nella loro essenza, dei “pappagalli stocastici”.
Si tratta di sistemi in cui il linguaggio è strutturalmente dissociato dal pensiero: sono capaci di produrre testi sintatticamente ineccepibili ma sono intrinsecamente incapaci di pensare o di comprendere il significato in senso proprio, inteso come relazione tra la forma linguistica e la realtà esterna.
I generatori di linguaggio non contengono alcun riferimento al vero o al falso, né possiedono criteri per distinguerli.
Questo è il terreno fertile in cui nasce l’allucinazione: una risposta esaustiva, chiara, logicamente conseguente, ma completamente infondata o inventata.
Nel contesto legale, dove la verità processuale e l’accuratezza del precedente giurisprudenziale sono le fondamenta del diritto, affidarsi a un sistema che opera su calcoli probabilistici e non su basi di verità fattuale rappresenta un rischio calcolato che sta rapidamente diventando un azzardo sistemico.
Il problema si acuisce quando osserviamo la fonte primaria di queste elaborazioni: i dati.
Una recente ricognizione dell’AgID sui progetti di intelligenza artificiale nella Pubblica Amministrazione centrale ha messo in luce come la qualità e la disponibilità dei dati rappresentino le principali criticità riscontrate.
In molti progetti, l’addestramento dei modelli avviene su banche dati interne, spesso non strutturate, integrate talvolta con open data esterni. Se la base informativa è incompleta, obsoleta o “sporca”, il principio del Garbage In, Garbage Out si attiva inesorabilmente.
L’indagine ha rivelato che nel 30% dei casi i progetti non hanno nemmeno una data di chiusura prevista, sintomo di un’incertezza che mina la scalabilità e l’affidabilità.
Se trasferiamo questo scenario nello studio legale o nelle aule di tribunale, le conseguenze sono tangibili: citazioni di sentenze inesistenti, interpretazioni normative basate su testi abrogati, o ricostruzioni fattuali plausibili ma false.
Non si tratta di errori di calcolo, ma di una deriva cognitiva della macchina che, in assenza di un controllo rigoroso, “riempie i vuoti” con invenzioni statisticamente probabili.
Da un punto di vista strettamente giuridico, la questione delle allucinazioni e della qualità del dato solleva interrogativi che le attuali normative faticano a risolvere.
Il Regolamento sui servizi digitali (Digital Services Act – DSA), pur rappresentando un passo avanti rispetto alla vecchia direttiva sul commercio elettronico, non è stato concepito avendo in mente l’intelligenza artificiale generativa.
Sebbene vi siano tesi dottrinali che tentano di ricondurre i chatbot alla categoria dei motori di ricerca online per applicare le relative tutele e responsabilità, la realtà è che ci muoviamo in una zona grigia.
Un sistema che genera contenuti falsi o diffamatori “allucinando” fatti su una persona non rientra facilmente nelle categorie di responsabilità editoriale classica, né in quelle di mero hosting passivo. Qui emerge il problema della “black box”: l’opacità dei modelli rende difficile, se non impossibile, tracciare il percorso logico che ha portato a un determinato output errato, complicando enormemente le attività di audit e la attribuzione di responsabilità.
La questione si intreccia inevitabilmente con la tutela dei dati personali e il GDPR. Il principio di esattezza dei dati è un pilastro della normativa sulla privacy, ma come si concilia con un’architettura tecnologica che, per sua natura, tende a “creare” informazioni piuttosto che a recuperarle fedelmente? Le allucinazioni possono generare dati personali inesatti o attribuire condotte false a individui reali, con impatti devastanti sulla reputazione.
È qui che il concetto di “qualità del dato” diventa un imperativo legale prima ancora che tecnico. Senza una garanzia sulla purezza dell’input e sui processi di addestramento, l’output non può essere conforme ai principi di liceità e correttezza richiesti dal nostro ordinamento.
Non è un caso che il Garante Privacy italiano abbia acceso i riflettori proprio sulla base giuridica che giustifica la raccolta massiccia di dati per l’addestramento degli algoritmi, evidenziando come la mancanza di controllo sulla fonte porti a una perdita di controllo sul risultato.
Tuttavia, non dobbiamo cadere nell’errore di demonizzare lo strumento o di rifugiarci in un neoluddismo sterile.
La soluzione non sta nel rifiuto, ma in quella che potremmo definire una “terza via” che supera il dualismo uomo-macchina.
Dobbiamo iniziare a considerare l’intelligenza artificiale non come un oracolo sostitutivo, ma come parte di un “Sistema 0” che si affianca al Sistema 1 (intuizione) e al Sistema 2 (ragionamento) teorizzati dallo psicologo Daniel Kahneman.
In questa visione, l’AI espande le potenzialità umane fornendo capacità di calcolo e sintesi in tempo reale, ma deve rimanere subordinata alla verifica e al giudizio critico del professionista.
Si delinea così la figura di un professionista legale “aumentato”, o meglio, parte di un sistema duale in cui l’uomo e l’AI “danzano” insieme: la macchina propone, l’uomo dispone e, soprattutto, verifica.
Un ulteriore livello di sicurezza potrebbe arrivare dai cosiddetti “Guardian Agents”, agenti intelligenti progettati specificamente per sorvegliare altri sistemi di AI.
Questi guardiani digitali operano come un sistema di controllo qualità automatizzato, monitorando l’output per rilevare comportamenti imprevisti, violazioni di policy o, appunto, allucinazioni, bloccandole prima che raggiungano l’utente finale.
Si tratta di un’evoluzione del concetto di human-in-the-loop, che delega parte del controllo a un’altra intelligenza artificiale per gestire la velocità e la mole di dati che l’essere umano non potrebbe processare, pur mantenendo la supervisione strategica nelle mani delle persone.
È un approccio che promette di rendere i sistemi più robusti, trasparenti e conformi alle normative, specialmente in settori critici come quello legale e della pubblica amministrazione.
Ma la tecnologia, per quanto avanzata, non può prescindere dal fattore umano e dalla competenza. L’illusione che l’AI possa sostituire il ragionamento giuridico è pericolosa quanto l’uso di un’auto a guida autonoma senza conoscere il codice della strada.
È fondamentale sviluppare una vera e propria AI Literacy, un’alfabetizzazione all’intelligenza artificiale che vada oltre la semplice capacità di scrivere un prompt.
Per il giurista, questo significa comprendere i limiti epistemologici della macchina: sapere che un LLM è un predittore di parole e non un motore di verità, riconoscere i bias insiti nei dati di addestramento e mantenere sempre un atteggiamento di scetticismo informato.
L’approccio “garbage in, garbage out” ci ricorda che la qualità della risposta dipende non solo dalla qualità dei dati, ma anche dalla qualità della domanda e dalla competenza di chi interroga il sistema. Un utente esperto sa che l’AI va usata per compiti di supporto – come il brainstorming, la sintesi, la traduzione o la revisione stilistica – e mai come fonte autoritativa primaria senza verifica.
Inoltre, il panorama normativo sta cercando di rincorrere questa evoluzione. L’AI Act europeo e il disegno di legge italiano sull’intelligenza artificiale pongono l’accento sulla trasparenza, sulla qualità dei dati e sulla responsabilità umana.
Si delineano obblighi specifici per i fornitori di modelli, specialmente quelli ad alto rischio, che dovranno garantire governance dei dati, documentazione tecnica e sorveglianza umana.
Tuttavia, la rapidità con cui la tecnologia evolve – si pensi ai salti quantici tra una versione e l’altra dei modelli GPT o all’emergere di nuovi player globali – rende ogni norma quasi obsoleta nel momento stesso in cui viene pubblicata.
Questo impone al giurista uno sforzo di adattamento continuo, spostando l’attenzione dalla mera applicazione della regola alla comprensione dei principi fondamentali che devono governare l’interazione tra uomo e macchina: equità, trasparenza, imputabilità.
Dobbiamo anche considerare l’aspetto geopolitico e di mercato.
La maggior parte dei modelli che utilizziamo sono addestrati su dati e infrastrutture che non risiedono in Europa, creando una dipendenza tecnologica che ha riflessi sulla sovranità dei dati e sulla giurisdizione.
Progetti come “Modello Italia”, che mirano a sviluppare LLM addestrati su dati italiani di qualità e conformi alle nostre normative, rappresentano tentativi importanti di riprendere il controllo sulla filiera del dato, riducendo il rischio di importare bias culturali o legali estranei al nostro ordinamento. Utilizzare dataset con licenza aperta e certificata, evitando la “scatola nera” dei giganti tech d’oltreoceano, potrebbe essere la chiave per un’AI legale più sicura e affidabile.
L’allucinazione dell’intelligenza artificiale non è un difetto che verrà corretto con il prossimo aggiornamento software, ma una caratteristica intrinseca del modo in cui questi modelli apprendono e generano contenuti.
Nel mondo legale, dove la parola è atto e il dato è prova, non possiamo permetterci di accogliere acriticamente l’output della macchina.
Il principio Garbage In, Garbage Out deve diventare il mantra di ogni professionista che si approccia a queste tecnologie.
Dobbiamo essere i guardiani della qualità dei dati che immettiamo e i revisori implacabili dei risultati che otteniamo.
Il futuro della professione non sta nella competizione con l’algoritmo, ma nella capacità di governarlo, utilizzandolo per potenziare le nostre capacità cognitive senza mai abdicare al nostro ruolo di garanti della verità fattuale e giuridica.
Solo attraverso una profonda consapevolezza tecnica, unita a una solida etica professionale, potremo trasformare l’intelligenza artificiale da potenziale generatore di caos informativo a potente alleato per una giustizia più efficiente e accessibile.
La sfida non è tecnologica, è culturale e deontologica: sta a noi decidere se essere vittime delle allucinazioni o architetti di una nuova realtà professionale aumentata.
𝘼 𝙘𝙪𝙧𝙖 𝙙𝙚𝙡𝙡’𝘼𝙫𝙫. 𝘼𝙡𝙛𝙤𝙣𝙨𝙤 𝙎𝙘𝙖𝙛𝙪𝙧𝙤
𝑅𝑒𝑠𝑝𝑜𝑛𝑠𝑎𝑏𝑖𝑙𝑒 𝐴𝑟𝑒𝑎 𝐼𝑛𝑛𝑜𝑣𝑎𝑧𝑖𝑜𝑛𝑒, 𝐷𝑖𝑔𝑖𝑡𝑎𝑙𝑖𝑧𝑧𝑎𝑧𝑖𝑜𝑛𝑒 𝑒 𝐼𝑛𝑡𝑒𝑙𝑙𝑖𝑔𝑒𝑛𝑧𝑎 𝐴𝑟𝑡𝑖𝑓𝑖𝑐𝑖𝑎𝑙𝑒 𝑑𝑖 𝐹𝑖𝑠𝑎𝑝𝑖





