Da Macron che protesta a Trump arrestato: come potremo capire cos'è vero? Traverso: "Non sempre possibile. E' come se un poliziotto e un falsario lavorassero insieme"
La potenza dei sistemi di intelligenza artificiale in grado di generare immagini iper-realistiche è emersa chiaramente negli ultimi giorni, tra le immagini fake del Papa vestito come un trapper e quelle di Donald Trump arrestato dalle forze dell'ordine. Il Dolomiti ha contattato Paolo Traverso, direttore Strategia di marketing e sviluppo di Fbk, per capire se sia possibile distinguere le immagini generate da quelle reali: ecco come funzionano i nuovissimi sistemi presenti in rete

TRENTO. Negli ultimi mesi lo abbiamo visto chiaramente: non c'è limite alla varietà di immagini iper-realistiche che sistemi di intelligenza artificiale ormai alla portata di tutti sono in grado di creare. Un Macron impegnato a protestare contro la sua stessa riforma delle pensioni? Detto fatto. Un Papa agghindato con un piumino bianco da trapper? Niente di più facile. Un Donald Trump in carcere dopo l'arresto? Basta chiedere. Il problema, però, è che oggi a chiedere questo tipo di 'prodotti' sul web è il mondo intero e spesso il limite tra cosa sia vero e cosa falso si riduce al buonsenso di chi, navigando, s'imbatte in queste immagini. Ma la situazione è la stessa anche tra gli addetti ai lavori, tra chi ogni giorno si muove tra reti neurali ed Ia (intelligenze artificiali)? Esiste un modo per 'distinguere' le immagini reali da quelle generate? Fino a che punto si potrà sviluppare questa tecnologia? Per rispondere a queste domande il Dolomiti ha contattato Paolo Traverso, da anni attivo con la Fondazione Bruno Kessler proprio nella ricerca e nell'applicazione di sistemi di intelligenza artificiale.
“Innanzitutto – spiega l'esperto – va sottolineato che oggi non possiamo dire di essere in grado di riconoscere nel 100% dei casi se le immagini (ma parliamo anche di video o testi) che ci troviamo davanti siano reali o generate da un'intelligenza artificiale”. In pochissimo tempo in questo ambito la tecnologia ha fatto passi da gigante, dice Traverso, rendendo sempre più difficile l'identificazione delle immagini 'generate', che rappresentano un potenziale rischio non solo dal punto di vista della protezione del copyright, ma anche nell'ambito sociale. “Nelle prime tecnologie di questo tipo – continua il ricercatore – era possibile individuare i cosiddetti 'fingerprints', dei marcatori grazie ai quali verificare la veridicità o meno di immagini, video, testi. In passato questi marcatori erano rappresentati per esempio dalle difficoltà nel rappresentare scene in tre dimensioni, nella gestione delle ombre o addirittura in errori grossolani, come inserire due palloni da calcio nello stesso campo. Le tecniche odierne però sono molto più potenti”.
In particolare sono due le strade sulle quali si muovono le intelligenze artificiali per generare i 'prodotti' che vediamo sul web: “Le tecniche più 'vecchie' sono i cosiddetti Gan (Generative artificial network) e si basano su un'idea piuttosto semplice, che coinvolge due reti neurali che si 'addestrano tra di loro'. Se prendiamo come esempio la generazione del volto di una persona non esistente, una delle due intelligenze si allena in un primo momento a distinguere le immagini vere da quelle false, che sono prodotte dalla seconda Ia. Una volta che la prima intelligenza ha 'imparato' a riconoscere le immagini generate da quelle reali, la seconda inizia a produrre volti non esistenti cercando di abbassare sempre di più il grado di errore, fino a 'sfuggire' al controllo della prima. Facendo un paragone, è come se un poliziotto ed un falsario lavorassero insieme: l'obiettivo finale è che il falsario riesca a produrre un'opera che il poliziotto non riesce ad individuare come falsa”. Lo stesso processo si può applicare ai video ma, visto che si tratta come detto di una tecnologia che esiste da tempo, sono state sviluppate tecniche che, applicando lo stesso concetto alla rovescia, sono spesso in grado di capire quando un'immagine è frutto del lavoro di un'Ia.
Diverso invece il discorso per le tecniche più innovative, quelle basate sul modello di apprendimento automatico Stable Diffusion: “In questo caso – dice Traverso – vengono combinate una serie di immagini raccolte sulla rete (inserendo, in termini tecnici, del 'rumore') finché la rete neurale non è in grado di generare scene fittizie sulla base della richiesta degli utenti. Se vogliamo per esempio ottenere l'immagine di un astronauta che cavalca un cavallo, il sistema non farà altro che sondare il web e poi progressivamente unire quanto raccolto per generare il prodotto finale. Sono tecniche molto potenti grazie alle quali realtà come Stability Ia sta guadagnando milioni”. In questo caso, però, identificare le immagini 'fake' è molto più complicato. “Esistono – dice infatti l'esperto – delle tecniche di 'de-noising', per eliminare in sostanza strati su strati di immagini e capire da dove la scena che abbiamo di fronte derivi. Ma non possiamo certo dire che siamo in grado di riconoscerlo in tutti i casi e non è detto che si arrivi ad avere risultati paragonabili a quelli ottenuti con le tecniche Gan”.
É come vedere due bolidi inseguirsi: la velocità alla quale si muovono questi sistemi (in entrambi i casi) è impressionante. Proprio per questo nella giornata di ieri alcuni tra i personaggi più in vista in questo campo, tra i quali Elon Musk, hanno sottoscritto una lettera aperta per chiedere una pausa allo sviluppo di nuovi sistemi di intelligenza artificiale che superino Gpt-4 (Generative pre-trained transformer), il sistema sul quale si basa per esempio l'ormai famosa ChatGpt (che si ferma però attualmente all'utilizzo della versione 3,5). Il motivo della richiesta di moratoria? Arrivare ad ottenere la certezza che gli effetti dei sistemi saranno effettivamente positivi ed i rischi che presentano gestibili. Una proposta che, però, che non trova il favore di Traverso.
“Con Chat Gpt per esempio – dice – spesso sembra veramente di rapportarsi con una persona vera: stiamo parlando, lo ripeto, di tecnologie estremamente potenti, in grado di portare avanti trasformazioni con qualcosa come migliaia di miliardi di parametri. Allo stesso tempo però non si tratta di tecniche completamente affidabili: la stessa Chat Gpt è per esempio in grado di dire, con la stessa confidenza, cose vere e cose false. I rischi ci sono, è inutile negarlo, ma come ci sono in tutte le tecnologie potenti introdotte: piuttosto che fermarne lo sviluppo, secondo me bisognerebbe semmai realizzarle (ed imparare ad utilizzarle) in un modo positivo. Non credo per esempio che sia giusto proibirne l'utilizzo nelle scuole, con un utilizzo consapevole anche gli studenti possono ottenere grandi benefici. Certamente poi le problematiche non solo di carattere tecnologico ma anche sociale, etico, giuridico: per questo c'è bisogno di lavorare assieme e con attenzione nella direzione giusta. Personalmente però, non credo nella necessità di porre un limite”.












