
Durante l'estate, vi invitiamo a trovare gli articoli distribuiti quest'anno sul sito. Oggi un articolo originariamente pubblicato il 16/01/2023.
La rilascio di ChatGPT il 30 novembre ha segnato una nuova fase nello sviluppo delle tecnologie di elaborazione del linguaggio. È comunque la prima volta che un sistema di IA, direttamente frutto della ricerca, suscita tanto entusiasmo: numerosi articoli sono apparsi sulla stampa specializzata ma anche generalista. ChatGPT (o OpenAI, la società che sviluppa ChatGPT, o entrambi) sono costantemente di tendenza su Twitter anche oggi.
Perché un tale eco? Le capacità di ChatGPT sono un allontanamento dalle tecnologie precedenti in grado di generare testo?
ChatGPT può chattare
Chiaro che ChatGPT ha permesso un salto di qualità: è in grado di rispondere, in modo spesso rilevante, a quasi tutte le richieste in linguaggio naturale. GPT2, poi GPT3 – i precedenti modelli linguistici sviluppati da OpenAI – erano già molto bravi a generare testo da poche parole o frasi date come prompt (quello che viene chiamato “prompt”): si parlava spesso di “pappagalli” (pappagalli stocastici), come proposto Emilia Bender, e molti altri ricercatori critica di queste tecniche. Anzi, si potrebbe dire che questi sistemi producessero testo da frammenti di frasi tratti dagli immensi corpora a loro disposizione... anche se questa immagine del pappagallo va qualificata: i sistemi non ripetono estratti parola per parola, ma producono in generale un testo originale riprendendo, parafrasando, combinando elementi visti in vari corpora.
ChatGPT riprende queste caratteristiche, ma la parte "chat" (dialogo) aggiunge una dimensione completamente diversa e spesso apparentemente sbalorditiva.
Il sistema non produce più solo un paragrafo da una frase data come input. Ora è in grado di rispondere correttamente sia a domande semplici che complesse, può fornire elementi di ragionamento, parlare lingue diverse, analizzare o produrre codice per computer, tra le altre cose.
Ad esempio, se viene chiesto se due personaggi hanno potuto incontrarsi, il sistema è in grado di determinare le date corrispondenti alla loro esistenza, confrontare queste date e dedurre una risposta. Questo è banale per un essere umano, ma nessun sistema fino ad ora potrebbe rispondere a questo tipo di domande in modo così preciso senza essere altamente specializzato. Oltre alla lingua, ChatGPT può anche fornire elementi di ragionamento matematico (ma spesso sbaglia) e analizzare il codice del computer in particolare.
Da questo punto di vista, ChatGPT è un passo avanti rispetto ai suoi concorrenti.
ChatGPT, un sistema chiuso
Per quanto riguarda il funzionamento del sistema, difficile dire di più, perché OpenAI, nonostante il nome, sviluppa sistemi chiusi. Vale a dire, il codice informatico (codice sorgente) utilizzato non è disponibile e la ricerca relativa a ChatGPT rimane per il momento in gran parte un segreto commerciale – anche se, ovviamente, dialtre squadre stanno lavorando sistemi simili, anch'essi basati sul deep learning. Quindi abbiamo un'idea di cosa viene utilizzato da OpenAI.
Altre aziende hanno mantenuto un modello più aperto, ad esempio Meta con il lavoro svolto a FAIR, solitamente aperti e pubblicati nei principali convegni del settore. Ma, più in generale, assistiamo sempre più a una chiusura della ricerca. Ad esempio, mentre Apple ha sempre avuto un modello di sviluppo privato e molto segreto, Deepmind aveva un modello aperto e probabilmente lo è un po' meno, ora che la società è sotto il controllo di Google.
Il sistema ChatGPT stesso potrebbe diventare commerciale: OpenAI è finanziato da Microsoft che potrebbe decidere di chiudere presto l'accesso al sistema, se è nel suo interesse.
Testando ChatGPT, contribuisci (gratuitamente) a migliorarlo
Nel frattempo, OpenAI beneficia dell'enorme pubblicità che il suo strumento gli porta, e anche di tutte le interazioni degli utenti con esso. Se un utente segnala che una risposta non è buona, o chiede allo strumento di riformulare la sua risposta tenendo conto di un elemento aggiuntivo, si tratta di tante informazioni che il sistema memorizza e può riutilizzare per perfezionare la sua risposta la volta successiva, su richiesta richiesta o su una richiesta simile. Testando ChatGPT, lavoriamo gratuitamente per OpenAI !
Tornando al sistema in sé, la parte dialogica è quindi ciò che fa la forza e la particolarità di ChatGPT (rispetto ad esempio a GPT3). Non è più un "semplice" modello di linguaggio capace di generare testi "a chilometri", ma un vero e proprio sistema di dialogo. Questo ha probabilmente beneficiato di milioni o miliardi di esempi valutato dagli esseri umani, e la fase attuale – in cui centinaia di migliaia di utenti “giocano” quasi gratis con il sistema – consente ancora di migliorarlo continuamente, visto che tutte le interazioni vengono ovviamente registrate e utilizzate per questo.
È ormai abbastanza semplice accedere a corpora di miliardi di parole per sviluppare un modello linguistico di tipo “GPT”, almeno per i linguaggi diffusi su Internet.
Ma i dati che hanno permesso lo sviluppo di ChatGPT (dialoghi, interazioni con gli umani) non sono pubblici, ed è questo che conferisce a OpenAI un vantaggio significativo rispetto alla concorrenza.
Ad esempio, Google ha dati diversi, ma senza dubbio utilizzabili anche per questo tipo di sistema - tanto più che Google ha sviluppato per diversi anni un grafico della conoscenza che potrebbe generare risposte con una migliore affidabilità rispetto a ChatGPT. In particolare, l'analisi delle sequenze di query dal motore di ricerca di Google potrebbe fornire informazioni preziose per guidare l'interazione con l'utente... Ma, intanto, è OpenAI ad avere ChatGPT, e non Google: OpenAi ha il vantaggio.
Oltre ChatGPT, quali applicazioni in futuro?
Infatti, anche se è possibile bypassare i limiti di ChatGPT, il sistema si rifiuta di spiegare come creare una bomba, produrre racconti erotici o dare i suoi sentimenti (ChatGPT risponde spesso che lei è una macchina, chenon ha sentimenti o personalità). OpenAI ha ovviamente curato la sua comunicazione. L'azienda ha inoltre posto estrema cura nel "blindare" il sistema, per consentirgli di sventare gran parte delle insidie che possono rovinare questo tipo di applicazioni in poche ore, come spesso accade per i sistemi aperti al grande pubblico.
Possiamo, ad esempio, citare Meta, che lo scorso novembre ha dovuto ritirare il suo sistema chiamato “Galactica” due giorni dopo averlo messo online. Galactica era stata addestrata in campo scientifico e progettata per offrire servizi ai ricercatori. È stato presentato per la prima volta come in grado di scrivere articoli scientifici automaticamente da un prompt…prima che la società chiarisse che si trattava ovviamente solo di un aiuto editoriale. Ma questa sfortunata strategia di comunicazione ha scatenato una polemica che ha costretto Meta a staccare velocemente Galactica.
Al contrario, ChatGPT è ancora online, e suscita ancora altrettanta passione tra un vasto pubblico. Le domande rimangono, tuttavia: quale impatto avrà ChatGPT? Quali applicazioni ne deriveranno? E a quale modello economico punta l'azienda OpenAI (e Microsoft, suo principale investitore)?
Thierry poibeau, DR CNRS, École normale superiore (ENS) - PSL
Questo articolo è ripubblicato da The Conversation sotto licenza Creative Commons. Leggi ilarticolo originale.