Intelligenza artificiale
Arriva OpenAI o1, il nuovo modello di IA pensante
OpenAI o1 è in grado di ragionare su matematica e scienza, testare diverse strategie e identificare errori mentre affronta compiti complessi. Ma è lento e costoso
di Stefano Silvestri 13 Settembre 2024 08:27
facebbok twitter x linkedin whatsapp telegram e-mail
I chatbot come ChatGPT di OpenAI e Gemini di Google a volte hanno difficoltà con semplici problemi matematici. Il codice che generano spesso presenta errori o è incompleto. Di tanto in tanto, inventano anche le risposte. Ieri sera, però OpenAI ha presentato una nuova versione di ChatGPT che potrebbe risolvere questi difetti. L'azienda di Sam Altman ha infatti dichiarato che il suo chatbot, basato sulla nuova tecnologia di intelligenza artificiale chiamata OpenAI o1, è in grado di "ragionare" su compiti che riguardano la matematica, la programmazione e le scienze.
SI PRENDE IL SUO TEMPO
"Con i modelli precedenti come ChatGPT, fai una domanda e loro rispondono immediatamente", dichiara Jakub Pachocki, capo scienziato di OpenAI. "Questo modello invece si prende il suo tempo. Può riflettere sul problema, in inglese, cercando di scomporlo e di considerare diversi approcci per fornire la risposta migliore".
Durante una dimostrazione, il dottor Pachocki e Szymon Sidor, un esperto tecnico di OpenAI, hanno mostrato il chatbot mentre risolveva un acrostico, un tipo di puzzle più complesso di un normale cruciverba. Il chatbot ha anche risposto a una domanda di chimica a livello di dottorato e diagnosticato una malattia basandosi su un rapporto dettagliato sui sintomi e sulla storia clinica di un paziente.
NUOVA TECNOLOGIA
La nuova tecnologia fa parte di un più ampio sforzo volto a sviluppare un'intelligenza artificiale in grado di ragionare su compiti complessi e di risolvere problemi in modo accurato e logico, attraverso una serie di passaggi discreti, ciascuno dei quali si basa sul precedente. In modo simile a come ragioniamo noi umani, insomma.
Queste tecnologie potrebbero rivelarsi particolarmente utili per i programmatori che utilizzano sistemi di intelligenza artificiale per scrivere codice. E anche aiutare i fisici a generare formule matematiche complesse e a supportare i ricercatori nel campo della sanità nei loro esperimenti.
RICEVI GRATIS LE NOTIZIE IN ANTEPRIMA
APPRENDIMENTO PER RINFORZO
Con il debutto di ChatGPT a fine 2022, OpenAI ha dimostrato che le macchine potevano gestire richieste in modo più simile agli esseri umani, rispondere a domande, scrivere tesine e persino generare codice informatico. Le risposte, però, erano talvolta imprecise.
ChatGPT ha imparato le sue capacità analizzando enormi quantità di testo prelevato da Internet, inclusi articoli di Wikipedia, libri e registri di chat. Identificando modelli in tutto quel testo, ha imparato a generarne altro in autonomia.
Il dottor Pachocki, il signor Sidor e i loro colleghi hanno costruito il nuovo sistema di OpenAI utilizzando un processo chiamato apprendimento per rinforzo. Attraverso questo processo, che può durare settimane o mesi, un sistema può imparare comportamenti attraverso tentativi ed errori.
Ad esempio, affrontando vari problemi matematici, può imparare quali metodi portano alla risposta giusta e quali no. Se ripete questo processo su un numero enormemente elevato di problemi, può identificare degli schemi.
MA NON È PERFETTO
Nessuno però s’illuda: il sistema non è necessariamente in grado di ragionare come un essere umano. E può ancora commettere errori o fornire allucinazioni. “Non sarà perfetto," ha detto il dott. Sidor. "Ma si può contare sul fatto che lavorerà più duramente ed è molto più probabile che produca la risposta corretta".
OpenAI dichiara che o1 ha ottenuto risultati migliori rispetto alle versioni precedenti in alcuni test standardizzati, esami progettati per valutare le capacità, le conoscenze o le competenze di individui o sistemi in modo uniforme e oggettivo.
Nell'esame di qualificazione per le Olimpiadi Internazionali di Matematica, la principale competizione matematica per studenti delle scuole superiori americane, il modello precedente ha ottenuto il 13%. OpenAI o1 avrebbe invece ottenuto l'83%.
OpenAI ha inoltre affermato che o1 ha raggiunto l'89° percentile dei partecipanti nel round di sfide di programmazione online Codeforces, superando il sistema AlphaCode 2 di DeepMind.
I PROBLEMI
L'accesso alla nuova tecnologia sarà possibile inizialmente per i privati e le aziende abbonati ai servizi ChatGPT Plus e ChatGPT Teams. OpenAI sta inoltre fornendo la tecnologia a sviluppatori di software e aziende, che stanno costruendo le proprie applicazioni di intelligenza artificiale.
Tuttavia, OpenAI o1 è piuttosto costoso. Nell'API di ChatGPT, o1-preview costa 15 dollari per 1 milione di token in ingresso e 60 dollari per 1 milione di token in uscita, un prezzo triplo rispetto a GPT-4o per i token in ingresso e quadruplo per quelli in uscita. I token, lo ricordiamo, sono frammenti di dati grezzi; 1 milione corrisponde a circa 750.000 parole.
Alla luce di quanto scritto, OpenAI o1 rappresenta un significativo passo avanti nel campo dell'intelligenza artificiale, migliorando nettamente le capacità di ragionamento rispetto a GPT-4o e dimostrandosi particolarmente adatto per compiti complessi come la programmazione, l'analisi dati e la risoluzione di problemi scientifici.
Ma è un modello costoso per gli sviluppatori e lento per gli utenti generici, che non vogliono certo attendere tra i 10 e i 20 secondi per avere una risposta. Fattori, questi, che paiono posizionarlo maggiormente come uno strumento per professionisti e aziende.
facebbok twitter x linkedin whatsapp telegram e-mail
COMMENTO:
in realtà lo sviluppo di codice standard può sostituire migliaia di programmatori “normali”.
Cito adesso il caso del NOSTRO prodotto software CRIPTEOS 3001, sviluppato in Java. Avevamo iniziato a scriverlo utilizzando i metodi (che una volta si chiamavano Routines) disponibili in libreria. Peccato che fosse molto lento. Abbiamo buttato via tutto. Siamo andati a riprendere il codice di funzioni matematiche, come il minimo comune multiplo o la media, cercando anche su siti che proponevano soluzioni SBAGLIATE. Il lavoro è stato duro. Abbiamo praticamente riscritto tutto nel linguaggio C. Ora è velocissimo. Come si fa a capire che una soluzione è SBAGLIATA ? la si prova.
Magari bastava cambiare UN PARAMETRO. O scegliere UN OGGETTO invece di un altro. Come se un muratore sceglie il martello invece della cazzuola. Certe cose sono PREMASTICATE. Per rifilare al cliente un prodotto che poi viene manutenuto con importanti CONTRATTI va bene. Ma non va sempre bene. Un OGGETTO diventa OBSOLETO e viene raccomandato di eliminarlo, anche perché il SOFTWARE non funziona più. Riesce la Intelligenza artificiale a capire che per fare un buco nel muro ci vuole MARTELLO e SCALPELLO e per stendere il cemento ci vuole la CAZZUOLA?
( non è una parolaccia, si chiama così). Adesso siamo pieni di BUG nei software più noti sviluppati con la idea che GLI ERRORI sono il pane quotidiano che garantisce per anni di lavorare. Forse adesso hanno capito che GLI ERRORI sono VULNERABILITA’ agli attacchi HACHER. Già, la colpa è di chi ha computer vecchi…. Se la Intelligenza artificiale CREA software senza errori sono contento. Ma quanto COSTA ?