Il modello di Google DeepMind risolve 25 problemi su 30, superando le performance delle medaglie d’argento e bronzo dal 2000 al 2015.

AlphaGeometry, il nuovo modello sviluppato da Google DeepMind, ha affrontato una delle prove più impegnative del panorama matematico internazionale: le Olimpiadi Internazionali della Matematica. Il confronto ha riguardato le edizioni svolte tra il 2000 e il 2015, in particolare su 30 problemi di geometria. Il risultato? L’IA ha centrato 25 soluzioni corrette nel tempo previsto, avvicinandosi alla media di 25,9 dei vincitori della medaglia d’oro. Non solo: ha superato nettamente le performance di chi ha conquistato l’argento (22,9) e il bronzo (19,3).
L’intuizione dietro il progetto: due cervelli in uno
Il successo di AlphaGeometry nasce da un’architettura innovativa che unisce un modello di linguaggio neurale, ispirato al funzionamento del cervello umano, con un motore logico-deduttivo specializzato nella geometria. I due componenti lavorano in sinergia: il sistema deduttivo avanza fino a un punto critico, dove interviene il modello linguistico per suggerire nuove direzioni. Questo dialogo continuo consente di affrontare problemi complessi con una logica iterativa che ricorda il ragionamento umano.
Milioni di diagrammi per imparare a ragionare
L’addestramento di AlphaGeometry ha seguito un percorso completamente diverso da quello dei classici chatbot. Invece di ricevere problemi direttamente, il software genera un miliardo di diagrammi geometrici casuali, per poi risalire ai passaggi necessari alla loro costruzione. Questo metodo, definito “deduzione simbolica e tracciabilità”, permette all’IA di sviluppare una sorta di intuito geometrico. Un approccio che punta meno sulla memorizzazione e più sulla comprensione profonda della struttura dei problemi.

Oltre la geometria: l’orizzonte dell’IA matematica
Per ora AlphaGeometry è limitato ai quesiti geometrici, ma le ambizioni di Google DeepMind guardano ben oltre. L’obiettivo è estendere la capacità del modello ad altri rami della matematica, con l’intento di creare un assistente intelligente capace di supportare matematici e ricercatori. I progressi sono già evidenti: il nuovo software ha risolto 2,5 volte più problemi rispetto al suo predecessore, fermo a 10 soluzioni su 30. Un balzo tecnologico che segna un nuovo standard nell’uso dell’intelligenza artificiale per il pensiero logico.