Martedì scorso, Google ha presentato l’aggiornamento per Gemini 2.5, una nuova famiglia di modelli AI con capacità di ragionamento. Questi modelli sono infatti in grado di "fermarsi a pensare" prima di rispondere a una domanda. Per inaugurare questa nuova serie, Google ha lanciato Gemini 2.5 Pro Experimental. Si tratta di un modello di AI multimodale con capacità di ragionamento, che l'azienda definisce il più avanzato mai realizzato. Questo modello è già disponibile su Google AI Studio e nell'app Gemini per gli abbonati al piano AI avanzato da 20 dollari al mese. In futuro, l’azienda di Mountain View afferma che tutti i suoi nuovi modelli di intelligenza artificiale avranno integrate funzionalità di ragionamento.
Google: Gemini 2.5 Pro supera i competitor nei benchmark
Google ha già sperimentato modelli di AI con capacità di ragionamento, rilasciando a dicembre una "versione pensante" di Gemini. Tuttavia, con Gemini 2.5 l’azienda compie il passo più deciso per cercare di superare la serie "o" di OpenAI. Big G dichiara che Gemini 2.5 Pro è più avanzato rispetto ai suoi precedenti modelli di IA. Inoltre, riesce anche a superare alcuni dei principali concorrenti in diversi test di valutazione. In particolare, è stato progettato per eccellere nella creazione di web app dall'aspetto accattivante e nelle applicazioni di coding più sofisticate.
Un esempio concreto è il test Aider Polyglot, che misura la capacità di modifica del codice. Qui, Gemini 2.5 Pro ha ottenuto un punteggio del 68,6%, superando i migliori modelli di OpenAI, Anthropic e DeepSeek. Tuttavia, in un altro test che valuta le capacità di sviluppo software, chiamato SWE-bench Verified, Gemini 2.5 Pro ha ottenuto un punteggio del 63,8%. Questo risultato supera o3-mini di OpenAI e DeepSeek R1. Tuttavia, è inferiore al 70,3% raggiunto da Claude 3.7 Sonnet di Anthropic. Nel test Humanity’s Last Exam, che include migliaia di domande su matematica, scienze umane e scienze naturali, Gemini 2.5 Pro ha ottenuto il 18,8%. Secondo l’azienda di Mountain View, questo risultato lo posiziona sopra la maggior parte dei modelli di punta concorrenti.
Google afferma che Gemini 2.5 Pro verrà distribuito con una finestra di contesto di 1 milione di token. Ciò significa che il modello AI può accettare circa 750.000 parole in una sola volta (più dell'intera serie di libri "Il Signore degli Anelli"). E presto, Gemini 2.5 Pro supporterà il doppio della lunghezza di input (2 milioni di token). Big G non ha pubblicato i prezzi dell’API per Gemini 2.5 Pro. L'azienda afferma che condividerà di più nelle prossime settimane.