A settembre, OpenAI ha annunciato la nuova serie o1 di LLM, progettati per dedicare più tempo alla riflessione prima di rispondere. Questi modelli sono adatti per attività di ragionamento complesse e hanno prestazioni migliori in ambito scientifico, di programmazione e matematica. Recentemente, Google ha annunciato il suo primo modello linguistico di grandi dimensioni incentrato sul ragionamento, denominato Gemini 2.0 Flash Thinking. Questo nuovo modello sperimentale è disponibile con il nome gemini-2.0-flash-thinking-exp-1219 per gli sviluppatori in Google AI Studio. Google afferma che questo ultimo modello è più adatto per la comprensione, il ragionamento e la programmazione multimodali. Google ha detto di aver visto risultati promettenti quando ha aumentato il calcolo del tempo di inferenza. Sfortunatamente, Big G non ha condiviso alcun benchmark per supportare la sua affermazione. Tuttavia, secondo Chatbot Arena, Gemini-2.0 Flash-Thinking si classifica al primo posto in tutte le categorie.
Gemini 2.0 Flash Thinking: contesto di 128K e aggiornamento a agosto 2024
Per provare il modello Gemini 2.0 Flash Thinking, Google ha elencato alcuni casi d'uso nel suo portale per sviluppatori. In particolare, questi riguardano il ragionare sui problemi più complessi, mostrare il processo di pensiero del modello e affrontare problemi di codice e matematica difficili. Il nuovo modello supporterà una lunghezza del contesto superiore a 128k e prevede un limite di conoscenza di agosto 2024. Gli sviluppatori possono accedere a questo nuovo modello di ragionamento Gemini tramite l'API Gemini in Google AI Studio e Vertex AI.
All'inizio di questa settimana, OpenAI ha annunciato che il suo modello di ragionamento o1 verrà distribuito agli sviluppatori sul livello di utilizzo 5 nell'API. Questo modello o1 aggiornato fornisce risultati all'avanguardia su diversi benchmark AI popolari. Gli sviluppatori possono utilizzare il modello o1 per creare applicazioni agentiche per migliorare l'assistenza clienti, ottimizzare le decisioni sulla supply chain e prevedere le tendenze finanziarie. Con questi nuovi LLM incentrati sul ragionamento, gli sviluppatori hanno modelli ancora più potenti per creare applicazioni AI innovative in vari settori.