Google ha recentemente rilasciato due modelli Gemini 1.5 aggiornati e pronti per la produzione: Gemini-1.5-Pro-002 e Gemini-1.5-Flash-002. Questi nuovi modelli offrono piccoli miglioramenti rispetto ai modelli Gemini 1.5 originali rilasciati a maggio. I modelli aggiornati offrono un aumento di circa il 7% in MMLU-Pro, un miglioramento di circa il 20% nei benchmark MATH e HiddenMath. Vi sono poi miglioramenti di circa il 2-7% nei casi d'uso di visione e codice. Inoltre, Google ha migliorato l'utilità complessiva delle risposte del modello. Entrambi i modelli ora rispondono in uno stile più conciso. Secondo l’azienda di Mountain View, la lunghezza di output predefinita dei modelli aggiornati è più corta di circa il 5-20% rispetto ai modelli precedenti.
Oltre ai miglioramenti del modello, Google sta anche apportando una modifica significativa. L’azienda sta infatti riducendo i prezzi delle API del modello della serie Gemini 1.5. In primis ha attuato una riduzione del prezzo del 64% sui token di input. Vi è poi una riduzione del prezzo del 52% sui token di output. Infine, ha optato per una riduzione del prezzo del 64% sui token incrementali memorizzati nella cache per Gemini 1.5 Pro, dal 1° ottobre 2024, sui prompt inferiori a 128K token.
Gemini 1.5: maggiori limiti di velocità e nuova versione sperimentale del modello
Google sta aumentando i limiti di velocità, consentendo agli sviluppatori di creare applicazioni AI complesse. I limiti di velocità del livello a pagamento per 1.5 Flash sono ora 2.000 RPM e 1.5 Pro sono ora 1.000 RPM (i precedenti erano rispettivamente 1.000 e 360). Google ha anche ridotto la latenza con i nuovi modelli. Gli sviluppatori possono aspettarsi un output 2 volte più veloce e una latenza 3 volte inferiore. Con l'aggiornamento Gemini 1.5 (modelli -002), Google ha migliorato la capacità del modello di seguire le istruzioni dell'utente bilanciando la sicurezza. Inoltre, per impostazione predefinita, Google non applicherà filtri di sicurezza dei contenuti AI a questi nuovi modelli. Invece, gli sviluppatori possono utilizzare i filtri in base alle proprie esigenze.
Infine, Google ha rilasciato una versione migliorata del modello denominata "Gemini-1.5-Flash-8B-Exp-0924". Questa versione sperimentale migliorata include significativi incrementi di prestazioni sia nei casi d'uso testuali che multimodali. Tutti i modelli Gemini 1.5 aggiornati sono ora disponibili per gli sviluppatori tramite Google AI Studio e la Gemini API. Per le aziende più grandi e i clienti di Google Cloud, questi nuovi modelli aggiornati sono disponibili su Vertex AI.