Durante il recente evento Google Cloud Next 2025, Google ha svelato una serie di innovazioni rivoluzionarie che alzano ulteriormente il livello nel campo dell’intelligenza artificiale. Tra queste spicca Ironwood, il nuovo acceleratore AI che rappresenta un significativo balzo in avanti nella potenza di calcolo e nell’efficienza per i modelli generativi più complessi.
Il processore TPU di settima generazione è progettato per supportare le applicazioni più esigenti, come i Large Language Models e i Mixture of Experts. Con una rete di interconnessione a bassa latenza, Ironwood consente di scalare fino a configurazioni di 9.216 chip, raggiungendo una potenza di calcolo senza precedenti di 42,5 Exaflops, un valore oltre 24 volte superiore al supercomputer El Capitan. Ogni chip è dotato di 192 GB di memoria ad alta larghezza di banda, un miglioramento di sei volte rispetto alla generazione precedente.
Oltre alle innovazioni hardware, Google ha introdotto nuovi modelli generativi all’avanguardia. Tra questi, Gemini 2.5 Flash, un modello ottimizzato per garantire latenze ridotte e costi contenuti. Dotato di capacità di ragionamento adattiva, il modello regola automaticamente i tempi di elaborazione in base alla complessità delle richieste, offrendo una flessibilità senza precedenti per gli sviluppatori e le aziende.
Lyria: un nuovo modello di creazione musicale
Nel campo della creazione musicale, il modello Lyria rappresenta un passo avanti nella generazione di contenuti audio. Con Lyria, gli utenti possono creare tracce musicali personalizzate in pochi minuti, con risultati ad alta fedeltà in vari generi musicali. Questa tecnologia, disponibile in anteprima su Vertex AI, risponde a prompt specifici come “Crea una traccia bebop ad alta energia con assoli di sax e tromba”.
Per quanto riguarda l’elaborazione video, Google ha potenziato il modello Veo 2 con funzionalità avanzate di editing, come l’inpainting e l’outpainting, che consentono di rimuovere elementi indesiderati o adattare i filmati a diversi formati. Sul fronte audio, Chirp 3 introduce voci realistiche in oltre 35 lingue e permette di generare voci personalizzate a partire da soli 10 secondi di registrazione, offrendo soluzioni ideali per call center e contenuti accessibili.
Infine, Google ha ribadito il suo impegno verso un utilizzo responsabile dell’intelligenza artificiale con l’introduzione di DeepMind SynthID. Questo sistema di watermarking invisibile è stato sviluppato per identificare immagini, video e audio generati da AI, garantendo trasparenza e sicurezza nell’uso di contenuti sintetici.