A maggio, Google ha presentato per la prima volta in anteprima Veo, il suo primo modello di generazione video. Questo modello aveva la capacità di generare video con risoluzione 1080p in un'ampia gamma di stili cinematografici e visivi. Big G ha anche affermato che Veo può comprendere con precisione il tono di un prompt di testo e riprodurre i dettagli, anche in prompt più lunghi. Nelle scorse ore, l’azienda ha annunciato l'anteprima privata di Veo per i clienti Vertex AI. Utilizzando Veo su Vertex AI, i clienti possono generare video da semplici prompt di testo o immagini. Ciò permette di creare rapidamente prototipi e iterazioni sui contenuti video. In questo modo, Google Cloud diventa il primo hyperscaler a offrire un modello da immagine a video per clienti esterni.
Google: le novità annunciate per Imagen 3
Insieme all'anteprima privata di Veo, Google ha anche annunciato la disponibilità generale di Imagen 3, il suo ultimo modello text-to-image. Mountain View afferma che Imagen 3 può generare immagini con grandi dettagli fotorealistici e meno artefatti visivi distraenti rispetto a Imagen 2. Il modello text-to-image di Imagen 3 sarà disponibile la prossima settimana su Vertex AI per i clienti di Google Cloud. Inoltre, Big G sta inoltre introducendo alcune funzionalità che consentiranno ai clienti di Imagen 3 di personalizzare ulteriormente le immagini generate dall'IA.
Queste includono la possibilità di perfezionare e personalizzare le immagini con prompt di testo. Gli utenti potranno anche modificare solo parti di un'immagine, come l'aggiornamento degli sfondi dei prodotti e altro ancora. Imagen 3 consentirà poi ai clienti di guidare il modello per generare immagini in base a caratteristiche specifiche. I clienti possono far sì che Imagen 3 utilizzi il proprio marchio, stile, logo, soggetto o caratteristiche del prodotto quando generano nuove immagini.
Google ha evidenziato che sia Veo che Imagen 3 sono dotati di funzionalità di sicurezza. Entrambi i modelli impediscono la creazione di contenuti dannosi e aderiscono ai Responsible AI Principles dell’azienda. Inoltre, le filigrane invisibili SynthID sono incorporate in ogni immagine e frame creati da Imagen 3 e Veo. Con il lancio di Veo e Imagen 3, Google Cloud si sta affermando come leader nel campo della creazione di contenuti basati sull'intelligenza artificiale tra gli hyperscaler.