Anthropic ha recentemente annunciato il lancio del suo modello più recente, chiamato Claude 3.5 Sonnet. L’azienda assicura che tale LLM può eguagliare o addirittura essere migliore di GPT-4o di OpenAI o di Gemini di Google in un’ampia varietà di compiti. Il nuovo modello è già disponibile per gli utenti di Claude sul web e su iOS, e Anthropic lo sta rendendo disponibile anche agli sviluppatori. Claude 3.5 Sonnet sarà alla fine il modello intermedio della gamma. Anthropic utilizza il nome Haiku per il suo modello più piccolo, Sonnet per l'opzione mediana e mainstream e Opus per il suo modello di fascia più alta. L'azienda ha rivelato che 3.5 Sonnet supera anche 3 Opus e con un margine piuttosto ampio. Apparentemente il nuovo modello è anche due volte più veloce del precedente, il che potrebbe essere un vantaggio ancora maggiore.
Claude 3.5 Sonnet: migliori risultati di ricerca con Artifacts
Claude 3.5 Sonnet sembra impressionante. Come già accennato ha superato anche GPT-4o, Gemini 1.5 Pro e Meta's Llama 3 400B in sette benchmark complessivi su nove e quattro benchmark visivi su cinque. Anthropic afferma che il suo modello sarà molto migliore nella scrittura e nella traduzione del codice, nella gestione di flussi di lavoro multifase, nell'interpretazione di diagrammi e grafici e nella trascrizione del testo dalle immagini.
Questo Claude nuovo e migliorato è apparentemente anche più bravo a comprendere l'umorismo e può scrivere in un modo molto più umano. Anthropic ha introdotto anche una nuova funzionalità chiamata Artifacts. Questa permette vedere e interagire con i risultati delle richieste inviate a Claude. Se si chiede al modello di progettare qualcosa, ora può mostrare come appare e permette di modificarlo direttamente nell'app. Se Claude scrive un'e-mail, è possibile modificare l'e-mail nell'app Claude invece di doverla copiare in un editor di testo. Il nuovo Claude 3.5 Sonnet darà sicuramente del filo da torcere alla concorrenza. Adesso bisogna capire quale saranno le prossime mosse di OpenAI e Google per poter provare a superare il modello di Anthropic.