Anthropic ha ufficializzato il lancio di Claude 3.5 "Sonnet", prima versione della famiglia di LLM (Large Language Model) appartenenti al ramo 3.5. Come sottolineato dai portavoce della compagnia, questo aggiornamento si è dimostrato superiore a diversi competitor nonché al precedente Claude 3 "Opus". È quindi pronto per la distribuzione, anche in ambito industriale.
Come accedere a Claude 3.5 "Sonnet"
L'ultima release del modello generativo è accessibile gratuitamente tramite Web browser e il sito Web Claude.ai. Quest'ultimo consente di utilizzare il chatbot del progetto che viene spesso indicato come la migliore alternativa a ChatGPT. Gli utenti Apple possono sfruttare anche l'applicazione per il sistema operativo mobile iOS mentre, per ora non esiste invece una variante per i dispositivi Android. Chiaramente gli abbonati alle formule Claude Pro e Team godranno di prestazioni più elevate e funzionalità aggiuntive.
Per quanto riguarda le interfacce di programmazione, le API del servizio prevedono un costo di tre dollari per milione di token in input e di 15 dollari per milione di token in output. La finestra di contesto è pari a 200 mila token. La piattaforma è disponibile anche tramite Amazon Bedrock e Vertex AI di Google Cloud.
Benchmark e prestazioni
Claude 3.5 "Sonnet" è stato implementato per stabilire dei nuovi standard di riferimento per quanto riguarda il ragionamento a livello di laurea magistrale (GPQA, Graduate-Level Google-Proof Q&A), la conoscenza a livello di laurea triennale (MMLU, Massive Multitask Language Understanding) e la competenza nella programmazione. Per quest'ultimo punto è stato effettuato il benchmark HumanEval che si basa appunto sulla code generation.
Introducing Claude 3.5 Sonnet—our most intelligent model yet.
This is the first release in our 3.5 model family.
Sonnet now outperforms competitor models on key evaluations, at twice the speed of Claude 3 Opus and one-fifth the cost.
Try it for free: https://t.co/uLbS2JMEK9 pic.twitter.com/qz569rES18
— Anthropic (@AnthropicAI) June 20, 2024
Nella coding evaluation Claude 3.5 ha dimostrato di saper risolvere il 64% dei problemi proposti nei test contro il 38% di "Opus". È poi il doppio più veloce rispetto alla terza generazione del modello. Esso dimostra inoltre un notevole miglioramento nella comprensione delle sfumature, dell'umorismo e delle istruzioni complesse, mostrando anche la capacità di scrivere contenuti di alta qualità con un tono naturale.
Artifacts
Artifacts è una nuova funzionalità disponibile su Claude.ai che estende il modo in cui gli utenti possono interagire con Claude. Quando un utilizzatore richiede di generare dei contenuti, come per esempio frammenti di codice, documenti testuali o layout per siti Web, essi vengono mostrati in una finestra accanto alla conversazione in corso.
Questo crea uno spazio di lavoro in cui si possono visualizzare, modificare e sviluppare gli output di Claude in tempo reale.