Anthropic, la startup AI fondata da ex ingegneri di OpenAI, ha annunciato sul proprio account X il rilascio di un nuovo aggiornamento per il suo chatbot AI, portando così Claude alla versione 2.1. Adesso il chatbot è in grado di gestire fino a 200.000 token contemporaneamente (per gli utenti di livello Pro), il che equivale a oltre 500 pagine di materiale. Claude 2.1 raddoppia quindi le sue prestazioni e supera di molto i 32.000 token di GPT-4, la versione più avanzata del LLM di OpenAI. Come ricordato dall’azienda sul ChatGPT ufficiale: “I nostri utenti ora possono caricare documentazione tecnica come intere basi di codice, rendiconti finanziari come S-1 o anche lunghe opere letterarie come L'Iliade o L'Odissea. Essendo in grado di usare grandi quantità di contenuti o dati, Claude può riassumere, eseguire domande e risposte, prevedere tendenze, confrontare più documenti e molto altro ancora.”
Our new model Claude 2.1 offers an industry-leading 200K token context window, a 2x decrease in hallucination rates, system prompts, tool use, and updated pricing.
Claude 2.1 is available over API in our Console, and is powering our https://t.co/uLbS2JNczH chat experience. pic.twitter.com/T1XdQreluH
— Anthropic (@AnthropicAI) November 21, 2023
Claude 2.1: uso degli strumenti e meno errori per il chatbot di Anthropic
Anthropic ha reso Claude 2.1 simile a ChatGPT, introducendo la nuova funzionalità di utilizzo degli strumenti (ancora in beta). Gli utenti possono ora collegare gli strumenti (API) e Claude sceglierà il migliore in base al contesto. Ciò include l’uso di una calcolatrice o la ricerca sul web. La società afferma inoltre che gli utenti possono richiedere l’avvio di strumenti specifici utilizzando il linguaggio naturale. Anthropic ha affermato di aver aggiornato la propria console per sviluppatori con una finestra di test per provare nuovi prompt. Inoltre, l’azienda ha aggiunto la possibilità di fornire a Claude istruzioni persistenti personalizzate. Allo stesso modo di GPT-4, gli utenti potranno personalizzare il chatbot per rispondere in modi specifici o con personalità specifiche.
L'azienda afferma infine che Claude 2.1 commetterà la metà degli errori rispetto al passato. L’azienda ha testato l'onestà di Claude curando un'ampia serie di domande complesse e concrete che sondano le debolezze note dei modelli attuali. Inoltre, sono stati introdotti miglioramenti significativi alla comprensione e al riepilogo, in particolare per documenti lunghi e complessi che richiedono un elevato grado di accuratezza. Claude 2.1 ha dimostrato una riduzione del 30% delle risposte errate e un tasso 3-4 volte inferiore di conclusioni errate di un documento a sostegno di una determinata affermazione.