Meta Llama: tutto ciò che c'è da sapere sul nuovo modello AI

Link copiato negli appunti

Meta ha introdotto un modello di intelligenza artificiale generativa chiamato Llama, il quale si distingue dagli altri modelli principali per essere "open", ovvero disponibile per il download e l'uso da parte degli sviluppatori, pur con alcune limitazioni. Questo aspetto lo differenzia da modelli come GPT-4 di OpenAI, Claude di Anthropic e Gemini di Google, che sono accessibili solo tramite API.

Meta ha anche collaborato con vari fornitori di servizi cloud, tra cui AWS, Google Cloud e Microsoft Azure, per rendere Llama disponibile in versione ospitata nel cloud. Inoltre, ha rilasciato strumenti che consentono di personalizzare e ottimizzare il modello, rendendolo più accessibile agli sviluppatori.

Llama non è un singolo modello, ma una famiglia di modelli che include Llama 8B, Llama 70B e Llama 405B, con le ultime versioni rilasciate nel luglio 2024: Llama 3.1 8B, Llama 3.1 70B e Llama 3.1 405B. Questi modelli sono stati addestrati su un ampio spettro di contenuti web, codice pubblico e dati sintetici generati da altri modelli di AI.

Llama 3.1 8B e Llama 3.1 70B sono versioni più leggere, adatte a dispositivi come laptop e server, mentre Llama 3.1 405B richiede un'infrastruttura hardware più potente, solitamente disponibile nei data center. Nonostante le versioni più leggere siano meno potenti, sono più veloci e hanno un ingombro minore.

Tratti distintivi, potenzialità future e rischi

Uno dei tratti distintivi di Llama è la sua finestra di contesto da 128.000 token, che corrisponde a circa 100.000 parole o 300 pagine, permettendo al modello di "ricordare" contenuti recenti e di rimanere più coerente durante l’elaborazione di lunghi documenti. Questo aspetto è particolarmente utile per evitare che il modello perda il filo del discorso o generi risposte incoerenti. Le capacità di Llama sono molteplici e spaziano da attività di assistenza come il coding, alla risoluzione di problemi matematici, fino alla sintesi di documenti in più lingue

Anche se Llama non è in grado di elaborare o generare immagini, in futuro questa funzionalità potrebbe essere integrata. I modelli Llama possono essere configurati per interagire con app e API esterne, utilizzando strumenti come Brave Search per rispondere a domande su eventi recenti o Wolfram Alpha per query legate a scienza e matematica.

Gli utenti possono interagire con Llama tramite piattaforme come Facebook Messenger, WhatsApp, Instagram e Oculus, o attraverso il sito Meta.ai. Gli sviluppatori, invece, possono scaricare il modello, utilizzarlo e adattarlo per le loro necessità, sfruttando l'infrastruttura cloud di oltre 25 partner, inclusi Nvidia, Databricks e Dell.

Meta offre inoltre strumenti di sicurezza per facilitare l'uso di Llama, tra cui Llama Guard, un sistema per moderare contenuti problematici come attività illegali o incitamento all'odio, e Prompt Guard, che protegge il modello da attacchi malevoli come tentativi di eludere i filtri di sicurezza. Tuttavia, Llama presenta alcune limitazioni e rischi. Non è chiaro se i dati utilizzati per addestrare il modello includano contenuti protetti da copyright, il che potrebbe esporre gli utenti a violazioni involontarie.

Meta Llama: tutto ciò che c'è da sapere sul nuovo modello AI

Tratti distintivi, potenzialità future e rischi

Ti consigliamo anche

OpenAI: ecco o3, nuovo modello AI per un ragionamento avanzato

Instagram introdurrà una funzionalità di editing video AI nel 2025

Google Chrome testa flag di rilevamento delle truffe basato sull’AI

Apple Intelligence: RSF reagisce a fake news su Luigi Mangione