Mistral, startup francese di intelligenza artificiale, ha rilasciato il suo primo modello di intelligenza artificiale generativa per il coding, soprannominato Codestral. Come altri modelli di generazione di codice, Codestral è progettato per aiutare gli sviluppatori a scrivere e interagire con il codice. Come riportato da Mistral sul proprio blog, questo modello è stato addestrato su oltre 80 linguaggi di programmazione, tra cui Python, Java, C++ e JavaScript. Codestral può anche completare funzioni di coding, scrivere test e "riempire" codice parziale, nonché rispondere a domande su una base di codice in inglese.
Mistral descrive il modello come “aperto”, ma ciò è oggetto di dibattito. La licenza della startup vieta l’uso di Codestral e dei suoi risultati per qualsiasi attività commerciale. La licenza vieta anche “qualsiasi utilizzo interno da parte dei dipendenti nel contesto delle attività commerciali dell’azienda”. Il motivo potrebbe essere che Codestral è stato addestrato in parte su contenuti protetti da copyright. Mistral non ha confermato né smentito tale possibilità. In ogni caso, Codestral potrebbe non essere così conveniente per gli sviluppatori, magari alle prime armi. Infatti, essendo dotato di 22 miliardi di parametri, per funzionare il modello richiede PC molto potenti.
Codestral: il futuro del coding passa dall’intelligenza artificiale
Sebbene poco pratico per la maggior parte degli sviluppatori e incrementale in termini di miglioramenti delle prestazioni, Codestral alimenterà sicuramente il dibattito sull'opportunità di affidarsi a modelli di generazione di codice come assistenti di programmazione. Gli sviluppatori stanno sicuramente adottando strumenti di intelligenza artificiale generativa almeno per alcune attività di codifica. In un sondaggio Stack Overflow del giugno 2023, il 44% degli sviluppatori ha affermato di utilizzare già strumenti AI nel processo di sviluppo. il 26% degli intervistati prevede invece di farlo presto. Eppure, questi strumenti hanno evidenti difetti. Un’analisi di oltre 150 milioni di righe di codice impegnate nei repository dei progetti negli ultimi anni da parte di GitClear ha rilevato che gli strumenti di sviluppo di intelligenza artificiale generativa stanno determinando l’inserimento di più codici errati nelle codebase.
I ricercatori di sicurezza hanno anche avvertito che tali strumenti possono amplificare i bug esistenti e i problemi di sicurezza nei progetti software. Secondo uno studio di Purdue, oltre la metà delle risposte che ChatGPT di OpenAI fornisce alle domande di programmazione sono sbagliate. Naturalmente, ciò non impedirà ad aziende come Mistral e altre di tentare di monetizzare con i loro modelli. Recentemente, Mistral ha lanciato una versione ospitata di Codestral sulla sua piattaforma di intelligenza artificiale conversazionale Le Chat e sulla sua API a pagamento. Mistral afferma infine che sta lavorando per integrare Codestral in framework di app e ambienti di sviluppo come LlamaIndex, LangChain, Continue.dev e Tabnine.