La partnership di lunga data di Microsoft con OpenAI ha portato l'azienda a fare un enorme passo avanti rispetto alla concorrenza come Google, Amazon e altri nel settore dell'intelligenza artificiale generativa. Tuttavia, secondo indiscrezioni, la società sta lavorando da sola nel creare un nuovo modello linguistico di grandi dimensioni che potrebbe finire per rivaleggiare con ChatGPT. Secondo il sito The Information, che cita fonti anonime, il LLM interno di Microsoft si chiama MAI-1 (presumibilmente "M" sta per "Microsoft). È stato sviluppato con 500 miliardi di parametri, mentre GPT-4 di OpenAI conta oltre 1 trilione di parametri.
MAI-1: Microsoft potrebbe svelare il suo LLM durante la Build 2024
Il report afferma che lo sviluppo di MAI-1 è guidato dal nuovo capo dell'intelligenza artificiale di Microsoft, Mustafa Suleyman. È stato assunto dalla società a marzo dopo aver co-fondato la divisione DeepMind AI di Google e successivamente aver fondato la propria startup AI Inflection. Prima di essere assunto da Microsoft, Suleyman stava lavorando a un altro LLM per Inflection. Le informazioni riportano che questo nuovo MAI-1 LLM che sta supervisionando non condivide alcun codice con il suo precedente lavoro con Inflection, ma potrebbe utilizzare alcuni dati di formazione di quella startup. Microsoft probabilmente vuole essere meno dipendente da OpenAI per ricevere aiuto nella creazione di servizi di intelligenza artificiale come le sue varie versioni di Copilot. L’assistente di Microsoft si basa infatti su ChatGPT.
Il report non indica quali servizi verranno utilizzati dal prossimo MAI-1 LLM. The Information dichiara che è possibile che Microsoft possa rivelare di più su questo progetto durante la conferenza annuale degli sviluppatori (la Build 2024), che inizierà a Seattle il 21 maggio. Microsoft ha già rilasciato una serie di LLM open source più piccoli e leggeri. La settimana scorsa ha rilasciato la nuova famiglia di piccoli LLM Phi-3. Questi funzionano con un minimo di 3,8 miliardi di parametri. Sono inoltre progettati per funzionare su dispositivi locali come gli smartphone. Tuttavia, sono comunque realizzati per gestire l'elaborazione avanzata del linguaggio naturale per un'ampia varietà di attività.