Dal lancio del modello R1 di DeepSeek a gennaio, le aspettative per i nuovi modelli di fondazione sono aumentate notevolmente. Baidu, un'importante azienda cinese di tecnologia, ha annunciato l'introduzione di due nuovi modelli di fondazione: ERNIE 4.5 ed ERNIE X1. Il primo è un modello di fondazione multimodale progettato per comprendere testo, immagini, audio e video. Inoltre, include miglioramenti nelle competenze linguistiche, comprensione, generazione, ragionamento e memoria. Secondo Baidu, ERNIE 4.5 supera GPT-4.5 di OpenAI in vari benchmark standard. Un aspetto degno di nota di ERNIE 4.5 è il suo costo, che è solo l'1% del costo di GPT-4.5. Baidu ha raggiunto le prestazioni e l'efficienza dei costi di ERNIE 4.5 utilizzando tecnologie chiave come FlashMask Dynamic Attention Masking, Heterogeneous Multimodal Mixture-of-Experts, Spatiotemporal Representation Compression, Knowledge-Centric Training Data Construction e Self-feedback Enhanced Post-Training.
Baidu: X1 sfrutta l’apprendimento con rinforzo progressivo
ERNIE X1 è il primo modello di ragionamento multimodale deep-thinking di Baidu. Offre prestazioni ottimali nelle domande e risposte sulla conoscenza cinese, nel dialogo, nel ragionamento logico, nei calcoli complessi e altro ancora. Supporta anche l'uso di strumenti, tra cui ricerca avanzata, domande e risposte su un dato documento, comprensione delle immagini, generazione di immagini AI, interpretazione del codice, lettura di pagine web, mappatura TreeMind, ricerca accademica Baidu, ricerca di informazioni aziendali e ricerca di informazioni sui franchising.
X1 è alimentato da tecnologie chiave come il metodo di apprendimento con rinforzo progressivo. Quest’ultimo è un approccio di formazione end-to-end che integra catene di pensiero e azione e un sistema di ricompensa unificato e multiforme. Secondo Baidu, ERNIE X1 offre prestazioni alla pari con DeepSeek R1 a solo metà del prezzo. I consumatori possono accedere ai nuovi modelli ERNIE 4.5 ed ERNIE X1 tramite il sito web di ERNIE Bot. Baidu sta pianificando di integrare questi nuovi modelli in Baidu Search, nell'app Wenxiaoyan e in altri servizi nei prossimi mesi. Per gli sviluppatori, il nuovo ERNIE 4.5 è ora disponibile tramite API sulla piattaforma MaaS Qianfan di Baidu AI Cloud. Il modello ERNIE X1 sarà invece disponibile a breve.
Il prezzo per ERNIE 4.5 parte da 0,004 RMB (renminbi cinese) per mille token per l'input e 0,016 RMB per mille token per l'output. Per ERNIE X1, i prezzi di input partono da 0,002 RMB per mille token, mentre i prezzi di output sono bassi come 0,008 RMB per mille token. In termini euro, i prezzi di input e output partono da 0,51 euro per 1 milione di token e 2,02 euro per 1 milione di token di output.