Il team di Uber, nota azienda che fornisce servizi di trasporto privato su ruote tramite le sue applicazioni mobile, ha recentemente rilasciato sotto licenza open source Manifold, un tool di debugging dedicato ai modelli di intelligenza artificiale.
Il debug dei modelli di machine learning non è un operazione semplice e per alleggerire il carico di lavoro dei propri data scientit gli ingegneri software di Uber hanno realizzato Manifold, un model-agnostic visual tool in grado di rilevare le differenze presenti tra le varie versioni delle funzionalità implementate.
Manifold fa parte di Michelangelo ML, ovvero la Machine Learning Platform di Uber con cui il team della compagnia realizza e distribuisce i vari machine learning model implementati all'interno dell'infrastruttura Cloud aziendale.
Il codice di Manifold è ora disponibile tramite un repository pubblico su Github. Ad annunciare questa novità è stato il machine learning software engineer Lezhi Li, tramite un articolo sul blog ufficiale del gruppo:
Da quando Manifold è in circolazione abbiamo ricevuto un notevole numero di feedback positivi riguardo al suo potenziale in scenari di debugging con i modelli di machine learning. Riteniamo che la versione open source di Manifold sarà dunque molto utile alla community di sviluppatori indipendenti.
Manifold sfrutta un algoritmo per il clustering (k-Means) con cui suddividere i dati per i modelli predittivi in tanti segmenti sulla base della loro somiglianza in termini di prestazioni. L'algoritmo classifica quindi le caratteristiche in base alla divergenza KL, una misura della differenza tra due distribuzioni contrastanti.
Manifold supporta una vasta gamma di algoritmi, inclusi quelli di classificazione binaria ed i modelli di regressione. Inoltre può interfacciarsi con Jupyter Notebook, una delle piattaforme di data science più utilizzate dai data scientist e dai machine learning software engineer.
Il rilascio di Manifold arriva poco dopo la presentazione di Platone, una piattaforma dedicata alla realizzazione, all'addestramento ed alla distribuzione di conversational AI e di modelli di machine learning.
Via Uber