Il team Netflix che si occupa dei progetti incentrati sulla data science ha rilasciato Metaflow sotto licenza open source. Metaflow è una libreria scritta in Python dedicata ai progetti di apprendimento automatico "human-centered", si tratta di una soluzione utilizzata dagli ingegneri della piattaforma di video streaming per realizzare e distribuire i data-science workflow nella propria infrastruttura Cloud based.
Netflix utilizza gli algoritmi di machine learning in tutti gli aspetti del suo business, essi ad esempio vengono implementati all'interno della screenplay analysis, nell'ottimizzazione dei project plan, nei processi di previsione di abbandono, nella traduzione automatizzata e, ovviamente, anche nell'ottimizzazione della gigantesca rete di distruzione dei contenuti video on demand.
Gli ingegneri software di Netflix affermano che Metaflow è stato concepito per migliorare il loro livello di produttività. Metaflow si occupa infatti di gestire automaticamente tutti i task ingegneristici dei progetti di data scienze, come ad esempio la gestione dei pacchetti e delle API (Application Programming Interface). Inoltre permette di eseguire il testing dei modelli prototipati e di verificare il loro effettivo funzionamento anche negli ambienti di produzione.
In buona sostanza Metaflow è uno strumento nato per aiutare gli ingegneri nella gestione, nel testing e nella distribuzione su larga scala dei progetti di data science. Metaflow può anche interfacciarsi facilmente con PyTorch, Tensorflow, SciKit Learn e con altre librerie Python per la data scienze e il machine learning ed è perfettamente compatibile con i servizi cloud erogati tramite AWS (Amazon Web Services).