Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

GitHub: un'analisi dei progetti dedicati all'AI

Quanti progetti dedicati all'AI sono presenti in GitHub? A quali task sono dedicati? Scopriamolo attraverso i risultati di uno studio
GitHub: un'analisi dei progetti dedicati all'AI
Quanti progetti dedicati all'AI sono presenti in GitHub? A quali task sono dedicati? Scopriamolo attraverso i risultati di uno studio
Link copiato negli appunti

Chip Huyen, computer scientist con competenze avanzate in Intelligenza Artificiale, ha pubblicato uno studio dedicato alla diffusione di progetti legati alla AI in GitHub. Come è cambiata la piattaforma di Microsoft dopo la rivoluzione portata da GPT e il lancio di ChatGPT? Per capirlo l'autrice ha analizzato migliaia di repository restringendo poi il numero a quelli più rilevanti per la sua ricerca.

I criteri di selezione dello studio

L'analisi è stata condotta a partire da ricerche basate su parole chiave come gpt, llm e generative ai. Solo per la prima i risultati sono stati 118 mila, quindi per semplificare il lavoro di selezione sono stati presi in considerazione soltanto i progetti con almeno 500 stelle. Sono stati così isolati 896 repository tra cui 51 tra tutorial e liste aggregate. Il dato depurato è stato quindi pari a 845 risultati utili.

Lo stack dei progetti AI su GitHub

Una volta terminata la fase di selezione, Huyen ha potuto individuare 4 stack differenti:

  1. infrastrutture, ad esempio soluzioni per il monitoraggio e il compute management;
  2. sviluppo dei modelli, quindi applicazioni per l'ottimizzazione dell'inferenza, il training e il Dataset engineering;
  3. sviluppo di applicazioni, basti pensare alla creazione di interfacce utente o all'engineering dei prompt;
  4. applicazioni, come per esempio i tool per la programmazione e l'automazione dei flussi di lavoro.

Le applicazioni AI più sviluppate

Passando ad un tema più vicino agli sviluppatori, nello stack relativo alle applicazioni le soluzioni più popolari sarebbero quelle per il coding, con quasi 31 punti percentuali. Seguirebbero i bot, con una percentuale di poco inferiore, tra cui quelli dedicati alla messaggistica istantanea e in particolare a WhatsApp. Merita inoltre una segnalazione la presenza di un gran numero di strumenti incentrati sul prompt engineering e sullo sviluppo di estensioni per i chatbot.

Lo stack dedicato allo sviluppo di applicazioni è popolato in particolare a integrazioni con software preesistenti. I progetti più diffusi sono per esempio quelli dedicati ai plugin per browser, con cui interrogare i modelli, e le estensioni di editor per i coding come Visual Studio Code.

Da notare come lo stack relativo alle infrastrutture non sia particolarmente ricco di repository. Questo perché in genere i progetti incentrati su monitoring, compute management e serving non sono associati a licenze permissive.

Ti consigliamo anche