Oggi vogliamo parlarvi di un interessante progetto nato in seno all'Università del Maryland: unCaptcha, si tratta di un programma capace di risolvere in modo automatico anche il reCaptcha di Google. I sistemi CAPTCHA (completely automated public Turing test to tell computers and humans apart) rappresentano ancora oggi la principale difesa dei siti Web contro l'azione dei bot, ma quanto sono sicuri?
Google reCaptcha si occupa di creare uno scenario in cui la mente umana è avvantaggiata rispetto ad un algoritmo informatico, generando immagini che devono essere associate ad un concetto (albero, case, fiumi, laghi, oggetti..). Questo tipo di associazioni sono delle operazioni complesse per per un bot e, nella maggior parte dei casi, servirebbe una AI molto potente per effettuarle, dotazione che fortunatamente gran parte dei bot in Rete non hanno a disposizione.
Esistono però persone con difficoltà fisiche che rendono problematico l'uso di reCaptcha (ad esempio gli ipovedenti), per questo motivo Google ha implementato un sistema che tramite dei file audio guida l'utente umano nella risoluzione del problema, si tratta di un semplice sistema chiamato speech-to-text service ormai utilizzato su larga scala per gli utenti con problemi alla vista.
Partendo da questa feature i developer di unCaptcha hanno ideato un modo per risolvere in modo automatico, quindi senza intervento umano, le domande poste da reCaptcha, il programma non fa altro che analizzare le tracce audio messe a disposizione da Google. È possibile sintetizzare le operazioni che esegue unCaptcha in questo modo:
- Download degli audio captcha.
- Dividere i file audio in segmenti.
- Caricare i segmenti audio in diversi servizi speech-to-text online.
- Raccogliere i risultati della conversione dei servizi speech-to-text service ricercando omofonie.
- Analizzare tutte le omofonie rilevate cosi da individuare corrispondenze.
- Caricare la risposta.
Gli sviluppatori di unCaptcha non hanno ancora fornito il codice del loro progetto, tuttavia prevedono di renderlo pubblico a breve assieme ai dati raccolti durante lo sviluppo del programma.
Via unCaptcha