Come è noto, Yahoo ha da tempo deciso di impegnarsi seriamente nella realizzazione di un motore di ricerca autonomo; oggi, insieme con Google ed MSN, sta tentando di realizzare uno spider che riesca a soddisfare utenti sempre più esigenti. In questa prospettiva, Yahoo ha da poco lanciato un nuovo strumento per la ricerca nel web; il suo nome è Y!Q.
Grazie a questo strumento, un utente può selezionare un testo in una pagina e lanciare una ricerca che contenga alcuni di questi termini ritenuti fondamentali.
L'idea è buona anche se nasce da una considerazione negativa per tutti i motori di ricerca (e non solo per Yahoo); uno dei grossi problemi che i motori di ricerca affrontano oggi è quello della over-information e della difficoltà di ranking.
Agli albori di Internet, i motori di ricerca difficilmente fornivano più di cinquanta risultati di ricerca, anche a seguito di ricerche molto 'popolari'; oggi non è raro visualizzare risultati per centinaia di migliaia di siti per una singola ricerca; questo non è chiaramente un bene perché un utente non può cernere centinaia di migliaia di risultati. Ci sono due modi per 'affossare' le speranze di un internet user alla ricerca di informazioni (su qualsiasi argomento): una è quella di non fornire informazioni; la seconda è quella di fornire informazioni in eccesso.
Nel secondo caso esiste un 'rimedio' che è dato dal ranking dei risultati di ricerca; si tratta cioè di visualizzare, nelle prime posizioni, i risultati che sono più attinenti; questo presuppone che ci sia una corrispondenza, la più accurata possibile, fra il significato della ricerca dell'internet user e il significato dei documenti visualizzati.
Di fatto, oggi possiamo dire che sulle ricerche 'semplici' (quelle costituite da un solo termine, per esempio), i motori di ricerca spesso forniscono dei risultati affatto generici e sembra non 'capiscano' quale sia la richiesta dell'utente; chi cerca "golf" che cosa sta cercando? Documenti (pagine web) sullo sport del golf, su un tipo di maglioni, oppure su un'autovettura? Il motore di ricerca non lo sa e quindi non può che offrire dei risultati di ricerca 'sbagliati.
La risposta di Yahoo a questo problema è quello di cambiare la domanda; in sostanza, si cerca di 'spingere' l'internet user a eseguire delle ricerche complesse. Y!Q è un modo per fare eseguire delle query (ricerche) complesse anche a chi non è abituato a farlo. In sostanza, dal momento che il motore non è in grado di dare delle risposte esaurienti a chi cerca con la semplice keyword "golf", il motore di ricerca 'stimola' a cercare con delle keyphrase composite (composte da più keyword in modalità AND).
Possiamo quindi dire che Y!Q è una sconfitta dell'ideale di un motore di ricerca, ovverosia quello di fornire risultati utili anche per ricerche semplici e non solo per ricerche molto composte; dobbiamo infatti sottolineare il fatto che nelle ricerche composte la conoscenza da parte del 'ricercante' è più alta quanto più alto è il numero di keyword inserite. Quindi, buona parte del 'lavoro' che dovrebbe eseguire il motore di ricerca viene fatto dal ricercatore.
Detto questo, vediamo di analizzare l'efficienza di questo nuovo strumento offerto da Yahoo.
Per testare il sistema è necessario scaricare e installare una toolbar, dal momento che la ricerca avviene non sulle pagine di Yahoo ma sulle pagine di qualsiasi sito.
Sono andato su questa pagina. Ho selezionato tutto il testo dell'articolo e ho attivato una ricerca con Yahoo.
Yahoo ha fatto partire questa query (ricerca) composita.
L'articolo trattava dell'enorme crescita del numero di virus informatici negli ultimi due mesi; ma grazie a Y!Q la ricerca ha fatto visualizzare solo un risultato di ricerca attinente con quanto cercato, i restanti 9 documenti non hanno nulla a che fare con l'esplosione di virus dell'ultimo bimestre.
Come mai?
Il motivo è molto semplice; nella query composita lanciata automaticamente da Yahoo sono contenuti dei termini che non sono affatto rilevanti dal punto di vista semantico.
Nello specifico, abbiamo individuato tre elementi che non hanno assolutamente alcun rilievo dal punto di vista semantico e che sono:
LA (articolo determinativo)
- Dell' (preposizione articolata)
- Di (preposizione)
Inoltre, altri elementi della query non sono affatto specifici rispetto alla notizia contenuta nell'articolo; per esempio:
- azienda
- trend
- micro
- rilevazione
Di fatto, le keyword che sarebbero state interessanti per effettuare una ricerca composita efficace sarebbero stati i seguenti:
- Sicurezza
- Informatica
- Virus
- Informatici
Se provate a cercare con questa ricerca composita (con Yahoo), vi accorgerete che i risultati di ricerca sono molto più attinenti rispetto a quelli visualizzati in seguito all'utilizzo di Y!Q.
Il problema è che non è ben chiaro quale sia il criterio secondo il quale vengono scelte determinate keyword piuttosto che altre per attivare la ricerca; quello che possiamo indurre è che di sicuro non è stata fatta una stop list di keyword da considerare non rilevanti semanticamente e che comprendano preposizioni, articoli, avverbi, congiunzioni etc. A ciò si aggiunga il fatto che altre keyword comprese nella query sono generiche e per nulla rilevanti.
Questo accade per un semplice motivo: Yahoo non sa di che cosa parla quella determinata pagina di ricerca da cui dovrebbe partire una query composita e questo perché il funzionamento del suo motore di ricerca è ancora lessicale e non ancora semantico.
Chi volesse scaricare la toolbar di Y!Q può farlo a questo indirizzo: