L'obiettivo da cui siamo partiti è quello di far sì che l'utente trovi sempre nel sito l'informazione che sta cercando. Nella fase di progettazione, quindi, dobbiamo dedicare la nostra attenzione anche alle funzionalità del motore di ricerca interno.
L'immagine che segue (ispirata a quella pubblicata nel sito http://semanticstudios.com/publications/semantics/000004.php e riportata nel volume Architettura dell'informazione per il World Wide Web) sintetizza gli aspetti dell'AI che intervengono durante le fasi di ricerca:
Analizzare i termini di ricerca
L'utente scrive una o più parole nel campo di ricerca. Questa azione, in motori semplici, porta subito il sistema a scandagliare le unità di contenuto in cerca di possibili match, con risultati che possono essere deludenti, soprattutto in caso di ricerca di parole molto generiche. Per fornire un servizio efficace, dobbiamo usare innanzitutto un sistema complesso di analisi linguistica. Ne esistono di due tipi: semantici e comparativi.
L'analisi semantica dei termini si basa sui significati delle parole e sulle regole della logica. Dopo che la parola chiave è stata digitata e immessa, il sistema chiede all'utente di specificare meglio la sua ricerca, offrendogli alcune scelte: è come se facessimo consultare all'utente un dizionario dei sinonimi.
Un esempio sul sito TonyStone.com, un ricchissimo database di immagini.
Se ricerchiamo una parola semplice come "house", il motore di ricerca ci chiede di specificare se intendiamo "casa" come "edificio" oppure come "abitazione": il risultato sarà più vicino alle nostre aspettative.
Questi tipi di filtri di ricerca (query builders) presuppongono l'esistenza di software predefiniti, che analizzano il contenuto delle query per restituire risultati più efficaci.
L'altro tipo di analisi, quello comparativo, è visibile nella vita internettiana di tutti i giorni, infatti è utilizzato dal benemerito Google. Il motore di ricerca confronta tra loro le varianti ricercate simili, per ricondurle al termine maggiormente cercato. Se l'utente digita un nome di persona sbagliando una lettera, il sistema ripropone quello più richiesto, che probabilmente è anche quello esatto. Questa analisi, utilissima per correggere errori di ortografia, utilizza il principio del filtraggio collaborativo (che vedremo meglio più avanti).
Facciamo un esempio: immaginiamo di trasformarci in un adolescente con scarsa conoscenza dell'inglese e un grande amore per una stellina del pop... un po' frettolosamente, ricercheremo informazioni su "britni spirs". Google, con atteggiamento materno, ci indirizza subito al nome esatto: "Forse cercavi "Britney Spears".
Più interessante il caso in cui l'errore di digitazione sia meno macroscopico: ricercando "Brittany Spears", non si ha più la correzione, ma un normale elenco dei risultati. Che cosa è successo?
Questa variante del nome della cantante è sbagliata, ma è ragionevole pensare che molti utenti nel mondo abbiano commesso la stessa svista. Nella logica del motore di ricerca, un termine sbagliato, quando è molto ricercato, diventa "corretto"!
Questi sono dunque gli effetti del filtraggio collaborativo, la creazione di un sistema in cui i vocabolari sono "entità viventi" originate dai comportamenti collettivi di tutti gli utenti.