Tra i software e i servizi open source per webmaster meno noti al grande pubblico ve ne sono alcuni che hanno raggiunto una stabilità e un grado di sviluppo tale da poter essere utilizzati anche in ambienti di lavoro professionali.
In questo articolo parleremo di un software di facile installazione e utilizzo che potrebbero essere utilizzato in modo proficuo in qualsiasi sito Web, anche di grandi dimensioni. Aspseek (http://www.aspseek.org), questo il software, è un motore di ricerca dotato di moltissime funzionalità, affidabile e del tutto personalizzabile.
Aspseek, di cui si attende a breve il rilascio della versione 1.2.11, è un motore di ricerca rilasciato sotto licenza GPL dallo sviluppatore russo Kir Kolyshkin. Aspseek è disponibile solo per piattaforme Linux dotate di un database a scelta fra MySQL o Oracle 8 e la sua interfaccia Web si basa su uno script cgi invocato direttamente dalla pagina di ricerca. Il funzionamento del software è simile a quello di qualsiasi altro motore di ricerca: un modulo (chiamato index) si occupa di ritirare le pagine Web e di indicizzarle all'interno del database, un altro modulo (chiamato searchd) si occupa invece di gestire le interrogazioni degli utenti e di mostrare a video i risultati.
Le due principali caratteristiche di Aspseek sono la velocità di indicizzazione e la precisione nelle ricerche, oltre che la completa personalizzazione dell'interfaccia di ricerca e dei risultati. Il codice è ottimizzato per la gestione di siti multipli in modo da poter indicizzare con velocità e efficacia anche diversi milioni di pagine. Il motore di Aspseek, per fare un esempio, impiega poco più di dieci minuti per indicizzare 20 mila pagine del network di HTML.it.
La precisione delle ricerche viene garantita da un algoritmo di valutazione molto simile al pagerank di Google (cfr. Articolo:Il pagerank di Google): ad ogni pagina viene attribuito un valore in base sia alla sua pertinenza con il termine ricercato sia in base al numero di link che giungono a quella pagina. Il risultato è un'ottima rilevanza dei risultati in un breve tempo di ricerca.
Anche la personalizzazione è molto ben curata. E' possibile infatti modificare e integrare con il proprio sito Web qualsiasi elemento della pagina: dai risultati ai link di navigazione. In più è anche molto facile gestire diversi 'templatè per diverse zone del sito in modo da decentralizzare le ricerche.
Ultime, ma non per importanza, sono le molte funzioni di ricerca e le molte impostazioni che il software riesce a gestire. Tra le ricerche sono comprese quasi tutte le combinazioni possibili: ricerca per un solo sito, ricerca solo per frase esatta, esclusione di parole ecc. Le impostazioni prevedono la gestione di una lista di 'stopwords', ossia parole troppo generiche da escludere dalla ricerca, supporto per gli errori di grammatica tramite il modulo ispell, gestione dei file PDF e RTF, supporto per caratteri cirillici e accentati.
Anche dal punto di vista del supporto Aspseek è uno strumento completo: oltre al preciso manuale che può essere visionato direttamente online in molti formati, vi sono una mailing list e un forum ben frequentati. Il ritmo dei rilasci di nuove versioni è buono anche se nell'ultimo periodo sembra un pò rallentato. Il prossimo passo sarà il rilascio della versione 1.3 in cui si prevede, tra le altre cose, il supporto al PHP, supporto che può comunque essere aggiunto già alle versioni distribuite attarverso una patch messa a disposizione da un collaboratore del progetto.
Installazione e Configurazione
L'installazione e la successiva configurazione di Aspseek potrebbero, in alcuni sistemi, risultare difficoltose, tuttavia la documentazione e il supporto offerto dalle mailing list e dal forum sono in grado di risolvere la maggior parte dei problemi. Per le distribuzioni che supportano i pacchetti RPM vi è già un archivio disponibile sulla pagina di download del sito ufficiale. Basta scaricarlo ed installarlo con il solito comando
lnxbox1:~# rpm -Uvh nomefile.rpm
Per chi invece ha una distribuzione Debian è possibile o scaricare il pacchetto .deb disponibile sempre sul sito ufficiale (alla pagina di download per Debian) ed installarlo con la solita sintassi
lnxbox1:~# dpkg -i nomefile.deb
oppure utilizzare apt (consigliabile). Per usare apt basta aggiungere al file /etc/apt/sources.list la seguente riga che indica al sistema dove cercare i pacchetti del software:
deb http://www.aspseek.org/pkg/deb/aspseek-libmysqlclient10 woody aspseek
riaggiornare apt e installare aspseek con i comandi in sequenza:
lnxbox1:~# apt-get update && apt-get install aspseek && apt-get install aspseek-cgi
Una volta installato il sistema è necessario personalizzare i due file di cofigurazione aspseek.conf e searchd.conf con le impostazioni che si desidera. Ogni riga dei due file è ampiamente commentata negli ottimi manuali.
A questo punto non rimane altro da fare che lanciare il motore, personalizzare le pagine dei risultati e effettuare la prima ricerca.