Crawler

Disambiguazione – Se stai cercando il veicolo cingolato, vedi Crawler-transporter.
Disambiguazione – Se stai cercando l'album discografico degli Idles, vedi Crawler (album).

Un crawler (detto anche web crawler, spider o robot), è un software con cui di solito un motore di ricerca analizza i contenuti di una rete (o di un database) in un modo metodico e automatizzato. Nello specifico, un crawler è un tipo di bot (programma o script che automatizza delle operazioni), che solitamente acquisisce una copia testuale di tutti i documenti presenti in una o più pagine web creando un indice che ne permetta, successivamente, la ricerca e la visualizzazione.

Un uso estremamente comune dei crawler viene effettuato sul Web; esso si basa su una lista di URL da visitare fornita dal motore di ricerca (il quale, inizialmente, si basa a sua volta sugli indirizzi suggeriti dagli utenti o su una lista precompilata dai programmatori stessi). Durante l'analisi di una URL, identifica tutti i collegamenti ipertestuali presenti nel documento e li aggiunge alla lista di URL da visitare. Il processo può essere concluso manualmente o dopo che un determinato numero di collegamenti è stato seguito.

Inoltre i crawler attivi su Internet hanno la facoltà di essere indirizzati da quanto indicato nel file "robots.txt" posto nella root del sito. All'interno di questo file, è possibile indicare quali pagine non dovrebbero essere analizzate. Il crawler ha la facoltà di seguire i consigli, ma non l'obbligo.

Nomi degli spider dei principali motori di ricerca, aggiornati al 21 febbraio 2008
Crawler Motore di ricerca
Googlebot Google
Fast Fast - Alltheweb
Slurp Inktomi - Yahoo!
Scooter AltaVista
Mercator AltaVista
Ask Jeeves Ask Jeeves
Teoma agent Teoma
Ia archiver Alexa - Internet Archive
Yahoo! Slurp Yahoo
Romilda Facebook
DuckDuckBot DuckDuckGo