Spindel (internet)

Ett felmeddelande om att Wayback Machines spindel inte kan utföra sitt jobb på grund av Facebooks robots.txt-fil.

En spindel är ett datorprogram som automatiskt hämtar webbsidor från webben och hittar nya sidor att hämta genom att följa hyperlänkarna i sidorna vidare. Spindlar används exempelvis av sökmotorer som Google för att skapa och hålla uppdaterat sitt index över innehållet på webben. Dessa spindlar söker igenom allt på de webbsidor de hittar till, om inte domänen i fråga innehåller en special textfil som ger vissa kommandon åt dessa spindlar. Denna fil brukar kallas robots.txt och kan utesluta delar eller hela hemsidor.

Om en spindel inte hittar något kan det bero på att filen robots.txt inte tillåter spindeln att indexera sidan, eller att spindeln inte kan hitta till sidan på grund av brist på hyperlänkar.

Media som används på denna webbplats

Question book-4.svg
Författare/Upphovsman: Tkgd2007, Licens: CC BY-SA 3.0
A new incarnation of Image:Question_book-3.svg, which was uploaded by user AzaToth. This file is available on the English version of Wikipedia under the filename en:Image:Question book-new.svg
Robots(dot)txt.png
A message about the crawler not being able to do its work due to robots.txt. The screenshot is from the Wayback Machine trying to crawl Facebook.com.