[Grey-Walter] robots.txt y acceso a la información
Lluis
lluis at antaviana.net
Fri Nov 14 23:27:37 CET 2003
On Fri, 14 Nov 2003 01:06:09 +0100
David Gómez i Fontanills <dvd at enlloc.org> wrote:
> Lluís, no te sigo.
> Qué hay que mirar en
>
> http://www.google.es/unclesam ?
>
> Y que has mirado google.es/robots?
Bones David,
tienes que mirar google.es/robots.txt
el archivo robots.txt como bien dice JJ es el archivo que sugiere a los
programas "spiders" de los buscadores que no indexen determinados
directorios. como a muchos se les habra ocurrido ya, he mirado
el robots.txt de justamente el gran espiador(google) y sorpresa:
Disallow: /unclesam?
pruebo google.es/unclesam
todos sabemos quien es el "tio sam" y mas si vemos la bandera americana ;)
parecia una broma privada pero acabo de leer esto. resulta que es un google
filtrado que da resultados sobre .gov/.mil
Google, Inc. also offers Google/Unclesam at http://www.google.com/unclesam, a good tool for finding government information, indexing about 4 million pages found at sites that end in .gov or .mil. This is a comparable size to its main competitor, usgovsearch, with the advantages that Google/Unclesam is free and offers all the useful searching features of regular Google.
buen fin de semana!
--
Lluis & Pere Rocallaura
=================================================================
Antaviana :: http://antaviana.net
Astramat :: http://astramat.com/c/alife.html
Autonomia Situada :: http://sindominio.net/autonomiasituada
=================================================================
More information about the Grey-Walter
mailing list