Re: [Grey-Walter] robots.txt y acceso a la información

David Gómez i Fontanills dvd at enlloc.org
Sat Nov 15 00:23:36 CET 2003


Ok, ya lo entiendo. Gracias.
He mirado en google.es/robots.txt y no me parece nada raro. En realidad 
sugieren que los robots no miren todas las páginas que son buscadores 
(generalistas o específicos). Si lo hicieran se retroalimentarian 
inutilmente en una especie de bucle, no?

Están ahí el "search" (google por defecto), el "images", el "groups", etc...

Pues el disallow: unclesam? no parece ser nada del otro mundo. 
Simplemente una cuestión "tecnica", como el resto.

No?

dvd

Lluis wrote:

>On Fri, 14 Nov 2003 01:06:09 +0100
>David Gómez i Fontanills <dvd at enlloc.org> wrote:
>
>  
>
>>Lluís, no te sigo.
>>Qué hay que mirar en
>>
>>http://www.google.es/unclesam ?
>>
>>Y que has mirado google.es/robots?
>>    
>>
>
>Bones David,
>
>tienes que mirar google.es/robots.txt
>
>el archivo robots.txt como bien dice JJ es el archivo que sugiere a los 
>programas "spiders" de los buscadores que no indexen determinados 
>directorios. como a muchos se les habra ocurrido ya, he mirado
>el robots.txt de justamente el gran espiador(google) y sorpresa:
>Disallow: /unclesam?
>
>pruebo google.es/unclesam
>
>todos sabemos quien es el "tio sam" y mas si vemos la bandera americana ;)
>parecia una broma privada pero acabo de leer esto. resulta que es un google 
>filtrado que da resultados sobre .gov/.mil
>
>Google, Inc. also offers Google/Unclesam at http://www.google.com/unclesam, a good tool for finding government information, indexing about 4 million pages found at sites that end in .gov or .mil.   This is a comparable size to its main competitor, usgovsearch, with the advantages that Google/Unclesam is free and offers all the useful searching features of regular Google.
>
>buen fin de semana!
>
>  
>





More information about the Grey-Walter mailing list