[Grey-Walter] [ info ] Mapping Weblog Communities

NOCREYENTES NOCREYENTES at terra.es
Wed Jan 14 20:55:51 CET 2004


Me acabo de dar cuenta de una capa que es muy dificil de estudiar.
Ejemplo, yo personalmente a parte de esta lista a veces visito
barrapunto, losgenoveses.net, el blog con las paranoyas de un compi del
curro. A veces suelto una paranoya en el blog de mi compi y luego veo
que postea algo parecido en barrapunto u otras combinaciones parecidas.
Supongo que solo analizando el contenido podrías ver este tipo de
"enlaces", en los que tienes la idea en la cabeza pero no la cita.

Al fin y al cabo todos somos portadores de informacion y vamos
polinizando a nuestro paso (en mayor o menor medida). ¿Como se podría
estudiar este efecto?

Cambiando de tercio. Comentar mi idea sobre el modelo de datos del
proyecto topact:

Tabla protocolo:
id: Identificador
protocolo: Nombre de protocolo. (http, ftp, ...)

Tabla host:
id: Identificador
host: Nombre del host. (en pincipio creo que solo tendremos sindominio.net)

Tabla directorio:
id: Identificador
directorio: Directorio de la url. Esta en una tabla aparte porque un
directorio se repite para muchos nodos y creo que es correcto.

Tabla pagina:
id: Identificador
url_protocolo-> protocolo.id (se guarda el id. el valor esta en la tabla
relacionada)
url_host-> host.id
url_directorio-> directorio.id (Teniendolo de esta forma es sencillo
agrupar por directorio)
url_fichero: Texto con lo que falta para completar la URL caso de
estudio. Se almacena partida por rendimiento, que las busquedas en texto
son tediosas hasta para el ordenador.
idioma-> idioma.id (Creo que va a ser facil averiguar el idioma de una
pagina y puede resultar interesante)
titulo-> Obtenido del tag html tittle
archivo_local->ruta donde tenemos el fichero descargado con el httrack

tabla pagina_enlaces:
pagina_origen -> pagina.id (apunta a la pagina de la que queremos saber
los links)
pagina_destino -> pagina.is (apunta a una pagina linkada desde la anterior)

En resumen:
1- Se correria el httrack
2- Se haria una primera pasada para rellenar el campo url_XXX de la
tabla pagina y el archivo local
3- Se parsearian las paginas y se rellenaria el titulo, idioma de la
tabla pagina y la tabla pagina_enlaces
4- Se podrían ejecutar consultas y generar los ficheros para ver los
datos con el visone o similar. El formato parece bastante simple.

Referers:
¿Se puede disponer también de los referers del servidor
(httpd-access.log? ¿Nos combiene saber desde donde esta linkado
externamente sindominio, los puntos de entrada?

Estadisticas:
¿Queremos procesar las estadisticas de sindominio? Paginas vistas por
usuario, ....

Historicos:
¿Queremos tener historicos para ver las evoluciones temporales?

Un saludo:

Javi

----- Mensaje Original -----
De: Juan Julian Merelo Guervos <jmerelo at geneura.ugr.es>
Fecha: Miercoles, Enero 14, 2004 9:55 am
Asunto: Re: [Grey-Walter] [ info ] Mapping Weblog Communities

> Hola,
> 
> 
> > > forma independiente del contexto. En el mundo de los weblogs 
> el analisis
> > > de la conectividad es doblemente interesante porque esta es 
> muy rica, tiene
> > > los links en los posts, que ya quisieramos ver en los medios 
> convencionales,> > y tiene tradiciones como el blogroll. los links 
> en el blogroll marcan
> > > una conectividad como mas intemporal y estructural, y los 
> links en los posts
> > > una conectividad que es una muestra viva del estado de la red 
> blogosferica> > en un determinado espacio de tiempo, de la 
> dinamica de la red.
> > 
> > En eso no conseguimos ponernos de acuerdo JJ y yo ;)
> > En ese estudio no está considerado el blogroll (de hecho, 
> seguramente> sería interesante añadir esa información, a ver si 
> salían diferencias).
> 
> El problema con el blogroll es que es difícil diferenciarlo del 
> resto de
> la basurilla hipertextual que pulula por ahí. En realidad, la 
> diferenciano es si considerar el blogroll o no, sino si considerar 
> historias solo
> (como se hace en este estudio), o considerar toda la fuente de la
> página, en cuyo caso hay que hacer una labor de filtrado bastante 
> gordapara quitarse de enmedio feeds, enlaces a comentarios, y 
> cosas por el
> estilo.
> 
> 
> > > como contrapartida a lo dicho, y creo que estaremos de 
> acuerdo, la
> > > conectividad via links es solo una "capa" de las multiples 
> capas de
> > > conectividad que tiene
> > 
> > Somos multidimensionales: correo, comentarios, conversaciones, 
> teléfono> ... no se puede mirar todo ;)
> 
> Bueno, pero se trata de que todas son manifestaciones de una red 
> social,y de que los enlaces, que son medibles y patentes, ponen de 
> manifiestoesa red social.
> 
> JJ
> -- 
> Atalaya => http:
> BloJJ, English weblog => http://blojj.blogalia.com
> JJ Merelo => http://geneura.ugr.es/~jmerelo
> 
> _______________________________________________
> Grey-Walter mailing list
> Grey-Walter at listas.sindominio.net
> https://listas.sindominio.net/mailman/listinfo/grey-walter
> 





More information about the Grey-Walter mailing list