[Grey-Walter] [ info ] Mapping Weblog Communities
NOCREYENTES
NOCREYENTES at terra.es
Wed Jan 14 20:55:51 CET 2004
Me acabo de dar cuenta de una capa que es muy dificil de estudiar.
Ejemplo, yo personalmente a parte de esta lista a veces visito
barrapunto, losgenoveses.net, el blog con las paranoyas de un compi del
curro. A veces suelto una paranoya en el blog de mi compi y luego veo
que postea algo parecido en barrapunto u otras combinaciones parecidas.
Supongo que solo analizando el contenido podrías ver este tipo de
"enlaces", en los que tienes la idea en la cabeza pero no la cita.
Al fin y al cabo todos somos portadores de informacion y vamos
polinizando a nuestro paso (en mayor o menor medida). ¿Como se podría
estudiar este efecto?
Cambiando de tercio. Comentar mi idea sobre el modelo de datos del
proyecto topact:
Tabla protocolo:
id: Identificador
protocolo: Nombre de protocolo. (http, ftp, ...)
Tabla host:
id: Identificador
host: Nombre del host. (en pincipio creo que solo tendremos sindominio.net)
Tabla directorio:
id: Identificador
directorio: Directorio de la url. Esta en una tabla aparte porque un
directorio se repite para muchos nodos y creo que es correcto.
Tabla pagina:
id: Identificador
url_protocolo-> protocolo.id (se guarda el id. el valor esta en la tabla
relacionada)
url_host-> host.id
url_directorio-> directorio.id (Teniendolo de esta forma es sencillo
agrupar por directorio)
url_fichero: Texto con lo que falta para completar la URL caso de
estudio. Se almacena partida por rendimiento, que las busquedas en texto
son tediosas hasta para el ordenador.
idioma-> idioma.id (Creo que va a ser facil averiguar el idioma de una
pagina y puede resultar interesante)
titulo-> Obtenido del tag html tittle
archivo_local->ruta donde tenemos el fichero descargado con el httrack
tabla pagina_enlaces:
pagina_origen -> pagina.id (apunta a la pagina de la que queremos saber
los links)
pagina_destino -> pagina.is (apunta a una pagina linkada desde la anterior)
En resumen:
1- Se correria el httrack
2- Se haria una primera pasada para rellenar el campo url_XXX de la
tabla pagina y el archivo local
3- Se parsearian las paginas y se rellenaria el titulo, idioma de la
tabla pagina y la tabla pagina_enlaces
4- Se podrían ejecutar consultas y generar los ficheros para ver los
datos con el visone o similar. El formato parece bastante simple.
Referers:
¿Se puede disponer también de los referers del servidor
(httpd-access.log? ¿Nos combiene saber desde donde esta linkado
externamente sindominio, los puntos de entrada?
Estadisticas:
¿Queremos procesar las estadisticas de sindominio? Paginas vistas por
usuario, ....
Historicos:
¿Queremos tener historicos para ver las evoluciones temporales?
Un saludo:
Javi
----- Mensaje Original -----
De: Juan Julian Merelo Guervos <jmerelo at geneura.ugr.es>
Fecha: Miercoles, Enero 14, 2004 9:55 am
Asunto: Re: [Grey-Walter] [ info ] Mapping Weblog Communities
> Hola,
>
>
> > > forma independiente del contexto. En el mundo de los weblogs
> el analisis
> > > de la conectividad es doblemente interesante porque esta es
> muy rica, tiene
> > > los links en los posts, que ya quisieramos ver en los medios
> convencionales,> > y tiene tradiciones como el blogroll. los links
> en el blogroll marcan
> > > una conectividad como mas intemporal y estructural, y los
> links en los posts
> > > una conectividad que es una muestra viva del estado de la red
> blogosferica> > en un determinado espacio de tiempo, de la
> dinamica de la red.
> >
> > En eso no conseguimos ponernos de acuerdo JJ y yo ;)
> > En ese estudio no está considerado el blogroll (de hecho,
> seguramente> sería interesante añadir esa información, a ver si
> salían diferencias).
>
> El problema con el blogroll es que es difícil diferenciarlo del
> resto de
> la basurilla hipertextual que pulula por ahí. En realidad, la
> diferenciano es si considerar el blogroll o no, sino si considerar
> historias solo
> (como se hace en este estudio), o considerar toda la fuente de la
> página, en cuyo caso hay que hacer una labor de filtrado bastante
> gordapara quitarse de enmedio feeds, enlaces a comentarios, y
> cosas por el
> estilo.
>
>
> > > como contrapartida a lo dicho, y creo que estaremos de
> acuerdo, la
> > > conectividad via links es solo una "capa" de las multiples
> capas de
> > > conectividad que tiene
> >
> > Somos multidimensionales: correo, comentarios, conversaciones,
> teléfono> ... no se puede mirar todo ;)
>
> Bueno, pero se trata de que todas son manifestaciones de una red
> social,y de que los enlaces, que son medibles y patentes, ponen de
> manifiestoesa red social.
>
> JJ
> --
> Atalaya => http:
> BloJJ, English weblog => http://blojj.blogalia.com
> JJ Merelo => http://geneura.ugr.es/~jmerelo
>
> _______________________________________________
> Grey-Walter mailing list
> Grey-Walter at listas.sindominio.net
> https://listas.sindominio.net/mailman/listinfo/grey-walter
>
More information about the Grey-Walter
mailing list