[Grey-Walter] [ info ] Mapping Weblog Communities
Lluis
lluis at antaviana.net
Sat Jan 17 20:54:16 CET 2004
> Cambiando de tercio. Comentar mi idea sobre el modelo de datos del
> proyecto topact:
Hola Javi,
me parece bien las tablas que propones, sugiero algunos detalles.
La tabla de directorios pasaria a denominarla tabla de nodos porque
hay nodos que son paginas(ver la lista de nodos que pase en
http://sindominio.net/autonomiasituada/proyectos/toppac/Nodes.sxc)
por cierto, para Xabier: como conoces muy bien los nodos de sindominio
(el otro dia me lo demostraste ;) podrias encargarte de acabar de
completar la lista y establecer la tipologia de los nodos.
En esta tabla que se rellenara con los datos de esta lista una vez
preparada, sugiero los siguientes campos:
* id
* nombre del nodo
* Identificacion 1. cadena de texto de identificacion del nodo(directorio o pagina)
esta cadena servira para analizar la url de una pagina y si la cadena
de texto de este campo aparece, sabremos que pertenece a tal
u otro nodo.
p.ej. este campo se rellenara con "sindominio.net/autonomiasituada"
o en el caso especial de que el nodo sea la pagina de colectivos,
"sindominio.net/colectivos.shtml".
* Identificacion 2.
* Identificacion 3.
-> añado un par de campos mas para detectar el nodo en diversos formatos
de url. Por ejemplo el nodo "Dinero gratis" puede aparecer bajo diferentes
formatos:
http://www.sindominio.net/eldinerogratis/
http://www.eldinerogratis.com/
* tipologia de nodo, igual que el de la lista que he pasado
tabla paginas, tema detectar el idioma, tambien pienso que sera facil
y sera interesante tener este dato de forma automatizada.
en la tabla pagina_enlaces, añadiria con relacion a lo dicho, dos
campos mas:
* id del nodo del link de origen
* id del nodo del link de destino
* Tipologia de link
tipologia=0. El id del nodo de origen y destino, coinciden, por lo
que no tendremos en cuenta este registro ya que solo consideramos
links hacia fuera de la web donde esta ubicada la pagina.
tipologia=1. buen rollo, el id del nodo de origen y destino se han
identificado y no coinciden.
tipologia=2. El id del nodo de origen o del nodo de destino no
se ha identificado porque no estan registrados como nodos(p.ej.
un link a www.barrapunto.com)
a partir de esta tabla se debera generar la matriz para Visone.
Esta matriz tendra el siguiente formato:
> a b c d...
>a x x x x
>b x x x x
donde a,b... son los nodos(cuidadin:no las paginas), y las x aun lo
tenemos que determinar. quizas de momento para empezar, simplemente
con 0 y 1, 0 existe link, 1 no hay link.
> Referers:
> ¿Se puede disponer también de los referers del servidor
> (httpd-access.log? ¿Nos combiene saber desde donde esta linkado
> externamente sindominio, los puntos de entrada?
>
> Estadisticas:
> ¿Queremos procesar las estadisticas de sindominio? Paginas vistas por
> usuario, ....
de momento disponemos de las estadisticas de webalizer
(http://sindominio.net/webalizer/) para disponer de los ficheros de
logs para analizarlo con mas detalle, habria supongo que pedir permiso
a la asamblea.
> Historicos:
> ¿Queremos tener historicos para ver las evoluciones temporales?
yo y Xabier hablamos de este tema, y de momento la idea seria obtener
una "foto" en un momento dado, con eso nos podemos dar por satisfechos.
Con el tiempo se pueden hacer mas fotos y establecer comparativas.
--
Lluis & Pere Rocallaura
=================================================================
Antaviana :: http://antaviana.net
Astramat :: http://astramat.com/c/alife.html
Autonomia Situada :: http://sindominio.net/autonomiasituada
=================================================================
More information about the Grey-Walter
mailing list