[Grey-Walter] [ info ] Mapping Weblog Communities

Lluis lluis at antaviana.net
Sat Jan 17 20:54:16 CET 2004


> Cambiando de tercio. Comentar mi idea sobre el modelo de datos del
> proyecto topact:

Hola Javi,

me parece bien las tablas que propones, sugiero algunos detalles.

La tabla de directorios pasaria a denominarla tabla de nodos porque
hay nodos que son paginas(ver la lista de nodos que pase en
http://sindominio.net/autonomiasituada/proyectos/toppac/Nodes.sxc)
por cierto, para Xabier: como conoces muy bien los nodos de sindominio
(el otro  dia me lo demostraste ;) podrias encargarte de acabar de
completar la lista y establecer la tipologia de los nodos.
En esta tabla que se rellenara con los datos de esta lista una vez 
preparada, sugiero los siguientes campos:

* id 
* nombre del nodo
* Identificacion 1. cadena de texto de identificacion del nodo(directorio o pagina)
esta cadena servira para analizar la url de una pagina y si la cadena
de texto de este campo aparece, sabremos que pertenece a tal
u otro nodo. 
p.ej. este campo se rellenara con "sindominio.net/autonomiasituada"
o en el caso especial de que el nodo sea la pagina de colectivos,
"sindominio.net/colectivos.shtml".
* Identificacion 2.
* Identificacion 3.
-> añado un par de campos mas para detectar el nodo en diversos formatos
de url. Por ejemplo el nodo "Dinero gratis" puede aparecer bajo diferentes
formatos:
http://www.sindominio.net/eldinerogratis/
http://www.eldinerogratis.com/
* tipologia de nodo, igual que el de la lista que he pasado

tabla paginas, tema detectar el idioma, tambien pienso que sera facil 
y sera interesante tener este dato de forma automatizada.

en la tabla pagina_enlaces, añadiria con relacion a lo dicho, dos
campos mas:
* id del nodo del link de origen 
* id del nodo del link de destino
* Tipologia de link 
tipologia=0. El id del nodo de origen y destino, coinciden, por lo
que no tendremos en cuenta este registro ya que solo consideramos 
links hacia fuera de la web donde esta ubicada la pagina.
tipologia=1. buen rollo, el id del nodo de origen y destino se han 
identificado y no coinciden.
tipologia=2. El id del nodo de origen o del nodo de destino no
se ha identificado porque no estan registrados como nodos(p.ej. 
un link a www.barrapunto.com)

a partir de esta tabla se debera generar la matriz para Visone.
Esta matriz tendra el siguiente formato:

>    a b c d...
>a   x x x x
>b   x x x x

donde a,b... son los nodos(cuidadin:no las paginas), y las x aun lo 
tenemos que determinar. quizas de momento para empezar, simplemente 
con 0 y 1, 0 existe link, 1 no hay link. 

> Referers:
> ¿Se puede disponer también de los referers del servidor
> (httpd-access.log? ¿Nos combiene saber desde donde esta linkado
> externamente sindominio, los puntos de entrada?
> 
> Estadisticas:
> ¿Queremos procesar las estadisticas de sindominio? Paginas vistas por
> usuario, ....

de momento disponemos de las estadisticas de webalizer
(http://sindominio.net/webalizer/) para disponer de los ficheros de 
logs para analizarlo con mas detalle, habria supongo que pedir permiso 
a la asamblea.

> Historicos:
> ¿Queremos tener historicos para ver las evoluciones temporales?

yo y Xabier hablamos de este tema, y de momento la idea seria obtener
una "foto" en un momento dado, con eso nos podemos dar por satisfechos. 
Con el tiempo se pueden hacer mas fotos y establecer comparativas.

-- 
Lluis & Pere Rocallaura
=================================================================
Antaviana		:: http://antaviana.net
Astramat		:: http://astramat.com/c/alife.html
Autonomia Situada	:: http://sindominio.net/autonomiasituada
=================================================================






More information about the Grey-Walter mailing list