[Grey-Walter] [pr:topact] extractor enlaces

Jorge Bernal koke at sindominio.net
Mon Nov 10 12:44:10 CET 2003


=?ISO-8859-1?Q?David_G=F3mez_i_Fontanills?= dijo:

> Alguien sabe si existe un extractor de enlaces (o sea URL que están en
> la etiqueta <a>) que se pueda hacer funcionar on-line y que esté bajo GPL?
> O sea, un programa al que le das la URL de una página y te devuelve los
> enlaces que contiene.
> Preferentemente realizado en javaScript o Java (lado cliente) y sino en
> PHP (lado servidor).
>

acabo de hacer uno en perl (mucho mas sencillo ;)), lo tienes en:
http://tux.amedias.org/scripts/enlaces-0.1

usa un modulo de perl llamado HTML::LinkExtor [1] que sirve para eso
precisamente.

[1] http://search.cpan.org/~gaas/HTML-Parser-3.34/lib/HTML/LinkExtor.pm

No es php, pero seria facil implementarlo como CGI.

PD: uso: ./enlaces-0.1 archivo.html urldebase
la urldebase es para los links relativos

-- 
"Crearemos una civilización de la Mente en el Ciberespacio. Que sea más
humana
y hermosa que el mundo que vuestros gobiernos han creado antes."
Declaracion de Independencia del ciberespacio

Jorge Bernal (aka Koke)




More information about the Grey-Walter mailing list