[Grey-Walter] [pr:topact] extractor enlaces
Jorge Bernal
koke at sindominio.net
Mon Nov 10 12:44:10 CET 2003
=?ISO-8859-1?Q?David_G=F3mez_i_Fontanills?= dijo:
> Alguien sabe si existe un extractor de enlaces (o sea URL que están en
> la etiqueta <a>) que se pueda hacer funcionar on-line y que esté bajo GPL?
> O sea, un programa al que le das la URL de una página y te devuelve los
> enlaces que contiene.
> Preferentemente realizado en javaScript o Java (lado cliente) y sino en
> PHP (lado servidor).
>
acabo de hacer uno en perl (mucho mas sencillo ;)), lo tienes en:
http://tux.amedias.org/scripts/enlaces-0.1
usa un modulo de perl llamado HTML::LinkExtor [1] que sirve para eso
precisamente.
[1] http://search.cpan.org/~gaas/HTML-Parser-3.34/lib/HTML/LinkExtor.pm
No es php, pero seria facil implementarlo como CGI.
PD: uso: ./enlaces-0.1 archivo.html urldebase
la urldebase es para los links relativos
--
"Crearemos una civilización de la Mente en el Ciberespacio. Que sea más
humana
y hermosa que el mundo que vuestros gobiernos han creado antes."
Declaracion de Independencia del ciberespacio
Jorge Bernal (aka Koke)
More information about the Grey-Walter
mailing list