[Grey-Walter] [pr:topact] extractor enlaces

David Gómez i Fontanills dvd at enlloc.org
Tue Nov 11 19:09:12 CET 2003


Gracias a los dos.
La verdad es que no tenemos ni idea de PERL :-) pero nos lo miraremos.
Por otro lado preferiríamos que la extracción se hiciera de la parte del 
cliente, para no cargar al servidor.

Bueno, gracias otra vez.

dvd.

Jorge Bernal wrote:

>=?ISO-8859-1?Q?David_G=F3mez_i_Fontanills?= dijo:
>
>  
>
>>Alguien sabe si existe un extractor de enlaces (o sea URL que están en
>>la etiqueta <a>) que se pueda hacer funcionar on-line y que esté bajo GPL?
>>O sea, un programa al que le das la URL de una página y te devuelve los
>>enlaces que contiene.
>>Preferentemente realizado en javaScript o Java (lado cliente) y sino en
>>PHP (lado servidor).
>>
>>    
>>
>
>acabo de hacer uno en perl (mucho mas sencillo ;)), lo tienes en:
>http://tux.amedias.org/scripts/enlaces-0.1
>
>usa un modulo de perl llamado HTML::LinkExtor [1] que sirve para eso
>precisamente.
>
>[1] http://search.cpan.org/~gaas/HTML-Parser-3.34/lib/HTML/LinkExtor.pm
>
>No es php, pero seria facil implementarlo como CGI.
>
>PD: uso: ./enlaces-0.1 archivo.html urldebase
>la urldebase es para los links relativos
>
>  
>





More information about the Grey-Walter mailing list