[Madrid-pm] Nueva herramienta para procesar la ingente cantidad de textos de la web

Salvador Fandino sfandino en gmail.com
Jue Dic 4 06:15:38 PST 2014


On 12/04/2014 11:05 AM, Salvador Fandino wrote:
>
>
>
>
>> ________________________________
>> From: JJ Merelo <jjmerelo en gmail.com>
>> To: Lista de correo de Madrid Perl Mongers <madrid-pm en pm.org>
>> Sent: Thursday, December 4, 2014 8:11 AM
>> Subject: Re: [Madrid-pm] Nueva herramienta para procesar la ingente cantidad de textos de la web
>>
>>
>>
>
>> Bueno, en expresiones regulares al menos lo es.
>
> Depende. Las expresiones regulares son un mundo en si mismo. Algunas cosas en Perl son muy rápidas, otras no tanto.
>
> El motor de Perl en teoría usa algoritmos que dejan mucho que desear (para poder dar ciertas funcionalidades), y es posible escribir expresiones regulares que resultan en programas con complejidad NP.
>
> Afortunadamente, en la practica lo que se usan son expresiones regulares sencillas que hacen poco uso del backtracking y por eso el rendimiento suele ser muy bueno, porque la implementación si esta micro-optimizado al límite. Tambien, desde hace algunas versiones, es posible usar en Perl motores de expresiones regulares alternativos.

Y lo que digo es irrefutablemente cierto, porque el tercer o cuarto 
enlace que aparece en Google al hacer una búsqueda que ya no recuerdo, 
lleva a un documento escrito por un tío que no conozco que dice lo mismo:

http://swtch.com/~rsc/regexp/regexp1.html

PD: a ver si desde mi direccion de gmail va mejor la cosa...



Más información sobre la lista de distribución Madrid-pm