[Cascavel-pm] Mais_um_dúvida_de_REGEX_!!!

Alceu Rodrigues de Freitas Junior glasswalk3r em yahoo.com.br
Quinta Maio 6 01:46:11 CDT 2004


Olá monges,

Gostei da idéia do Luis... se os casos de expressão regular começarem a
mudar um pouco, o Solli vai ter que ficar dando manutenção no script.
Eu não tive oportunidade de checar, mas existe algum módulo em Perl que
trabalhe com o algorítmo "bayesian"? Se houver, acho que dá para matar
isso rápido, você apenas vai ter que "treinar" o script no que é um
positivo verdadeiro e o que é falso (como o "foi pro saco amarelo").
Se não houver, vou ser meio herético e sugerir que você dê uma olhada no
Bogofilter ou qualquer outro aplicativo ainda. Mas se não houver mesmo e
você Solli se sentir especialmente disposto em queimar alguns
neurônios, você mesmo poderia escrever um módulo que faça isso. :-)

[]'s


-- 
Alceu Rodrigues de Freitas Junior
--
glasswalk3r em yahoo.com.br
PGP public key at http://www.imortais.cjb.net/addgb.html
---------------------------------------------------------------
"Procurando o paraíso em vida
conheci a imundice que é viver.
O desamparo da vida é como as flores
que caem nas noites de primavera." 
                                 Blade - a lâmina do Imortal



O abominável monge das neves Luis Campos de Carvalho
<lechamps em terra.com.br> em Fri, 07 May 2004 10:57:45 -0300 
escreveu:

> Alexandre de Abreu wrote:
> > Assumindo $_
> > 
> > if(/foi pro saco/ && !/amarelo/) {
> >   print "Boo";
> > }
> > 
> 
>    Se é jogo de adivinhas, a melhor forma de resolver é implementar
>    logo 
> um rule-based decision engine:
> 
>    use AI::Categorizer;
> 
> # Do Manual:
> # AI::Categorizer is a framework for automatic text categorization.
> # It consists of a collection of Perl modules that implement common
> # categorization tasks, and a set of defined relationships among
> # those modules. The various details are flexible - for example,
> # you can choose what categorization algorithm to use, what
> # features (words or otherwise) of the documents should be
> # used (or how to automatically choose these features), what
> # format the documents are in, and so on.
>    __END__
> 
>    Outra forma de resolver é assim:
> 
>    open REGEXP, "/path/to/rules.regexp"
>      or die;
>    foreach $r( <REGEXP> ){ push @rules, qr/$r/; }
>    close REGEXP;
> 
>    # enquanto isso, num pedaço de código nas proximidades...
>    open D, '/path/to/data.bin'
>      or die;
>    local $_;
>    DATA: while( <D> ){
>      foreach $r ( @rules ){
>        if( m/$r/ ){
>          push @filtered_data, $_;
>          next DATA;
>        }
>      }
>    }
>    close D;
> 
> 
> -- 
> =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
>    Luis Campos de Carvalho is BSc in Comp Science,
>    PerlMonk [SiteDocClan], Cascavel-pm Moderator,
>    Unix Sys Admin && Certified Oracle DBA
>    http://br.geocities.com/monsieur_champs/
> =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=



Mais detalhes sobre a lista de discussão Cascavel-pm