[Cascavel-pm] Mais_um_dúvida_de_REGEX_!!!
Alceu Rodrigues de Freitas Junior
glasswalk3r em yahoo.com.br
Quinta Maio 6 01:46:11 CDT 2004
Olá monges,
Gostei da idéia do Luis... se os casos de expressão regular começarem a
mudar um pouco, o Solli vai ter que ficar dando manutenção no script.
Eu não tive oportunidade de checar, mas existe algum módulo em Perl que
trabalhe com o algorítmo "bayesian"? Se houver, acho que dá para matar
isso rápido, você apenas vai ter que "treinar" o script no que é um
positivo verdadeiro e o que é falso (como o "foi pro saco amarelo").
Se não houver, vou ser meio herético e sugerir que você dê uma olhada no
Bogofilter ou qualquer outro aplicativo ainda. Mas se não houver mesmo e
você Solli se sentir especialmente disposto em queimar alguns
neurônios, você mesmo poderia escrever um módulo que faça isso. :-)
[]'s
--
Alceu Rodrigues de Freitas Junior
--
glasswalk3r em yahoo.com.br
PGP public key at http://www.imortais.cjb.net/addgb.html
---------------------------------------------------------------
"Procurando o paraíso em vida
conheci a imundice que é viver.
O desamparo da vida é como as flores
que caem nas noites de primavera."
Blade - a lâmina do Imortal
O abominável monge das neves Luis Campos de Carvalho
<lechamps em terra.com.br> em Fri, 07 May 2004 10:57:45 -0300
escreveu:
> Alexandre de Abreu wrote:
> > Assumindo $_
> >
> > if(/foi pro saco/ && !/amarelo/) {
> > print "Boo";
> > }
> >
>
> Se é jogo de adivinhas, a melhor forma de resolver é implementar
> logo
> um rule-based decision engine:
>
> use AI::Categorizer;
>
> # Do Manual:
> # AI::Categorizer is a framework for automatic text categorization.
> # It consists of a collection of Perl modules that implement common
> # categorization tasks, and a set of defined relationships among
> # those modules. The various details are flexible - for example,
> # you can choose what categorization algorithm to use, what
> # features (words or otherwise) of the documents should be
> # used (or how to automatically choose these features), what
> # format the documents are in, and so on.
> __END__
>
> Outra forma de resolver é assim:
>
> open REGEXP, "/path/to/rules.regexp"
> or die;
> foreach $r( <REGEXP> ){ push @rules, qr/$r/; }
> close REGEXP;
>
> # enquanto isso, num pedaço de código nas proximidades...
> open D, '/path/to/data.bin'
> or die;
> local $_;
> DATA: while( <D> ){
> foreach $r ( @rules ){
> if( m/$r/ ){
> push @filtered_data, $_;
> next DATA;
> }
> }
> }
> close D;
>
>
> --
> =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
> Luis Campos de Carvalho is BSc in Comp Science,
> PerlMonk [SiteDocClan], Cascavel-pm Moderator,
> Unix Sys Admin && Certified Oracle DBA
> http://br.geocities.com/monsieur_champs/
> =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
Mais detalhes sobre a lista de discussão Cascavel-pm