[SP-pm] Conceito para fazer busca[ OFF ]

jimmy jimmy.tty at gmail.com
Mon Aug 17 07:44:57 PDT 2009


On Sat, Aug 15, 2009 at 01:02:43PM +0200, Luis Motta Campos wrote:
> jimmy wrote:
> > há algum tempo atrás me passaram esse link:
> > 
> > http://www.unibratec.com.br/jornadacientifica/diretorio/NOVOB.pdf
> > 
> > tentei seguir o algoritmo proposto mas não consegui chegar aos mesmos
> >  resultados do documento.
> > 
> > talvez agregue algo a discussão.
> 
> Jimmy, Nélson, Mantovani,
> 
> Este é o módulo que eu consegui implementar em 3 horas ontem de noite.
> 
> http://www.bitbistro.com/~lmc/Text-BuscaBR-0.01.tar.gz
> 
> Eu tenho um problema: as regras que tem de ser aplicadas não podem ser
> executadas como expressões regulares, apenas. Elas se comportam como uma
> gramática regular, e se reduzem umas às outras conforme a análise
> acontece. Isso quer dizer que a implementação corrente não é boa, está
> QUEBRADA.
> 
> Eu vou trabalhar numa versão iterativa capaz de reduzir as produções
> propostas pelo Lucena -- o informalismo do paper não está me ajudando
> nada a entender a tabela principal do algorítmo, no passo #3.
> 
> Será que alguém aqui tem contato com o Lucena, e pode me apresentar?
> Seria bom conversar com ele. Eu tenho observações e correções para fazer
> no algorítmo, também.
> 
> Putamplexos.
> -- 
> Luis Motta Campos is a software engineer,
> Perl Programmer, foodie and photographer.
> _______________________________________________

rodei o módulo com tabela comparativa do documento pdf entre Soundex e
BuscaBR e as divergênncias que obtive foram:

-------------------------------------------
BUGIGANGA -> BJG    | BUGIGANGA -> BJGG
BUNGINGANGA -> BJG  | BUNGINGANGA -> BJGG
COMENDO -> KM       | COMENDO -> KMMD
COMENO -> KM        | COMENO -> KMM
CONTLATO -> KMT     | CONTLATO -> KMTT
CONTRATO -> KMT     | CONTRATO -> KMTT
ESCEDER -> SD       | ESCEDER -> SSD
ESTRUPO -> TP       | ESTRUPO -> TRP
EXCEDER -> SD       | EXCEDER -> SSD
KUBITSCHECK -> KBSK | KUBITSCHECK -> KBSSK
LUMINAR -> RM       | LUMINAR -> RMM
PERSPECTIVA -> PSPT | PERSPECTIVA -> PSPTV
PESPECTIVA -> PSPT  | PESPECTIVA -> PSPTV
RUMINAR -> RM       | RUMINAR -> RMM
-------------------------------------------

por hora meu nível não permite sugerir nada interessante, mas vou
continuar tentando ajudar.

agradeço sua iniciativa Luis.


-- 
"Não manejo bem as palavras
Mas manipulo bem as strings."
------------------------------


More information about the SaoPaulo-pm mailing list