[Cascavel-pm] Parse de Endereço (Was: Re: Separando campos)

Gabriel Vieira gabriel.vieira em gmail.com
Terça Março 20 10:29:17 PDT 2007


---------------------8<---------------------
$num = 'sem numero|sn|s/n|sem número|sem
num|numero|número|num|no|nº|n°|núm|n\.|n\.:';

$endereco = "AV 29 JUNHO 00602";
$endereco = "R MARGARIDAS 13 QD8 C 13";
$endereco = "Acesso 27 14 1o andar";
$endereco = "Av Santa Barbara do Oeste sem numero";

print "Tipo: $1\nLogradouro: $2\nNúmero: $3\nComplemento: $7" if
$endereco =~ /^(\w+)\s+([\s\w]+?)\s+(($num)?(\d+)?)(\s+(.+?))?$/i;
--------------------->8---------------------

Acho que já dá um caldo... :)
Só estruturar melhor.. utilizar hashs... permitir caracteres acentuados...
pegar a lista nos correios dos "Tipos" existentes... e possivelmente algo
mais :P

Pode ser útil: http://www.equacao.com.br/auditoria/auditoria.html


Abraços,


On 3/20/07, Gabriel Vieira <gabriel.vieira em gmail.com> wrote:
>
> Na verdade "Acesso" é um tipo.
> To começando a achar que não é tão difícil assim :D
>
>
> On 3/20/07, Daniel Ruoso < daniel em ruoso.com> wrote:
> >
> > Ter, 2007-03-20 às 16:21 +0000, Igor Sutton Lopes escreveu:
> > > Acesso 27 14 1o andar
> >
> > Como eu disse pessoalmente ;), acho que podemos fazer escolhas para
> > tentar achar o best match. Vale lembrar que nesse caso é difícil até
> > para um ser humano saber :). Na verdade o carteiro daria na sua cara se
> > você não colocar nem uma vírgula aí :)... O mais provavel seria entender
> > como
> >
> > Tipo Logradouro: undef
> > Logradouro: Acesso
> > Número: 27
> > Complemento: 14 1o andar
> >
> > Mas podemos ter fé e achar que a figura vai colocar uma vírgula
> >
> > Acesso 27, 14 1o. andar
> >
> > O que nos dá uma boa ancora:
> >
> > Tipo Logradouro: undef
> > Logradouro: Acesso 27
> > Número: 14
> > Complemento: 1o. andar
> >
> > > Av. Santa Bárbara do Oeste sem número
> >
> > Esse é um exemplo de boa âncora, por que existe um número limitado de
> > possíveis escritas para "sem número"...
> >
> > daniel
> >
> > _______________________________________________
> > Cascavel-pm mailing list
> > Cascavel-pm em pm.org
> > http://mail.pm.org/mailman/listinfo/cascavel-pm
> >
>
>
>
> --
> Gabriel Vieira




-- 
Gabriel Vieira
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: http://mail.pm.org/pipermail/cascavel-pm/attachments/20070320/5ce5bbad/attachment.html 


Mais detalhes sobre a lista de discussão Cascavel-pm