[SP-pm] RES: REGEXP: altera X alteração

Fernando fernandolouis at terra.com.br
Tue Aug 17 10:33:21 PDT 2010


Obrigado!

Tem gente aqui, que quando surge uma dúvida "fácil", pensa: ahhh, ele que se
vire... RTFM!

Mas se alguém já passou pela mesma necessidade, não custa nada compartilhar.

Agradeço mais uma vez ao Adriano Ferreira, e também ao... desculpe, não
lembro de quem me informou sobre o "use locale;"

Att.
Fernando

-----Mensagem original-----
De: saopaulo-pm-bounces+fernandolouis=terra.com.br em pm.org
[mailto:saopaulo-pm-bounces+fernandolouis=terra.com.br em pm.org] Em nome de
Adriano Ferreira
Enviada em: terça-feira, 17 de agosto de 2010 13:58
Para: saopaulo-pm em mail.pm.org
Assunto: Re: [SP-pm] REGEXP: altera X alteração

2010/8/17 Fernando <fernandolouis em terra.com.br>:
> A regexp abaixo reconhece "altera", mas não reconhece "alteração". Por
que?
>

Porque o seu string não é utf8, e neste caso 'ç' e 'ã' não combinam com \w.

Mas

pirl @> use utf8; $s = 'alteração '         i;
"altera\xE7\xE3o "
pirl @> $s =~ s/(altera\w*)/<b>$1<\/b>/gi; $s
"<b>altera\xE7\xE3o</b> "

funciona. O "use utf8" pode ajudá-lo se as suas strings estão no
código fonte, mas no caso de outros tipos de entrada (arquivos e
terminal, por exemplo), você terá de força-los a serem utf8: mexendo
com o "encoding" do glob associado ou usando funções como
utf8::decode() ou Encode::decode_utf8().

Saudações,
Adriano
_______________________________________________
SaoPaulo-pm mailing list
SaoPaulo-pm em pm.org
http://mail.pm.org/mailman/listinfo/saopaulo-pm



More information about the SaoPaulo-pm mailing list