[Moscow.pm] туплю с регуляркой , если кто знает , помогите плиз: как заменить бэкслэш на слэш?

Dmitry Arsentiev dmarsentev на gmail.com
Пт Ноя 7 00:37:39 PST 2008


> Я так понимаю, речь про парсинг HTML или XML.
Вы правы.
Корейские тексты, грязный html с вкраплениями VML и ещё какого-то мусора.


> Советую посмотреть в сторону, например, HTML::TokeParser или XML::Parser.
> Парсить html/xml регэкспами - не лучший подход. (хотя конечно смотря
> какая задача)
Спасибо за совет, Владимир.
В условиях сжатых сроков рука тянется к самой надёжной
из всех зыбких возможностей, предоставляемых перлом: к регулярке.

> PS: За my $a следует надавать по шапке. perldoc perlvar
Да, вы правы. Спасибо что не в зуб.

PS Ваш замечательный доклад по utf8 (UTF-8) обретёт ли форму статьи,
в которой лично я так остро нуждаютсь?


7 ноября 2008 г. 2:16 пользователь Vladimir V. Perepelitsa
<inthrax на gmail.com> написал:
> 2008/11/7 Dmitry Arsentiev <dmarsentev на gmail.com>:
>>> А обязательно иметь весь файл целиком в памяти?
>>> По-помоему, построчно-последовательная обработка файла
>>> намного эффективнее.
>>
>> Максим, спасибо, наверное построчно эффективнее, но не в моём случае.
>>
>> Мне нет смысла считывать и обрабатывать только одну строку,
>> потому что по строкам разбросаны разные теги и псевдотеги,
>> на одной строке тег открылся,
>> через 10 строк закрылся,  из его нутра надо что-то выцепить и обработать.
>> Вобщем, не мой случай.
>
> Я так понимаю, речь про парсинг HTML или XML.
> Советую посмотреть в сторону, например, HTML::TokeParser или XML::Parser.
> Парсить html/xml регэкспами - не лучший подход. (хотя конечно смотря
> какая задача)
>
> PS: За my $a следует надавать по шапке. perldoc perlvar
>
> --
> Best wishes,
> Vladimir V. Perepelitsa aka Mons <inthrax на gmail.com>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
>


Подробная информация о списке рассылки Moscow-pm