[Moscow.pm] Парсинг CSV-строк.

Anatoly Sharifulin sharifulin на gmail.com
Пн Май 26 13:59:35 PDT 2008


Ваня, твой пример некорректен, по крайней мере для задачи, которую поставил
автор темы:
> Кроме того, разделитель может встретиться в одном из полей, но это поле в
таком случае будет экранировано кавычками.
> Кавычки в полях тоже экранируются, символами "\".

Либо покажи, как должен "идеальный" CSV-парсер распарсить такую строку.

Я написал вариант парсера, который работает по требованиям автора.
Только, разделить cvs должен быть известным, либо легко определяемым до
процесса разбора.
Смотрим аттач :)

26 мая 2008 г. 22:10 пользователь Ivan B. Serezhkin <ivan на serezhkin.com>
написал:

> Sergey Juchkov wrote:
> > Здравствуйте, Ivan.
> >
> > Вы писали 26 мая 2008 г., 21:05:41:
> >
> >
> >
> >>> уверен? посмотри на мой вариант.
> >>>
> >>>
> > IBS> Он мягко говоря не работает.
> > IBS> "sta"";""mp;"type";"shit"
> > IBS>           [
> > IBS>             '',
> > IBS>             'stamp',
> > IBS>             'type',
> > IBS>             'shit'
> > IBS>           ],
> >
> >
> >   А покажите мне Excel который это распарсит? Вот только не надо
> > придумывать расстановку кавычек от балды, а?
> >
> Эксель слишком туп чтобы с ним сравниваться, а формат csv стандартизирован,
> и мягко говоря не является регулярным языком, что говорит о том, что его
> невозможно распарсить регулярными выражениями, а следовательно и
> детерминированным конечным автоматом
> С другой стороны - pcre - не является регулярными выражениями.
> И то что Монс написал - тоже не ДКА.
>
> --
> Ivan B. Serezhkin
>
> --
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
> http://mail.pm.org/mailman/listinfo/moscow-pm
>



-- 
С уважением,
Анатолий Шарифулин.
----------- следущая часть -----------
Вложение в формате HTML было извлечено&hellip;
URL: http://mail.pm.org/pipermail/moscow-pm/attachments/20080527/91257aaf/attachment.html 
----------- следущая часть -----------
Вложение не в текстовом формате было извлечено&hellip;
Имя     : csv.pl
Тип     : application/octet-stream
Размер  : 882 байтов
Описание: отсутствует
Url     : http://mail.pm.org/pipermail/moscow-pm/attachments/20080527/91257aaf/attachment.obj 


Подробная информация о списке рассылки Moscow-pm