[Moscow.pm] Чем правильно парсить xlsx

Natalya wwax555 на gmail.com
Ср Дек 25 20:21:33 PST 2013


С xlsx история такая. Сам по себе это зипованный xml, чтобы его открыть, переименовываешь файл в .zip и распаковываешь. Там по именам файлов понятно, что где лежит. Так и вот, я пользовала вроде этот Spreadsheet::XLSX, он рассчитан на то, что в xml все данные записаны кучей без перевода строк. Это очевидно по регуляркам, которые парсят файл. 
Когда у меня сложилась проблема с тем, что файл не парсится, то открыв xml, я слегка удивилась тому, что xml красиво записан со всем форматированием. Парсер такое не кушает в силу выше указанных причин. Был ли мой файл из гуглодока, мне неизвестно, к сожалению. Те, что пишутся ms office, парсятся без проблем.

Savenkova Natalya
wwax555 на gmail.com
http://facebook.com/name.rnd

> On 25 дек. 2013 г., at 18:11, Eugene Toropov <eugene.toropov на gmail.com> wrote:
> 
> Привет,
> 
> https://github.com/jmcnamara/excel-reader-xlsx
> 
> На CPAN лежит только Excel::Writer::XLSX того же автора.
> 
> Замечание от него же (на гитхабе в README):
> 
> This project isn't effectively abandoned. I don't have the required time
> or interest to finish it off or get it to CPAN quality.
> 
> It is functional and if it meets your requirements then please use it but
> it is unlikely that it will ever be extended.
> 
> Евгений
> 
> 
>> On Dec 25, 2013, at 6:01 PM, Малёваный Олег <deer_oleg на mail.ru> wrote:
>> 
>> Добрый вечер! 
>> 
>> Проблема такая, есть *.xlsx файл. Надо из него данные вытащить.
>> 
>> Возникла проблема с файлами, которые были сохранены из google docs
>> 
>> Пробовал модули
>> Spreadsheet::ParseXLSX и Spreadsheet::XLSX
>> 
>> И оба они на такие файлы ругаются. Правда Spreadsheet::XLSX после ругани все таки может выдать данные.
>> В файле от google docs чего то не хватает. Модули не видят форматов, описания (версия и т.п.), размер страницы.
>> 
>> Кто нибудь уже встречал такую проблему и если да, то как лечить? Не хочется в модули залазить и там фиксить проблемы
>> 
>> 
>> 
>> ---
>> С Уважением, Олег М.
>> -- 
>> Moscow.pm mailing list
>> moscow-pm на pm.org | http://moscow.pm.org
> 
> -- 
> Moscow.pm mailing list
> moscow-pm на pm.org | http://moscow.pm.org
----------- следущая часть -----------
Вложение в формате HTML было извлечено…
URL: <http://mail.pm.org/pipermail/moscow-pm/attachments/20131226/0805e755/attachment.html>


Подробная информация о списке рассылки Moscow-pm