[Moscow.pm] определение наличия в файле непечатных символов

Maxim Vuets maxim.vuets на gmail.com
Ср Сен 3 12:36:36 PDT 2008


03.09.08, Kaltashkin Eugene<zhecka на gmail.com> написал(а):
> Есть файл, в нём есть обычный текст и после текста идёт внедрёный
> бинарный код.
> Это .msg от MS Exchange. все мои попытки определить штатными средствами
> файл на

Если это msg, то наверняка это multipart content MIME, разве нет?
То есть, должен ведь быть какой-то разделить.

Или заголовок с длинной body и attachment-ов (или что там бинарное идет).

Есть еще встроенные операторы для определения типа содержимого.
Вот из perldoc -f -X:
  -T  File is an ASCII text file (heuristic guess).
  -B  File is a "binary" file (opposite of -T).
Попробуйте, может быть поможет.

Как самостоятельное решение, попробуйте сделать поиск
по re типа такого /[\x00-\x08\x0b\x0e-\x1f]/, что ли. То есть,
управляющие символы (первых 32) без табуляции, возрата
карретки и перевода строки.

Ну и спросить у Гугла типа how to determine binary file.

-- 
Hoc est simplicissimum!
maxim.vuets.name


Подробная информация о списке рассылки Moscow-pm