[Moscow.pm] POE::Filter::Line

Ruslan Zakirov ruz на bestpractical.com
Пн Мар 17 08:14:00 PDT 2008


2008/3/17 Ivan B. Serezhkin <ivan на serezhkin.com>:
> Привет.
>  Может кому и интересно ?
>  получил прирос в 25 раз на больших файлах.
>  Можете поругать стиль =)
>  На очереди сделать нормальный быстрый драйвер.
>  И кстати, это удобный темплейт для написания своих фильтров, например
>  POE::Filter::Log::Postfix =)
>  Использовать так:
>
>  Wheel ...
>  Driver => POE::Driver::SysRW->new( BlockSize => 256*1024*1024) ,
>  Filter => POE::Filter::Regexp->new(qr/RecordSeparator/),
>  ....
>
>
>
>  package POE::Filter::Regexp;
>  use strict;
>
>  sub new {
>  my ($class,$re)=@_;
>  $re ||= qr/\n/;
>  die "Param in new must be a Regexp but this is a ".ref($re) unless ref
>  $re eq 'Regexp';
>  return bless [
>  '', # raw unparsed data
>  [], # ready queue
>  $re,
>  ], $class;
Почему не ref($class)||$class?

>  }
>
>  sub get {
>  my ($self, $stream) = @_;
>  my @ret;
>  while($self->[0].=shift @$stream){
$self->[0] .= $_ foreach @$stream;

Возможно будет быстрее. Нужно подчищать поток? Если да, то стоит
оставить как у вас.

Можно еще study добавить, хотя это может и замедлить.

Если говорить о больших файлах, то память будет кушаться в больших
кол-вах, если разделителя в потоке нет, но тут видимо ничего не
поделаешь.

>  my $p=0;
>  while($self->[0]=~/$self->[2]/g) {
>  next unless $-[0]; #begin of stream
>  push @ret, substr($self->[0], $p, $-[0]-$p);
>  $p=$-[0];
>  }
>  substr($self->[0], 0, $p)=undef;
substr($self->[0], 0, $p) = "";

>  }
>  return \@ret;
>  }
>  1;
>
>  --
>  Ivan B. Serezhkin
>
>  --
>  Moscow.pm mailing list
>  moscow-pm на pm.org | http://moscow.pm.org
>  http://mail.pm.org/mailman/listinfo/moscow-pm



-- 
Best regards, Ruslan.


Подробная информация о списке рассылки Moscow-pm