[Tokyo.pm] Re: 単語を含む文字列の出現回数

ISHIKAWA Naota neo-zion @ nn.iij4u.or.jp
2002年 11月 19日 (火) 00:41:53 CST


お茶の水女子大学非常勤講師の石川直太と申します。
細かいことですが。

> 036:   my %thisWord;          # ここに、このURLの重複を省いた単語一覧を作成
> 040:   while ($uriString =~ m|\b(\w+)\b|g) { ++$thisWord{$1} if length($1) >= 5 }

5文字以上の単語だけを抽出したいならば、
m/\b(\w{5,})\b/
というパターンを使うほうが速くなりませんか。

> 059: for my $w (sort keys %WORD) {

ここは、「sort」しなくても結果が同じになりませんか。

=========1=========2=========3=========4=========5=========6=========7
(Mr.) ISHIKAWA Naota
Part-time teacher and technical writer on computer
http://www.nn.iij4u.or.jp/~neo-zion/
mailto:neo-zion @ nn.iij4u.or.jp





Tokyo-pm メーリングリストの案内