[Tokyo.pm] Re: 単語を含む文字列の出現回数

shin honda dev @ license.to
2002年 11月 19日 (火) 02:32:51 CST


まことです。

お馬鹿なので、データの流れをトレースできてない為
WORDとWORDREの違いがよくわかってないのですが^^;
WORDは単語の登場回数
WORDREは単語を含むURLの数
でしょうか?
#違ったら全然役に立たないソースですが^^;

while (my $uri=<>) {
	chomp $uri;
	$URI{$uri}++;
	my $word	= parse_word($uri);
	$WORD{$_}++	for(keys %{$word});
	if($URI{$uri}==1){$WORDRE{$_}++ for(keys %{$word})};
}
my %cache;
sub parse_word {
	my $str	= shift;
	return $cache{$str} if($cache{$str});
	while ($str =~ m|\b(\w{5,})\b|g) { $cache{$str}->{$1}++ }
	return $cache{$str};
}

とか?

---------+---------+---------+---------+---------+---------+
SHIN HONDA            <makoto @ cpan.jp> "http://www.cpan.jp/"
          <makoto @ fes-total.com> "http://www.fes-total.com/"
FES Co., Ltd.        Tel:+81-46-278-1153 Fax:+81-46-275-0966




Tokyo-pm メーリングリストの案内