[Tokyo.pm] Re: 単語を含む文字列の出現回数

taguti taguti @ secom-sis.co.jp
2002年 11月 19日 (火) 05:19:38 CST


田口です。

dev> 仕事しながら書いてたので嘘がありましたので修正です^^;
dev> テストしてないので、動かなかったりまちがってたらすみませんm(__)m

いえ、構いません。

1万件で、
$ grep yahoo URL_1M.txt |wc -l
   1899
なんですが、
URI3WORD.wod	1723件
URI3WORD.wre	1626件
となっていて、すこうし違うみたいです。
5万件では、
URI3WORD.wod	1件
URI3WORD.wre	1件
とさらに...
300万件では444804、
$ grep yahoo URL_ALL.txt |wc -l
 446667
(少しだけ違う!)
でも、300万件のファイルでも7分で終わりました。早すぎ。
これで結果が正しければゲームオーバなんですが。(^_^)ゞ

プログラムの理解はこれからします。

dev> #所でなんでtokyo.pmなのでしょう?perlやcgiのMLのほうが...

そっちは社内に見ている人がいるので、余り出たくないんです。
むかし、ショックを受けた事があり。別に悪い事はしてないですが。
会社という所は色んな人がいるです。
若しかすると、このMLにもいるかも。

Hirosi Taguti
taguti @ secom-sis.co.jp



Tokyo-pm メーリングリストの案内