[kansaipm] Re: [kansaipm] Re: たずねびと

akiba akiba at rr.iij4u.or.jp
Fri Feb 13 07:47:56 CST 2004


秋葉です。

> 川合孝典です。
>
> > 秋葉です。
> >
> > 私、最近はデータマイニング(データ分析)ツール
> > 「MUSASHI」にうつつをぬかしています。
> >
> > さて、Perl使いの方で「協力してやろう」と言って
> > いただける方を探しています。
> > お願いしたい事は次の2つです。
> MUSASHIは私も興味が合って、先日のKoFのときもデモを見せて
> もらいました。

その節は、有難うございました。

> 使ってみたいのは山々なんですが、時間がなかなかとれなくって...。

恐縮です。

> > 1.MUSASHI版CPANを作りたい。
> あっさりと「まずは作ってみればぁ」っていう感じかなと。
> CPANの仕組みも、ぞっとするほどいい加減に感じますし(^^)。
>
> CPANにある、この文書が参考になるかと思います。
> http://www.cpan.org/modules/04pause.html
>
> 昔、適当にやっただけの参考訳ですがお役に立てば
> http://member.nifty.ne.jp/hippo2000/pause_j.htm
> #先日、某MLでも話をだした文書ですが、PAUSE、CPAN-Testers
> #あたりの説明が入っているのでわかりやすいかと

「バイ★グラ安いよ」みたいなものは、filterしなきゃいけませんが、
あとは、投稿者の良識にまかせるべきなんでしょうかね。

> > 2.MUSASHI用Perlプログラム
> > 「MUSASHI」のキモは、大量データの高速処理です。
> > しかし、最終的には人間が見てわかる程度の量に
> > なります。
> > 最初の大量データ処理の部分はどうしようもないので
> > しょうが、データ量が減った後は、Perl使えばもっと
> > ハッピーになれそうな気がしています。
> > 現在は、「MUSASHI」の後はたいてい「Excel」になっています。
> > このへん、誰かがなんとかしてくれるとうれしいな。
> データ入力の部分でもXMLに変換しないといけないんじゃ
> ありませんでしたっけ?(ウロ覚え)
> #CDATAでデータ記述するのぉ?ってビックリした覚えがあり

#CDATAのところは、技術者向けの解説です。
利用者の多くは、多分ほとんど理解していないんじゃないかな。(主に学生)
文系の学生が使えるように工夫していますので、
結構簡単に使えますよ。
最大のネックが、viのマスターかな。

> その辺りも含めてPerlから使いやすいI/Fがあると便利かもと
> 思ってはいたんですが...。(深くは考えていない私)

RDBからデータを引っ張ってくるあたりは、不満はないと思います。
(欲を言えばきりがありませんから。)
入り口は、現状ではRDBとのI/Fが主なニーズなので、
そのあたりのコマンドはサポートされています。
ただ将来は、打倒RDBが「MUSASHIの野望」ですから、
入り口からXMLにしようと目論んでいます。
XML−>XML(#CDATA)のコマンドはまだ不十分かもしれません。

現時点であったら便利かなと考えているのは、分析の中間結果ファイルの
ハンドリングと、結果の出力(表やグラフ)関連です。

-----
akiba
-----





More information about the Kansai-pm mailing list