[Tokyo-pm] Jcode/Encodeでの機種依存文字

h-taguchi@secom.co.jp h-taguchi @ secom.co.jp
2005年 5月 16日 (月) 23:32:39 PDT


田口です。返事貰えて嬉しいです。

> > で、表題の件ですが、私はテッキリ、最近のEncodeモジュールでは、
> > 13区の特殊文字、
> > NEC選定IBM拡張文字、
> > IBM拡張文字
> > についても対応しているものとばかり思っていました。
> > 「最近のPerlはCPANモジュール入れなくても、これらの文字コード変換できる」
> > と周りに言ってしまい、焦ってます。
> 
> これの問題は、cp932ではなく、euc-jpの方にあります。
(略)
> この拡張文字、cp932 の方にはあっても euc-jp の方にはありません。そのことは

そうでしたか?
私の理解では、
SJISは⇒UTF-8⇒SJISで元のコードに完全に戻るが、EUCはそうでなく、
同じ文字に対して複数のコードを重複してもっていて、
EUCは"round-trip safe"ではないから、Encodeが対応していないのだと
思っていました。

しかし、NKF.pmにできるのだから何とかして欲しい。
何時になってもNKFから卒業できません。

Hirosi Taguti
taguti at tokyo.pm.org



Tokyo-pm メーリングリストの案内