[Tokyo-pm] Jcode/Encodeでの機種依存文字

MORIYAMA Masayuki msyk @ mtg.biglobe.ne.jp
2005年 5月 23日 (月) 03:24:40 PDT


はじめまして、森山と申します。

> ----------------------------------------------------------------------
> > iconv -l | grep -i 'euc.*jp'
> EUC-JP-MS//
> EUC-JP//
> EUCJP-MS//
> EUCJP-OPEN//
> EUCJP-WIN//
> EUCJP//
> ----------------------------------------------------------------------
> 
> 件の問題は、euc-jp-ms が導入されれば(とりあえずは)解決するのではないで
> しょうか。

euc-jp-ms の導入だけでは、解決しないでしょう。
理由は、後で述べます。

> # 導入の是非はともかく(^^;
> # しかし、上記のエンコーディング、MSとOPENとWINでどー違うのだろう……。

EUCJP-MS, EUCJP-OPEN, EUCJP-WIN は、EUC-JP-MS のエイリアスとして登録さ
れています。

# /usr/lib/gconv/gconv-modules を見てもらえると、どういったエイリアス
# が定義されているか分ります。

EUCJP-MS は glibc のメンテの方が 元々 EUCJP-MS だったものを EUC-JP-MS 
に変更したので、EUCJP-MS をエイリアスに登録しなおしたという経緯があり
ます。
EUCJP-WIN は PHP での名称です。
EUCJP-OPEN は EUCJP-0201, EUCJP-ASCII の追加を考えると、EUC-JP-MS のエ
イリアスとして登録するのは不適切だったかもしれません。

Windows での EUC-JP は Code-page 51932 と呼ばれるもので (MLANG.DLL が
提供するエンコーディング変換の API でサポートされている)、 eucJP-ms と
は互換性がありませんのでご注意ください。

nkf 2.0.5 では、Windows標準キャラクタセットに対応のEUC-JPエンコーディ
ングは cp51932 互換のようですので、eucJP-ms を Encode.pm に追加実装し
ても NKF.pm と同じ変換にはならないという事になります。



Tokyo-pm メーリングリストの案内