[Jcode5 568] Re: [kansaipm] IBM拡張文字をEUCに変換したいのですが・・・

M.Takimoto takimt at sea.plala.or.jp
Wed May 14 19:38:13 CDT 2003


瀧本です

はじめまして、おせわになります。

MORIYAMA Masayuki <msyk at mtg.biglobe.ne.jp> wrote:
> Jcode5 のメーリングリストに Cc されてきたので、そちらからの引用
> になります。

いろんなMLがあるのですね。知りませんでした (恥)

> At Wed, 14 May 2003 18:42:34 +0900,
> 瀧本さんが EUC とおしっゃているのは、次のどれでしょうか?
>   
> (0) EUC-JP   (code set 1 = JIS X 0208 / code set 3 = JIS X 0212)
> (1) EUC-JISX0213 (code set 1/3 = JIS X 0213)
> (2) eucJP-open  (TOG日本ベンダ協議会 (TOG / JVC) 策定)
> (3) Windows コードページ 51932 (マイクロソフト独自の EUC)
> 
> ※(1)〜(3) はローマ数字を含んでいます。

うぅ・・・ (汗;
すみません どれかわかりません。
自分の無知をさらけ出してますね(大汗;;;

OSとしてはLinux(redhat7.2)を使ってますが、これをインストールした
あとPerlを5.6.1にアップデートした状態。
そこでPerlを使って 
   Jcode::convert( \$_, 'euc' );
とかやってるだけなので上の(0)〜(3)のどれに変換されているのかは、
ちょっと理解できていません。
すみません あまり深く考えないで使っています。(汗

> Jcode.pm は、シフトJISの 95区〜120区(F040〜FCFC) を考慮されてい
> なかったように思いますので、シフトJISの文字セットを Windows-31J
> (Windows 標準キャラクタセット) と仮定して事前に 1区〜94区中の同
> じ文字のコードに置き換えてから、Jcode.pm で EUC に変換したいとい
> う事でしょうか?

ええ そういうことでいいと思います。
変換元はWindows上の文字ですからWindows 標準キャラクタセットですね。
1区〜94区で対応する文字がある文字はそれに変換して、
1区〜94区で対応する文字が無い文字はこの際仕方が無い、として何
かPostgreSQLでエラーの起きないコードに変換できれば良いのです。
ということで、単におかしなコードに変換されてしまうことを回避する
だけではなしに、代用でいける文字はできるだけ元の情報を生かせるよ
うに代用したいのです。

> もしそうだとすると、(3) Windows コードページ 51932 への変換とい
> う事になるかもしれません。ただ、Encode に移行すると、そういった
> 単純計算での変換で通用していた技は使えなくなります。

うう 理解できていません (汗;
また時間のあるときに意味を理解することにします。

> シフトJISの 95区〜120区を Jcode.pm で EUC に変換すると、おかしな
> コードが生成されてしまうので、それを回避したというだけなら、わざ
> わざベンダ依存の対応をする必要は無く、シフトJISの95区〜120区を
> “〓”にでも置換してから、Jcode.pm で EUC に変換すれば良いだけの
> 話のように思います。そういった事前処理が面倒というのであれば、
> jcode.pl を使うという手もありますね。こちらは、シフトJISの95区〜
> 120区を“〓”に置換してからEUCに変換するという事をしてくれます。

了解しました。そうなのですね(^^;
単にエラーを回避したいだけの場合は jcode.pl を使うことにしたいと
思います。が・・・

普段は何気なく使っている文字ですが、その文字コードの世界は奥が深
いっすね。こういうトラブルになったときに改めてそう感じさせられま
す。

しかし、Windows というか Notes はよ〜わからんです。
聞くところによるとNotesの中ではNotes独自の文字コードでデータを扱っ
ていて、外へ(別のシステムとかへ)出す際にWindows標準キャラクタセッ
トとかとかに変換して出しているようです。
その際になぜかローマ数字などは拡張文字のほうに変換されてしまうら
しいのです。
Notes屋には「こっちのシステムに送るときは94区までの文字に変換し
てちょうだい」ってお願いしてますが・・・

   瀧本  満  "TAKI"    takimt at sea.plala.or.jp






More information about the Kansai-pm mailing list