No. 109/622 Index Prev Next
Path: titcca!ccut!ascgw!cskvax!shige
From: shige@cskvax.csk.JUNET (Shigeki Yoshida)
Newsgroups: fj.kanji
Subject: EUC &  SJIS &  JIS (Re: Hankaku KANA) (In KANJI)
Message-ID: < 468@cskvax.csk.JUNET> 
Date: 30 Jun 87 11:35:50 GMT
References: < 229@kaba.JUNET>  < 1450@nttspl.ntt.JUNET>  < 702@shpnar.sharp.JUNET> 
Reply-To: shige@cskvax.csk.JUNET (Shigeki Yoshida)
Distribution: fj
Organization: CSK corp., Tokyo, Japan
Lines: 53
Posted: Tue Jun 30 20:35:50 1987

article < 702@shpnar.sharp.JUNET>  で
kos@shpnar.sharp.JUNET (神月(こうづき)利文)さんが
> ところで、これからのソフトは『JIS、シフトJIS、UJISなど
> 複数のコード体系を扱えることが必修だ!』なんて言われるのかなぁ。

  ユーザーから見た分には、そのユーザーの使っているOS(日本語
UNIX,ΣOS,etc)のコードさえ使えれば十分だと思います。
他のコードのデーターはフィルターさえあれば使えるんですから。

  開発者としては、制限付きではありますが、EUCとSJISの両
バージョンを作るのはそれほど難しくはないはずです。(特にSJIS
の経験がある人なら、EUCはかなり簡単だと言えると思います)
そして、今後の日本語OSの普及を考えると、EUCとSJISバー
ジョンだけで十分のような気もします。

  ただ、日本語が完全に扱えるOSではないけれども、日本語のデー
ターを扱いたい(newsのように)という時は、JISバージョン
も必要なのかもしれませんね。

  先程制限と言ったのは、EUCコードのうちの外字セットと、半角
カナの扱いです。半角カナはSJISとEUCでは、SS2が付くか
付かないか(1バイトか2バイトか)の違いだけですが、以外と障害
になる所です。

  そして、「外字セット」の存在がEUC&UJIS用ソフトを開発
する上で問題となる所でしょう。EUCでいう「外字」は、JIS規
格で定められた文字セット(いわゆるJIS第一水準、第二水準とい
う文字セット)と同時に別の文字セットを扱う時などに、そのコード
を割り当てる、という事らしいのですが(これを使うと、前に質問の
あった、日本語とハングル語を同時に扱うという事も、便宜的にです
が出来ます)、実際にどの文字セットを割り当てるかというのは、全
然決まっていません(とATT−UPの人が言っていました)。

(通常「外字」と言っている「ユーザー定義文字」は、漢字コードの
空き領域を使っているので、「漢字」として扱い、ここで言っている
「外字セット」には含まれません)

  今は使い方さえ定かでない「外字セット」ですが、このコードをも
サポートするかどうかで、開発の難しさが変わってくると思います。
なにせ、EUCで3バイトコード、UJISにいたっては、ファイル
中では3バイト、内部コードで扱う時は8ビット目・16ビット目を
落とした16ビットコードとして扱うんですから。

  でも、とりあえずは「外字セット」はサポートしないという事でい
いようですね(ΣOSを開発している所でも、この「外字セット」は
サポートしていないらしいので)。

註)この文章で「EUC」とは、EUCコードのうちJAEで使用
    している物を指します。
    また、UJISとはΣOSで使用するコードを指します。
-- 
(株)CSK・技術開発事業本部・商品開発部・吉田茂樹
					    shige@csk.JUNET
Next
Continue < 783@srava.sra.JUNET>
< 473@cskvax.csk.JUNET>
< 768@shpnar.sharp.JUNET>
< 820@srava.sra.JUNET>
< 799@shpnar.sharp.JUNET>