No. 260/622 Index Prev Next
Path: titcca!cs.titech.junet!kato
From: kato@cs.titech.JUNET (Akira Kato)
Newsgroups: fj.kanji
Subject: Re: Hankaku Kana v.s. 8bit
Message-ID: < 2480@nirvana.cs.titech.JUNET> 
Date: 3 Apr 88 15:15:44 GMT
References: 
Reply-To: kato@nirvana.cs.titech.JUNET (Akira Kato)
Distribution: fj
Organization: Dept. of Computer Science, Tokyo Institute of Technology
Lines: 63

In article 
	kameyama@srava.sra.JUNET (Toyohisa Kameyama) writes:
>  : というのは、日本では半角カナは忌み嫌われる傾向にありますが、ヨーロッパ
>  : では、G1 を使うことが、我々が漢字を使うのと同じくらい必要らしいのです。
>  : で、ISO 8859-1 では、
>  : 	ESC 02/08 04/04 (ESC-(-B)
>  : 	ESC 02/13 04/01 (ESC---A)
>  : の二つのエスケープシーケンスで G0 と G1 の両方を使おうね、ということを
>  : 定めており、もし、あらゆるソフトウェアがヨーロッパで書かれたとしたら、
>  : 半角カナの取り扱いは(少なくとも忌まわしい端末のことを考えなければ)ず
>  : うっとマシになるだろうな、と思います。
>  実は ISO の規格はよく知らないのですが, このコードは G0 に ASCII
>  を仮定しているのでしょうか?
>  G1 のコードも何かにしているのでしょうか?
>  ``B'' や ``A'' の辺りは扱うコードによって違ってくるのでしょうか?

ISO 2022 によると、
	ESC 2/8 F designates a set of 94 graphic characters as the G0
	set. The designated set is invoked by SI.
	ESC 2/13 F designates a set of 96 graphic characters as the G1
	set. The designated set is invoked by SO.
とありまして、二つの文字セットを同時に使うことがわかります。G0 の方は
おなじみの ESC-(-B で、G1 の方にはウムラウトとかそのへんの文字が定義さ
れています。

それから、ISO 2022-1986 を良く読むと、我々が日常使っている
	ESC 2/4 4/0 (ESC-$-@)	昔の JIS 漢字
	ESC 2/4 4/1 (ESC-$-A)	中国の漢字
	ESC 2/4 4/2 (ESC-$-B)	新しい JIS 漢字
は``例外''であることが分かります。原文は、(6.3.9 より抜粋)

	ESC 2/4 I F designates a set of graphic characters that are
	represented by two or more bytes, each corresponding to a bit
	combination in columns 2 to 7 (see figure 6).

	ESC 2/4 2/8 F designates a multi-byte graphic set as the G0
	set. The designated set is invoked by SI.

	....

	As an exception to these rules ESC 2/4 4/0, ESC 2/4 4/1 and
	ESC 2/4 4/2 designate multiple-byte sets as G0 sets, because
	they are already registered.

	NOTE - The reason for these exceptions is that the first version
	of ISO 2022 allowed multiple-byte sets to be only G0 sets and used
	ESC 2/4 F to represent them.

というわけで、歴史的理由により ESC-$-B は例外として ISO 2022-1986 では
容認されていることがわかります。さて、JIS X 0202 はどうするんでしょうね?

この``例外''を避ける場合、
	ESC 2/4 2/8 F
で、F = 4/2 を JIS 漢字とすれば、
	ESC 2/4 2/8 4/2 ( ESC-$-(-B )
が``正しい''シーケンスの様ですが、これでいいのかな?

ESC 2/4 2/8 4/2 で漢字を指示できる端末は既にあるのでしょうか?

(rn なんかも書き換えなきゃいけないのかしらん?)

東京工業大学  加藤 朗
JUNET: kato@cs.titech.junet
Next
Continue