No. 124/622 Index Prev Next
Path: titcca!ccut!ascgw!cskvax!shige
From: shige@cskvax.csk.JUNET (Shigeki Yoshida)
Newsgroups: fj.kanji
Subject: Re: long char (Re: EUC &  SJIS &  JIS) (In KANJI)
Message-ID: < 509@cskvax.csk.JUNET> 
Date: 25 Jul 87 09:25:15 GMT
References: < 768@shpnar.sharp.JUNET>  < 820@srava.sra.JUNET> 
Reply-To: shige@cskvax.csk.JUNET (Shigeki Yoshida)
Distribution: fj
Organization: CSK corp., Tokyo, Japan
Lines: 61
Posted: Sat Jul 25 18:25:15 1987

吉田(shige@cskvax)です。

article < 820@srava.sra.JUNET>  で
	kameyama@srava.sra.JUNET (亀山) さんが
> 
> この提案の意図は,
> 1. 日本語を取り扱うプログラムの作成を楽にする.
> 2. 異なる file code でも同一のプログラムが走るようにする.
> の, 2 点にあります.

  最初に断っておきますが、基本的には私はこの提案は十分意義が
あると思っています。
  1つのソースで、色々な日本語コードに対応できればそれに優る
ものはないでしょうから。

  ただ、実際のプログラミングの上で、かえって面倒になるような
事があっては困ると思ったのです。

  例えば、自分の使っているOSコードの日本語プログラムだけを
書くつもりのプログラマーにとっては、OSコードと内部コードの
違いは間違いの元でしかありません。

  それから
> 1. ランダム・アクセスがやりにくい.
> 2. 構造体を一括して入出力することがやりにくい.
これも確かに問題です。read(),write()を使うような
プログラムは一切書けなくなります。

  そして、上記の事を回避する為に、今回提案された日本語コード
(共通内部コードとでも言いましょうか)及びそのライブラリーと、
OSに依存した日本語コード及びそのライブラリーを使い分けると
しても、これも又混乱の元にならないでしょうか。

  問題点は2つあると思います。
	1.ファイルコードと内部コードの違い
	2.内部で、charでなくshortで表す事

2.については、内部コード形式(shortで表す事)を採用する
限り、必ず問題になる事で、今回の提案の直接の問題ではないかもし
れませんが、
> >    それからプログラムによっては、内部コードに変換せず、バイト列のま
> >  まで十分なもの(やバイト列のままでないと困るもの)もあると思います。
> 十分なものはまだわかりますが, 困るものというのは, たとえば,
> どのようなものでしょうか?
> 
> >  そんな時はfile codeを意識しますので、結局OSのコードで十
> >  分のような気がするのですが。
> そのようなプログラムは従来どうり書けばよいと思います.
  というように、日本語コードの使い分けに絡んできます。
(ここでの「従来どうり」とは、OSのコードを使ってという意味に
  とりました)

  なお、「バイト列のままでないと困るもの」というのは、read(),
write()でアクセスするようなプログラムなどを頭に思い浮かべて
いました。

  もう一度書きますが、要は私は日本語プログラムを書く時に、できるだけ
面倒臭いことはしたくないと思っているだけなのです。
-- 
(株)CSK・技術開発事業本部・商品開発部・吉田茂樹
					    shige@csk.JUNET
Next
Continue < 856@srava.sra.JUNET>