No. 229/622 Index Prev Next
Path: titcca!flab!ichikawa
From: ichikawa@flab.flab.fujitsu.JUNET (I.Ichikawa)
Newsgroups: fj.kanji,fj.questions.misc
Subject: Dokoni simasyou ka? (Re: Strange letter)
Message-ID: < 2552@flab.flab.fujitsu.JUNET> 
Date: 14 Jan 88 03:22:43 GMT
References: < 2522@flab.flab.fujitsu.JUNET> 
Reply-To: ichikawa@flab.flab.fujitsu.JUNET (I.Ichikawa)
Distribution: fj
Organization: Fujitsu Laboratories Ltd., Kawasaki, Japan
Lines: 27
Xref: titcca fj.kanji:288 fj.questions.misc:325

In article < 2522@flab.flab.fujitsu.JUNET>  I wrote:
> 新版nkfに、こうした文字のチェックを付けませうか?

皆さん
> ぜひ,付けて下さい.ついでに第二水準の検出も!

ということですが、第二水準は、JIS符号表の、48区以降ということで、
まあ、いいのですが。
変なやつ(例えば、〇数字、罫線、ローマ数字など)は、どこであるとしましょう
か?

なるべくならば、いわゆる半角カナと類似しておこないたいので、第1バイトで
判断したいものです。

案としては、8区〜15区を考えています。(0x2422〜0x277e)
(チェックが楽だから)

8区〜15区にあると、stderrに(いわゆる半角カナを検出したのと同様に)メッセ
ージを出すようにする。ということです。サイレントモードにより黙るなども
考えています。

ただし、こうした検出機構をいれると、遅くなるので、高速バージョンと親切バ
ージョンを考えています。前者は速度が要求され、システムに組み込む場合のも
ので、後者は、ユーザ向きのものになるでしょう。

で、8区〜15区でいいでしょうか?
Next
Continue < umerin/RRN7@photon.stars.flab.Fujitsu.JUNET>
< 661@kaba.JUNET>
< 942@cskvax.csk.JUNET>
< 1347@srava.sra.JUNET>
< 157@wadalab.t.u-tokyo.JUNET>