No. 90/622 Index Prev Next
Path: titcca!nttlab!nttspl!etlcom!suehiro
From: suehiro@etlcom.etl.JUNET (Takashi Suehiro)
Newsgroups: fj.kanji
Subject: Re: is-shift-JIS or is-EUC ? (in Kanji)
Message-ID: < 811@etlcom.etl.JUNET> 
Date: 13 May 87 07:16:47 GMT
References: < 602@shpnar.sharp.JUNET> 
Reply-To: suehiro@etlcom.etl.JUNET (Takashi Suehiro)
Distribution: fj
Organization: Electrotechnical Laboratory, Tsukuba Science City
Lines: 24

In article < 602@shpnar.sharp.JUNET>  ikoma@shpnar.sharp.JUNET (Takao Ikoma) writes:
> 
> 漢字コード変換のフィルタについての問題です。
> 
> このようなフィルタを作るにはどうすればよいか、要は、入力データが
> ShiftJISかEUCかを判定あるいは推定(100%確実な方法はないので)する
> アルゴリズムとはどういうものなのか、できるだけスマートな(簡潔で
> 精度の高い)解、もしくは、ご意見を聞かせてください。
> 
とっても非実用的でアホな解なので気がひけますが。
人間ならすぐ判定できます。
ということは、自然言語処理などAI的なことを考えれば簡単に?できる
わけです。
でも、読める文章の意味理解とかは結構やられてても、読めないものを
読めないと判定するのは難しいかな?
字を見て日本語か中国語か英語かフランス語かなんて判定する
研究なんてやっている人いるかな?

	末広 尚士
	(suehiro@etl.junet)
	電子技術総合研究所

p.s.実際にプログラムを書こうと思っている人には無意味な
	フォローでごめんなさい。
Next
Continue