人間原理による言語処理



どーも自動翻訳の精度が上がらないなあと思っている。
実感として数年前と比べても進歩がない――とは言い過ぎかもしれないが、最低限意味の通る文を作ってくれよ、と。


思うに、翻訳する対象だけでなく、「翻訳する自分(プログラム)」とは何か、を含めて考えなきゃいけないんじゃないか。

赤ちゃんって、とりあえず小さいものは口に入れて食べられるかどうかを判断するでしょ。
それで世界が「食べられるもの」と「食べられないもの」に二分される。
成長するにつれて世界はだんだん細かく分類されていく。
その判断材料といえば、自分の経験(学習も含めて)だろう。

自分(人間)である事が翻訳のすべてを決定する。
これは人間原理だよね。

つまり翻訳するプログラムは自分という判断材料を含んでいなければならないという事になる。
それは事実上無理だから、日本語を処理するプログラムなら人間的な(平均的な日本人の)データを与えてモデルを作る。キャラクターを作る事とおんなじで、つまりは。

ローカロイドみたいなもんが必要なんじゃないかと。

いや、冗談でなく。

東京ドーム何個分の広さ、といわれたって東京ドームに行ったことのない人にはピンとこないわけで、今の自動翻訳のヌルさは翻訳するプログラムが「自分で何もしたことがない」からピンときてないせいなんじゃないかなあと思う。


 

コメントは日本語でお願いします。(URLは入力禁止:Do not URL writing.) :System message: コメントを受けつけています。