4月 | 2025 | 翻訳横丁の裏路地

私は、日英翻訳の一次訳に生成ＡＩをよく利用しています。その際、必ず行うことは、日本語原稿のプリエディットです。

過去の機械翻訳では、期待した出力を得るために日本語原文をプリエディットするアプローチが取られていました。このプリエディットは、以下のような視点によるものだったと思います。

主語の明示化
日本文で省略されがちな主語を明示する。
曖昧表現の排除
指示詞や、意味が複数取れる表現を明確化する。
簡潔で一文一義
1文に複数の意味を含めず、1文=1意味にする
日本語独特の表現を回避
直訳できない比喩、慣用句を避け、事実描写中心にする
語順を英語的に意識
主語→動詞→目的語(SVO)の流れを意識して修正する。
省略の回避
必要な情報（主語・目的語・状況説明）を補う。
一貫した用語統一
同じ意味の語を統一し、言い換えを避ける。

これらのプリエディット作業は、日本語ネイティブが扱う自然な日本語とはかけ離れた不自然な表現になるため、一定のトレーニングを受けた人でなければ対応が難しいものでした。

一方、生成ＡＩを翻訳へ活用する場合のプリエディットは、このような難解なものではなく、私が思いつく範囲で書いてみると、以下のようになります。

文脈を明確にする
「何がどうなったのか」「誰が何をしたのか」を明示する。
曖昧語・ぼかし表現を避ける
「適宜」「よろしくお願いします」など曖昧表現を具体化する。
因果関係・対比を明示
「なぜそうなるのか」「何と何が比較されているか」を書き分ける。
固有名詞・用語の統一
同一ドキュメント内で表記揺れをなくす。
翻訳で迷いそうな言い回しを避ける
日本語独特の言い回し（例：「一応」「なんとなく」）を削除または明確化。
文を簡潔に整理する
長文・複文を避け、できるだけ短い文を並列させる。

これを書きながら気づいたのは、昔、原稿作者に指示していた内容と本質的に同じだということです。たとえば、「適宜って、どれくらいだ」「お願いしますって、具体的に何をお願いしているのか」「一応って、やるのかやらないのか」「長文過ぎて言いたいことがわからない」「複数の意味に取れるが意図は何か」「前後関係が矛盾している」などなど、原稿作者を質問攻めにしていた内容そのもの。

つまり、昔の機械翻訳相手では「機械相手の修正」だったプリエディットが、生成AIでは「人間相手の修正」と本質的に同じ視点でプリエディットを行うべきだ考えています。「読者が誤解することなく、読んで容易に理解できる日本文にする」という視点ですね。