翻訳横丁の裏路地

We can do anything we want to do if we stick to it long enough.


日英翻訳に生成AIを使うなら原稿プリエディット

私は、日英翻訳の一次訳に生成AIをよく利用しています。その際、必ず行うことは、日本語原稿のプリエディットです。

過去の機械翻訳では、期待した出力を得るために日本語原文をプリエディットするアプローチが取られていました。このプリエディットは、以下のような視点によるものだったと思います。

  1. 主語の明示化
    日本文で省略されがちな主語を明示する。
  2. 曖昧表現の排除
    指示詞や、意味が複数取れる表現を明確化する。
  3. 簡潔で一文一義
    1文に複数の意味を含めず、1文=1意味にする
  4. 日本語独特の表現を回避
    直訳できない比喩、慣用句を避け、事実描写中心にする
  5. 語順を英語的に意識
    主語→動詞→目的語(SVO)の流れを意識して修正する。
  6. 省略の回避
    必要な情報(主語・目的語・状況説明)を補う。
  7. 一貫した用語統一
    同じ意味の語を統一し、言い換えを避ける。

これらのプリエディット作業は、日本語ネイティブが扱う自然な日本語とはかけ離れた不自然な表現になるため、一定のトレーニングを受けた人でなければ対応が難しいものでした。

一方、生成AIを翻訳へ活用する場合のプリエディットは、このような難解なものではなく、私が思いつく範囲で書いてみると、以下のようになります。

  1. 文脈を明確にする
    「何がどうなったのか」「誰が何をしたのか」を明示する。
  2. 曖昧語・ぼかし表現を避ける
    「適宜」「よろしくお願いします」など曖昧表現を具体化する。
  3. 因果関係・対比を明示
    「なぜそうなるのか」「何と何が比較されているか」を書き分ける。
  4. 固有名詞・用語の統一
    同一ドキュメント内で表記揺れをなくす。
  5. 翻訳で迷いそうな言い回しを避ける
    日本語独特の言い回し(例:「一応」「なんとなく」)を削除または明確化。
  6. 文を簡潔に整理する
    長文・複文を避け、できるだけ短い文を並列させる。

これを書きながら気づいたのは、昔、原稿作者に指示していた内容と本質的に同じだということです。たとえば、「適宜って、どれくらいだ」「お願いしますって、具体的に何をお願いしているのか」「一応って、やるのかやらないのか」「長文過ぎて言いたいことがわからない」「複数の意味に取れるが意図は何か」「前後関係が矛盾している」などなど、原稿作者を質問攻めにしていた内容そのもの。

つまり、昔の機械翻訳相手では「機械相手の修正」だったプリエディットが、生成AIでは「人間相手の修正」と本質的に同じ視点でプリエディットを行うべきだ考えています。「読者が誤解することなく、読んで容易に理解できる日本文にする」という視点ですね。


コメントする

AIで消滅する翻訳という職業

今朝、Forbes Japan の「ChatGPTが消滅させる?「年俸1千万超」含む7つの職業」という記事を目にしました。

機械翻訳やAIの登場で消滅する職業のひとつとして必ず登場する「翻訳」ですが、この記事にも4番目に「翻訳者」として取り上げられています。

AIで翻訳という職業は消滅する。
本当にそうなのだろうか?

SNSを見ていると「翻訳は無くなる」「いや、翻訳は残る」という、立場の違うもの同士が前提も明らかにしないで意見交換(?)しているのを見掛けますが、私は両者の主張はどちらも正しいと感じています。

続きを読む


コメントする

翻訳者かプログラマーか

長らく何も書いていないブログですが、久しぶりに、何か書いてみたいと思います。

そうですね、最近、ときどき頭の片隅にあって、時間があると思い返して考えていることがあるので、それを書いてみます。もちろん、私の浅はかな考えに基づくものですので、一笑に付していただければありがたいです。

それはそれは遠い昔のお話。仕事で大量の日本語文書を英文に、大量の英文書を日本語に書き換えなくてはならなくなったとき、プログラミングに覚えのある人間なら「単語の置換」をプログラムでやってしまえと自然に発想するでしょう。私も同じ発想で、辞書ファイルを参照して用語置換するプログラムを書き上げて使い始めたわけです。

プログラムの出力を利用して完成文を作り上げていくわけですが、作業を繰り返していくうちに人間というものは欲が出始め、品詞に関係なく、なんでもかんでも置換しようと工夫を始めるわけです。辞書を工夫したり、プログラムのアルゴリズムをいじったり、まぁ、プログラマーとしては楽しいひとときなわけですが、副詞だろうが形容詞だろうが、時には動詞まで何とかしようと試み始める。この辺りまで行くと、手段の目的化状態になりつつある。

出力を完成文に整える作業の中で、はたと気付くわけです。プログラムの出力が「邪魔くさい」と、完成文に行き着く思考の中で役に立っていないと、むしろ邪魔をして目障りだと気付くわけです。ここに気付くかどうかが翻訳者かプログラマーかの別れ道になるのでしょうか。結論として、解釈に揺れがない固有名詞以外は、置換しても思考の邪魔になるだけだと自ら学ぶわけです。

もし、気付かなかったら?

続きを読む