私が翻訳会社(に類する企業)に勤め始めたのが、今から20年程前(え?もうそんなに昔?(笑))。
当時はまだNMTも生成AIもありませんでした。頓珍漢な出力をする機械翻訳(MT)は存在していましたが、ビジネス的に利用するメリットを感じず、手を出しませんでした。あの頃は、産業系翻訳の依頼がまだまだ潤沢にあった時代でした。
いまはどうでしょうか。2016年に Google が NMT を公開し、その後、2022年にOpenAiが生成AIであるChatGPTを公開して一般での利用が可能となりました。その後も生成AI技術はどんどんと進化していますが、これらAIの普及に伴って翻訳の依頼が減少したという話を良く耳にします。私もその影響を受けたひとりです。また、翻訳に携わる人々の仕事の内容が少しずつ変化してきているように思います。以前から翻訳をしていた方々の仕事内容も、翻訳からチェックやポストエディットに軸足が変化しているように見えます。
この半年を見ても生成AIの進歩には目を見張るものがあります。この先、我々翻訳者、あるいは翻訳関係者の仕事はどうなっていくのでしょうか。最近、翻訳者が集まると必ず出る話題のひとつですよね。程度に差はあれ「翻訳という仕事が徐々に奪われていく未来」を多くの人が感じているように思います。
では、私たちは今、どの辺りにいるのでしょうか。
人によって認識には大きな違いがあるようです。生成AIについては、2022年の登場以来変わらず「ハルシネーション、ドリフティング、欠落・歪みを起こすので、出力をそのまま使うと危険である」「文書によっては、そのまま使うと人命に関わる」といった問題があります。この点は変わっていません。重要な部分なので、声を大にして伝えていかなくてはなりません。ただ、この部分だけに注目して「だから翻訳という仕事はまだまだ大丈夫だ」といえる状況ではなさそうです。
「そのまま使う」ところに勝ち目はあっても、
「そのまま使わず、ちゃんと品質保証して使う」ところに勝ち目はあるのか。
こういう話はSNSを含め、目にしたことがありません。また、生成AIが生成する訳文の質について、生成AI特有の問題をいったん脇に置き、純粋に論じている情報も、ほとんど目にしたことがありません。このあたりの情報不足が、生成AIをめぐる現状認識を遅らせている可能性を感じます。
ちなみに私は十数年前に数年間、さまざまな翻訳者(と名乗る人々)の産業系トライアル英訳を評価してきました。生成AIが出力する英訳文を同じ視点で評価すると、ここ1年の進歩も相まって、それらの平均的な質より高いと感じています。おそらく、産業系分野では同じ状況が起きているのではないでしょうか。私の周りにいる複数の翻訳関係者も同じレベル感を持っているようです。
では、「そのまま使わず、ちゃんと品質保証して使っている」企業では、どのようなアプローチを取っているのでしょうか?
企業視点で生成AIの翻訳活用を考えた場合、当然、出力品質を高めることを考えるでしょう。生成AI特有の問題、例えばハルシネーションなどに対応するためには、人間の目による最終的なチェックと修正(ポストエディット)は必要不可欠です。しかし、その工数を最小限に抑えるための工夫は、さまざまに検討されているはずです。
産業翻訳系のソークラ企業でどんな動きがあるのか、ひとつ例をご紹介します。
末尾の参考資料に挙げたYouTube動画は、株式会社 島津製作所の知的財産部部長 阿久津好二さんによるオンラインセミナーです。生成AIを使って外国語出願翻訳を自動化されているようです。講演の中で「一番費用に効いているところ」と仰っており、「全件、うちに引き上げて事務員の方が処理している」と仰っているとおり、生成AIの活用により翻訳を完全内製化されているようです。(つまり翻訳の外部委託は無くなった=翻訳者の仕事は無くなった)
このセミナーは大手企業の知財部門が集まる業界団体でも開催されたと聞いており、かなりのインパクトがあったように伝え聞いています。こうした企業が同じ方向へ進むのは容易に想像できます。また、この動きが特許翻訳だけに限られるとは思えません。コストプレッシャーのもと、生成AI活用による外注費削減がさまざまな分野や領域で起こるのは、ごく自然なことだからです。
さて、島津製作所さんの翻訳自動化は、生の生成AIにポンと原稿を投入するだけで成立している——なんてことは、おそらくないでしょう。ここから先は私の想像ですが、翻訳、チェック、校正など、翻訳品質を保証するための工程(フロー)を設定し、それぞれの工程に生成AI工程を配置し、各工程に合せて十分に検討されたプロンプトとサポートデータを使って処理しているはずです。
企業内で起こっている(だろう)ことを、最近私が使っているDifyというツールを用いた例で説明すると、イメージしやすいかもしれません。次の画像はDifyのスクリーンショットです。Difyは簡単にいえば、生成AIを使ったワークフロー(自動処理)を構築できるツールです。最近は、こういう種類のツールが続々と登場しています。
この画像に表示されているフローは、翻訳会社内のフローを簡素化して私が作ったものです。

- ユーザー入力:
ユーザーが「文書分野」「想定読者」「ターゲット言語」「原稿」を入力します。
原稿はファイルをアップロードすることもできます。参考資料もあればアップロードします。 - IF/ELSE、原稿ファイルテキスト抽出、原稿結合、参考資料テキスト抽出:
ファイル類(原稿、参考資料)をテキスト化します。 - 一次翻訳:(生成AI)
生成AIがプロンプトAに従って、参考資料を参考に原稿を一次翻訳します。一次翻訳文を出力。 - 翻訳チェック①:(生成AI)
生成AIがプロンプトBに従って、原稿と一次翻訳文を比較して翻訳チェック。修正文①を出力。
ここで、ハルシネーションなどの生成AI特有問題を検出します。 - 翻訳チェック②:(生成AI)
生成AIがプロンプトCに従って、原稿と修正文①で翻訳チェック。修正文②を出力。 - 疑似ネイティブチェック:(生成AI)
生成AIがプロンプトDに従って、修正文②をモノリンガルチェック。修正文③を出力。 - 最終チェック:(生成AI)
生成AIがプロンプトEに従って、原稿と修正文③で翻訳チェック。翻訳完成文を出力。
最終チェック項目には、ハルシネーションなどの生成AI特有問題の再チェックも含まれています。
ユーザーが必要項目をすべて入力して実行を開始すると、このフローに従って順番に生成AI処理が行われます。翻訳やチェックに使う生成AIには、それぞれの処理に特化して開発された専用プロンプト(プロンプトA~E)を使用します。最終的に出力される訳文の品質は、このフロー設計とプロンプトの質に大きく左右されるため、継続的な調整が必要です。
このフローを経て出力される翻訳文を、最後に人間がチェックし、ポストエディットを施して最終成果物に仕上げます。おおよそ、このような流れが一般的なフローだと想像します。こうしたツールと仕組み(フロー)を通じて出力された訳文は、無調整の生の生成AIで出力した訳文に比べて、ハルシネーションなどの生成AI特有の問題が抑えられ、ポストエディットに要する工数も(当然)小さくなります。
この例のように、生成AIとツールを組み合わせた仕組みを、ソークラ企業の内部では構築し始めているようです。そして、(島津製作所のように)満足する翻訳品質を確保できれば「翻訳会社は不要」(外部委託費削減)という話になりかねない状況に入っているのだと思います。
翻訳という仕事における生成AI活用の現状を正しく認識するならば、「生の(未調整の)生成AIの出力だけを見て議論する時代はとっくに終わっている」ということだと思います。(実際はもっと進んでいるのかもしれないけれど)上記したような状況も知識に入れ、これからどこへ向かうべきかを考えていきたいですね。また、業界に参入しようとされている方々が正しい判断を行えるような情報発信をしていきたいところです。
以前、Facebookに書き込んだのですが、翻訳という島が、生成AIによってどんどん水没している。AIとハードウェアの技術進歩の速度が想像より速く、水没のスピードも思っていた以上に速い。翻訳という仕事は、やがて島のてっぺんだけが残るようになるのではないか。まさかと思っていた映像翻訳の世界にも入り込み始めていると聞くと、水没を免れる島の大きさも想像していたよりさらに小さくなりそうに感じています。
それでも残る分野があるとすれば、文芸でしょうか。文章を「味わう」世界の翻訳は水没を免れるでしょうか。どう思いますか。現状のAIは、まだその領域には達していないと私は感じているのですが、どうでしょうか。けれども、未来のことは分かりませんよね。
音楽を生成するAIをご存じでしょうか。今では、AIの作った曲がSpotifyやAmazon Musicなどの音楽配信サービスで普通に配信されています。それだけAIの作る曲のクオリティが上がっているということなんだと思います。
さて、AIが作った曲だと知らずに聴いたとき、果たしてそのすべてを「嫌だ」と判断するでしょうか。結局、好みの問題ですから「好きだ」と感じることも十分にありえますよね。事実、私のお気に入り曲には、AIが作った曲が複数曲入っています。
もし翻訳でも、生成AIが同等のレベルに到達したら——。
そう考えたら、島全体が水没する、もしくは狭い島の中で共存していく可能性を感じてしまうのです。
【参考資料】
株式会社 島津製作所 知的財産部部長 阿久津好二さんのオンラインセミナー