翻訳横丁の裏路地

We can do anything we want to do if we stick to it long enough.

機械翻訳システムの無責任使用

都道府県庁や市町村役場、果ては大学や病院や企業のホームページまで浸透してきている機械翻訳システム。私は、これらシステムの吐き出す機械翻訳された情報には情報価値がなく、害の方が遥かに大きいので、正確な情報伝達を必要とするサイトでの使用はやめるべきだと考えています。

こういった機械翻訳システムが吐き出す珍訳(つまり誤訳)を、あちこちのサイトを巡って調べ、その結果を紹介していたブログがありました。

何故、過去形で書くのかと言うと、昨日、そのブログ主の方から拙ブログ経由で「事情でブログ削除」の連絡を頂いたからです。事実、今アクセスしても「Not found」となって閲覧できません。このブログは毎日周回して拝読していましたし、例えば東京都内で、ホームページに機械翻訳を採用している区がどれだけあるかを示すマップなど、有用な情報が多かったので参考にしておりました。機械翻訳システムの使用場面(使用対象)について問題提起していたこのようなブログが消えてしまった事は、とても残念に思います。

ホームページと言うものは、そもそも情報発信が目的です。つまり、情報の中身や正確性が重要な訳です。その情報を多言語展開する時の選択肢として出てくるのが「(人による)翻訳」と「機械翻訳システム」でしょう。

さて、ここからは私の妄想です。決して事実ではありません。私の推測と想像の話です。

ホームページは情報発信を目的としているわけですから、当然、情報の鮮度が問われます。即ち、高い頻度で内容の更新が行われます。多言語対応をするためには、ホームページ全体の翻訳と、そう言った更新内容の翻訳が逐次必要となってきます。

多言語展開を進める上で検討されるべき事は、何故、多言語対応にするのか?と言う目的は当然として、多言語化した情報の正確性(情報の価値減衰性)、そしてコストだと思います。

まず、分かり易いコストから考えてみましょう。

「翻訳」と「機械翻訳システム」を超単純化して初期投資に関して比較すると以下のようになります。

  • 翻訳:対象全ページの全対象言語分の「翻訳」コストが発生
  • 機械翻訳システム:システム導入コストが発生

超単純化して言えば、どちらにしても初期投資が発生する点は同じです。大きく違うのはランニングコストです。都度発生するホームページの更新への対応を比較してみると以下のようになるでしょう。

  • 翻訳:更新内容の翻訳コストが対応言語分、毎回発生
  • 機械翻訳システム:費用発生なし

さて、どう思いますか? 役所のお偉さん達や企業のお偉さん達は、このコスト差に目を奪われてしまうのは明らかですね。

では、情報の正確性について考えてみましょう。

「翻訳」であれば、目的とされる情報意図が間違いなく多言語に反映され、ホームページの情報発信の目的を満足するのは間違いありません。懸念される情報の価値減衰性も小さく抑えられる筈です。
一方、機械翻訳システムの場合、その情報正確性はどうでしょうか?前述のブログでは、この情報正確性がかなり低いと言うエビデンスを多く紹介されていました。そもそも、機械翻訳システムによる他言語ページを閲覧しようとすると、「機械翻訳なので正確でない。」「本来の意味から外れた結果になる場合がある」という免責的主旨の説明ページが最初に表示されますが、これはある意味、自らで「正確性を放棄」しているのと同じ事だと思うのです。(2年前の「東北博」ホームページの誤訳問題がニュースに取り上げられて騒ぎになって以降、こういう免責ページを挟み込むのが当たり前になってきた。)

つまり、ホームページの多言語対応を考える時に検討すべき項目の1つである「情報の正確性」は、システム供給者が既に否定していると言ってもいいのかもしれません。

なぜ、こういうシステムがお役所や企業のホームページに導入されているのか?考えられるのは以下のような事でしょうか?

  1. 導入した顧客が他言語が分からず、システムが吐き出す機械翻訳文が正しく原稿の情報を伝達しているか?の評価する知識がない。従って、情報の正確性の評価など出来る筈もない。
  2. そもそも、情報の正確性など、気にもしていない。他言語サイトが出来ただけでOKと考えている。
  3. 質が悪くても、「無いよりはマシ」という風潮。
  4. 「正確じゃない」と免責メッセージ入れておけば問題ないだろ?という意識。

結局、情報の正確性なんて無視なので、導入判断材料はコストだけという事から、これだけ導入されているのだと思います。

「おたくの他言語のページ、何を書いているかわかりませんよ?間違いも多いし」
「あ、機械翻訳だから仕方がないんだ~。そう書いてあったでしょ?」
「そんな使えないページ、あっても仕方ないじゃないですか。なんで公開しているですか?」
「正確じゃなくても、無いよりマシでしょ?」

こんなやり取りが想像できてしまうのです。

ハッキリ申しますが、正しいかどうかを判断できない情報なんて、怖くて使えません。ましてや、その解釈の間違いで自分が大きな損害や不利益を被る可能性がある情報かもしれないと考えると、本当に恐ろしい。つまり、「無い方がマシ」だと思うわけです。幾らシステムが勝手に出力した結果だと言い訳しようとも、免責コメントを入れてあるでしょ?と言われても、そのページを提供しているのはそのホームページの所有者です。そこに責任がある筈です。お役所や企業がそのような情報垂れ流しをして良いものでしょうか?品格を問われかねませんよね。

きっと、導入した方々は、導入した事による効果の測定なんてやっていないのではないでしょうか?アクセス数があれば利用されている…なんて、そんなデータでは正しく測れません(上の人間を騙すには都合の良いデータでしょうが)。ホームページ利用者が、提供されている情報に価値があると判断してくれているかどうかです。結局、導入しっ放し、垂れ流しっ放しという現実が見え隠れしてきますね。

忘れてはならないのは、システムを供給している側の問題。翻訳事業を行っている会社がそういうシステムを販売しているというところもあります。ホームページのような性格の文書に、ああいう質の翻訳品をOKと判断する会社なのか?と考えてしまう。逆に言えば、そこの翻訳事業で生み出される翻訳物も心配ありだとも言える。意地悪く考えれば、そういう事になってしまう。

私が一番危惧するのは、機械翻訳による訳文がネットの世界に氾濫し始めている事で、それを助長しているのが、こういう機械翻訳システムではないかと。多くの人々の目に触れる。目に触れる頻度も高くなる。すると、目にするものが当たり前となる。ネットで裏を取りました~とか言いながら、機械翻訳みたいな訳文を課題の回答として張り付けてくる人も出てくるかもしれない。川に垂れ流されるヘドロのように、広い海にどんどん流れ込む怪しい訳文。これは公害と同じではないか?と思う事が時々あります。

作成者: Terry Saito

某社翻訳部門の中の人です。 詳細は、以下のURLよりどうぞ。 https://terrysaito.com/about/

コメントは受け付けていません。