翻訳横丁の裏路地

We can do anything we want to do if we stick to it long enough.


完全オフライン環境で動作する生成AIモデルの日英翻訳能力比較レポート

生成AIを翻訳支援ツールとして利用する場合、障害となるのが情報の取り扱い。従来のクラウド型生成AIでは、入力した情報がクラウド上のシステム内で内部利用される可能性があるため、守秘義務のある情報や、情報漏洩を避けたい個人情報を含むデータを入力することができず、生成AIの活用に制限がありました。

7月8日に、LM Studioの企業・団体での利用が無償化されるというアナウンスが出ました。

LM Studio is free for use at work

記事のChatGPTによる和訳要約
LM Studioは、これまで家庭での個人利用のみ無料でしたが、2025年7月8日から企業・商用利用も完全無料になりました。これにより、会社やチームでも申請や手続き不要で自由に使えるようになります。データはローカル保存のままでプライバシーも保たれ、外部送信の心配はありません。今後は、無料のチーム共有機能や、有料のエンタープライズ向けプラン(SSOやアクセス制御など)も順次提供予定です。研究開発や業務効率化を進めたい企業にとって、大きなメリットとなる方針転換です。

これにより、情報セキュリティの問題で生成AIの導入が進まなかった企業でも、LM Studioなどを利用したローカル環境だけで動作する生成AIの利用が進むのではないかと思います。また、個人翻訳者の立場で考えても、同様の理由から、生成AIを翻訳支援に利用するハードルが低くなりました。

私は以前から、翻訳(特に英訳)の相談役として ChatGPT を使い続けていますが、それはこちら求める英語に関する質問に対して、期待する回答品質を持っているからです。さて、ローカル環境だけで動作する生成AIでは、果たして期待した回答品質が得られるのか、そこが大きな問題です。ローカル環境で動作可能なモデルサイズですので、翻訳においてクラウド系生成AIのような質は期待できないかもしれません。

そこで、自分の使用目的を前提に、DeepSeek-r1、Gemma-3-12b、Gemma-3-27bの3つのモデルで、日英翻訳を行って翻訳評価を行いました。その結果をレポートにまとめたもの(簡易版)が、以下のPDFファイルです。

もしご興味がありましたら、ご閲覧ください。