翻訳横丁の裏路地

We can do anything we want to do if we stick to it long enough.

cat-1698113_640


CATに飛びつかない

「飛びつくのは猫の方だろう?」と、タイトルを読んで突っ込んでくれた方、ありがとう(笑)

昨日書いたブログ記事をプレビューしていたら、関連記事で以下のようなものが出てきた。

100%マッチはマッチしていない

これは2011年に書いた記事で、確か顧客に迫られてTradosを導入し、半年ほど経った頃に書いた記事だと思う。既にこういう認識を持っていたんだと自分なりに感心する。

実は先日、ある翻訳者の集まりに参加しました。訳文の質が良いと評価の高いある翻訳者さんと立ち話をしたのですが、翻訳品質を高めるために並々ならぬ努力をされていました。すべて手作業でされていることから、効率をあげるのにツール使用が必要かもしれないと考えられおられるようで、そこに翻訳支援ツールの話が登場。私は、せっかくそこまで高めた翻訳品質と意識を、ツールで壊して欲しくないと思ったので、CAT使用による翻訳品質へ及ぼす影響をあれこれとお話ししました。(この方の場合、WildLightのようなツールで十分効率化が図れます。)

そこで1つ気になったことは、ツールと聞くと、一足飛びに「翻訳支援ツール(CAT)」まで考えてしまうことです。もっとも、いろいろと存在するツールの目的や機能を把握しないで考えていることなので、仕方の無いことですよね。でも、同じようにいきなりCATに言及する翻訳者さんを見てきているので、ツールに関して何も知らない方は、いきなりCATに飛びついてしまう危険性があるなと感じました。

先日の福岡翻訳勉強会小林晋也さんが話されたような内容を、初学者や初心者を含め、ツールを知らない翻訳者の方の耳に入れる必要があると強く感じました。どういうツールがあり、どういう機能を持っており、どういう目的で使用できるのか、そしてそれらを使用する上でのメリットとデメリット。小林さんのセミナーの良いところは、デメリットの説明が単なるQCDの世界で完結しておらず、翻訳者としての能力や将来への影響にも踏み込んでおられる点です。

ツールが何物かをまだ理解されていない方は、是非、小林さんのセミナーを受けていただきたいと考えるのと、いきなり浅い知識でCATに飛びつかず、周りにいる翻訳者仲間の話や各ツールのホームページなどを読んで知識を深めて、ツール選びから慎重に行って欲しいなぁと思います。

 

letter-1697604_640


マッチ率による価格は破綻

最近ときどき耳にするのは、本来、翻訳支援ツール(CAT)の使用が許容できると言われているマニュアルなどの文書種類を逸脱して、プレゼン資料やコピーライティングといった、同じ原文でも表現の仕方により訳文の幅が大きく違ってくる文書種類にまで、CAT適用を要求してくる翻訳会社やクライアントが増えてきているらしい。(翻訳支援ツールの誤使用)

これは、CAT使用が可能だと判断する立場である翻訳会社の翻訳的無知が原因ですが、中の人間の入れ替わりとともに、本来の考え方が忘れ去られているのだと思います。

マッチ率とレートには前提となる文書種類があるはず

私は以前から疑問に思っているのは、「訳文の再利用」という考えがあるからこそのマッチ率による価格設定だと思うのですが、「果たして本当に再利用できているのか?」ということ。商品名称や部品名称といった固有名詞が違うだけであれば、概ね、その単語を置き換え、必要に応じて冠詞と単複を合わせ込めばオリジナルの訳文を「再利用」できる(のか?ほんとに?)のでしょうが、それを超えると「再利用」ではなく「再翻訳」に等しいのではないか?と感じています。もちろん、マッチ率はそういったものの登場頻度を鑑み、平均化された数値だと想像していますが、その平均値の前提となるのが適用する原稿の文書種類だと考えるわけです。

つまり、マッチ率による価格設定自体も、適用する文書種類によって違ったものが設定されていて然るべきで、前述のプレゼン資料などのケースなら、「マッチ率は何%だろうが100%の支払い」という価格設定をせざるを得ないでしょう。

無管理TM故にマッチ率は破綻。再利用可能率で考えるべき?

どうも、言葉に惑わされている気がします。「マッチ率」は「再利用可能率」と頭の中で置き換えて考えた方が良いのかもしれません。マッチ率というとTMと原文のデータ的に合致した割合を意味しますが、再利用可能率として考えると、合致したTMの訳文が再利用可能かどうかの率ですから、全く意味が変わってきます。そもそもTMの訳文が100%マッチしようとも再利用できるかどうかは不明です。ましてや、TMの管理がされていなければ、訳文が再利用できる可能性はかなり低いだろうと思うのです。(これ、クラウド系CATだと野生の王国なんぢゃ!?)

翻訳会社自身がマッチ率によるレートを破綻させている

翻訳会社がCAT使用の前提条件を忘れ、あらゆる文書種類へ適用することを始めた時点で、マッチ率レートがひとつでは破綻する状況を作り出しています。今後、マッチ率レートはひとつではないという認識に切り換えて、翻訳者さんは交渉してみるのも良いと思います。

プレゼン資料のCAT使用案件がきたら、「このマッチ率レートは、どういう文書種類を対象としていますか?」と聞いてみると面白いかもしれませんね。「統一レートです」と言われたら、「それ、おかしいでしょう?」という話になる。私だったら、マッチ率関係なく翻訳料は100%お支払いするね。過去訳の再利用など全く目的とせず、訳後のレイアウト調整を簡略化するとか用語集適用という利を取る意味でのCAT使用になるだろう。

 

img_9253


誰の言葉?

以前、同僚達に、機械翻訳や翻訳支援ツールを使用する上でのリスクを説明するのに、以下の話を引用して説明したことがあります。

  • 佐々木希「夜道で襲われて抵抗したんだけど死んじゃったらどうしようかと思った」
  • 吉田沙保里「夜道で襲われて抵抗したんだけど死んじゃったらどうしようかと思った」

引用元は「Pumpkin-NEWS」の2015年1月23日の記事。元ネタは2chらしい。

記事の中では、話される言葉はまったく同じなのに、話者が変わることで読者の捉える意味が変わることを面白おかしく話題にされています。

この比較は、とても面白いと思いました。読者の持つ話者に関する情報により、言葉の解釈が変化している。これは翻訳でいつも注意しているポイントのひとつですよね。作者意図、背景情報、前後関係、想定読者などを考えながら原文を読み解き、訳文に落とし込む。上記の引用文を仮に翻訳した場合、コンテキストを失うことなく、まったく同じ訳文にできるでしょうか?(記事の面白味を残す云々はこの場合無視)。異文化異言語の読者が、話者の背景情報を持っているとは想定できませんから、そこに何かの手当てをする必要があるでしょう。

もしも、この引用文を翻訳支援ツールに入れた場合、どうなるでしょう?当然、ふたつの文は100%マッチになるでしょうから、翻訳メモリーに登録した訳が単純に、このふたりの言葉として適用されるのでしょう。そして、もし過去訳とマッチしてしまった上に「100%マッチは触らないでください」という翻訳会社の指示があれば、その訳が原文のコンテキストを失ったそのままの状態で放置されることになりますね。

この例を学びとして捉え、改めて心に決めたことは以下の通り。

  • 翻訳支援ツールを使う翻訳対象は、分野、文書種類などを含め、慎重に検討すること。(無闇に使用を判断してはならない)
  • 顧客が指示しない限り、マッチ率に関係なく、コンテキストが保てないものは修正翻訳必須とし、その対価を支払うこと。(「100%マッチには手を付けるな」といった誤った指示をしないこと)

問題は、翻訳会社が翻訳支援ツールを支援ツールではなく、翻訳ツールと間違って理解し、使っていることではないでしょうか?翻訳支援ツールは、翻訳を「支援」するツールであって、翻訳者の意思を無視して、訳文を勝手に確定するような使い方は明らかに行き過ぎだと思います。


今更のSDL XLIFF Converter for MS Office

Trados 案件は以前から取扱っているのですが、最近、WildLight を使って処理できないかなぁとググったのがきっかけで、SDL XLIFF Converter が手放せないツールになってしまいました。(そもそも WildLight を持ち出す事自体がナンセンスなのですが(笑))

SDL XLIFF Converter for MS Office

これは、Tradosのバイリンガルファイルをワードやエクセルに変換してくれるありがたいツール。簡単に言えば、対訳表みたいなものができる訳です。一旦、ワードになってしまえば、あれこれと WildLight で処理できるので重宝しているんですね。そして、未だやった事はないですが、変換したワードファイルからバイリンガルファイルへ戻せるらしいのです。そうなると、色々と便利な事が出てきますよね。

先日お会いした Trados使いの方がご存知なかったので、ブログ記事にしておきました。

 


WildLight Ver. 1.00 公開

ワードアドインマクロの WildLight Ver. 1.00 を公開しました。

今回は、色々なおまけ機能を搭載したバージョンとなります。

当ブログのWildLight タブからご確認下さい。


WildLight 辞書 ライブラリーを一般公開

拙作ワードマクロ「WildLight」の辞書ファイルを以下のフォルダーにて一般公開しています。
どうぞ、ご利用下さい。また、便利な辞書ができましたら、以下のフォームからご連絡下さい。メールをお送りしますので、返信に辞書を添付してお送り下さい。ライブラリーへ登録致します。

WildLight 辞書ライブラリー

辞書ライブラリーの共同編集者を募集します。前提として、私と面識のある方限定です。興味がある方は、Twitter にて @terrysaito へDMをお願いします。


ワイルドカードセミナー「翻訳勉強会:十人十色」

2013年11月12日に翻訳勉強会「十人十色」の「ワイルドカードセミナー」が開催され、当方も拙い話しをさせて頂きました。その時に使用したプレゼン資料を以下に公開致します。

十人十色ワイルドカードセミナー20131112.pptx

拙作のワードアドインマクロを利用した使用方法を説明させて頂きましたが、結局、ワイルドカード単体でできる事には限りがあり、大量の原稿ファイルや訳文ファイルを扱う私のような者には、マクロとの組合せで使用する事が大前提となります。

WildLight の辞書は単純なテキストファイルであり、そこにワイルドカードによる記述や、検索語、検索語と置換語を記載しているだけです。十分に検証したワイルドカードの記述を、辞書ファイルに蓄積する事で、知の蓄えになる訳です。

今回のセミナーを機会に、ワイルドカードを勉強してみて欲しいですね。


WildLight 使用例その1

これから、何回かに分けて、WildLight の使用実例を紹介していこうと思います。

今日は、ツイッターで流した「用語抜き」

漢字とカタカナをエクセルへ抽出するには、以下のような記述を辞書に記します。

[ァ-ヾ一-鶴]
ExtractH2Excel

ワードへ抽出する場合は、以下のような記述を辞書に記します。

[ァ-ヾ一-鶴]
ExtractH2Word

1行目の「ァ-ヾ」がカタカナ、「一-鶴」が漢字を検索する検索文字列です。[ァ-ヾ一-鶴]で、カタカナと漢字を検索し、蛍光ペンを付けます。
2行目の「ExtractH2Excel」で、蛍光ペンが付いた文字列を抽出し、抽出した文字列からユニークな文字列だけをその登場頻度データと一緒にエクセルへ出力します。「ExtractH2Word」の場合は、同様に抽出処理を行った後、ユニークな文字列だけをワードの新規文書として出力します。

この方法を、用語集作成の下準備に使う事ができます。

【参考辞書ファイル】

上記の記述を入れた辞書ファイルを貼り付けておきますので、実験してみて下さい。


【ワードマクロ】WildLight アップデート

ワードマクロの WildLight を少しバージョンアップしました。主な内容は以下の通り。

  • 最後に開いた辞書フォルダーを記録し、次回使用時にそのフォルダを開くようにした。
  • 以下の3つのコマンドを追加した。

HCLR : 蛍光ペンを解除
Zen2Han,[変換文字] :変換文字に指定されたものを全角から半角に変換。 例)Zen2Han,[0-9] (全角数字半角変換)
Han2Zen,[変換文字] :変換文字に指定されたものを半角から全角に変換。 例)Han2Zen,[a-zA-Z] (半角英文字を全角変換)
※Zen2Han, Han2Zen は変換後の文字列に蛍光ペンは付きません。

何と言っても、全角半角変換、半角全角変換が出来るように変更した点が一番大きいと思います。ダウンロードは、WildLight のページからお願いします。

お試し用の辞書をいくつか公開しますので参考にして下さい。


MSワード正規表現 〜お題に沿って〜 その3

禿頭帽子屋の独語妄言 side A」の「# 翻訳者のための正規表現~勉強会の解説、その3」になぞって、お題その4をワードの正規表現を使って表現してみたいと思います。

お題その4:

・数字の全角半角、それに続く丸カッコの全角半角が混在しているとき、
ぜんぶ一括して「半角数字 + 半スペ + 半角丸カッコ(この中は任意) + 半スペ」に置換する

今回は、かなり難題です。前回のお題の経験を生かして1行で記述してみました。但し、「半角数字」への置換は現状のワードの正規表現では実現できません。(但し、WildLight等を使って複数行の正規表現を実行すれば可能ですが)

【検索】

([0-90-9]{1,})[ ¥((]{1,2}(*)[¥))]

【置換】

¥1 (¥2)

【説明】

([0-90-9]{1,}) で、半角か全角の1桁以上の数字の羅列…にヒットします。それを¥1へ代入。

[△¥((]{1,2} で、半角スペース、もしくは半角か全角の丸括弧開く…にヒット。ヒットする組合せとして「△」「(」「(」「△△」「△(」「△(」「((」「((」「(△」「((」「((」「(△」になります。欲しいのは青文字にした4つです。それ以外の組合せが不幸にもあると同様にヒットする事になります。
半角括弧を検索文字とする際には、¥を前に付ける必要があります。

* で、任意の文字列。
[¥))] で、半角か全角の丸括弧閉じる…にヒット。

[¥((]{1,2}(*)[¥))] で、丸括弧に囲まれた任意の文字列を¥2へ代入。

  • ¥1△(¥2)△

置換句には、半角括弧の前後に半角スペースが入っています。

〜〜〜番外編〜〜〜

全角数字を半角に変換し、上記の正規表現を実行する WildLight の辞書を付けておきます(笑)

やっている事は、全角数字1文字毎を半角へ置き換えて、最後に上記お題の正規表現文字列を実行するようになっています。