翻訳横丁の裏路地

We can do anything we want to do if we stick to it long enough.


今更のSDL XLIFF Converter for MS Office

Trados 案件は以前から取扱っているのですが、最近、WildLight を使って処理できないかなぁとググったのがきっかけで、SDL XLIFF Converter が手放せないツールになってしまいました。(そもそも WildLight を持ち出す事自体がナンセンスなのですが(笑))

SDL XLIFF Converter for MS Office

これは、Tradosのバイリンガルファイルをワードやエクセルに変換してくれるありがたいツール。簡単に言えば、対訳表みたいなものができる訳です。一旦、ワードになってしまえば、あれこれと WildLight で処理できるので重宝しているんですね。そして、未だやった事はないですが、変換したワードファイルからバイリンガルファイルへ戻せるらしいのです。そうなると、色々と便利な事が出てきますよね。

先日お会いした Trados使いの方がご存知なかったので、ブログ記事にしておきました。

 

広告


WildLight 使用例その1

これから、何回かに分けて、WildLight の使用実例を紹介していこうと思います。

今日は、ツイッターで流した「用語抜き」

漢字とカタカナをエクセルへ抽出するには、以下のような記述を辞書に記します。

[ァ-ヾ一-鶴]
ExtractH2Excel

ワードへ抽出する場合は、以下のような記述を辞書に記します。

[ァ-ヾ一-鶴]
ExtractH2Word

1行目の「ァ-ヾ」がカタカナ、「一-鶴」が漢字を検索する検索文字列です。[ァ-ヾ一-鶴]で、カタカナと漢字を検索し、蛍光ペンを付けます。
2行目の「ExtractH2Excel」で、蛍光ペンが付いた文字列を抽出し、抽出した文字列からユニークな文字列だけをその登場頻度データと一緒にエクセルへ出力します。「ExtractH2Word」の場合は、同様に抽出処理を行った後、ユニークな文字列だけをワードの新規文書として出力します。

この方法を、用語集作成の下準備に使う事ができます。

【参考辞書ファイル】

上記の記述を入れた辞書ファイルを貼り付けておきますので、実験してみて下さい。


GlossaryMatch 実用例その1

Word版GlossaryMatchをちょっとだけ修正して、Ver. 1.01 にしました。

修正内容は、辞書の置換元用語の先頭に半桁の「~」(チルダ)を入れておくと、蛍光ペン付けしないようにしました。

ここでは、この機能を使った使用例を示します。

原稿

 

このような部署名を企業の中で見掛けないでしょうか?
色々な文書に、作成者や改訂者情報、検討チームリストなど、部署名が良く書かれています。こういう部署名などは間違いをなくすために、置換作業で処理したいところです。しかし、困るのが、漢数字に全角半角数字の混在ですね。

これを解決する為に作った辞書ファイルのサンプルが次のものです。(漢数字へ対応するためのサンプルです)

辞書

 

GlossaryMatchでは、蛍光ペンのない文字列に対して、置換元用語の検索を行い、該当するものがあれば置換先用語に置換し、最後に蛍光ペンを付けます。
但し、置換元用語の先頭に、半角「~」(チルダ)が入っている場合は、置換後に蛍光ペンが付きません。例えば上の辞書の第一行目の記述に従うと、「一課」が「1課」と置換されますが、蛍光ペンは付かず、その後の処理でも、この「1課」は置換対象となります。

この辞書ですと、漢数字の一課~五課までを半角数字の1課~5課に置換するものの、蛍光ペンは付けない為、その後の行の処理では置換対象となります。つまり、六行目の「経理([0-9]{1,})課」以降の行で置換の対象となります。

モード選択

 

モードの選択で「2. 完全置換」を選択すると、以下のようなプログレスバーが現れ、置換が終了すると終了画面が出ます。

ProgressBar

 

完成

 

上記のサンプル辞書には、全角数字を半角にするための処理を入れていなかったため、経理1課~経理5課までが置換されずに残っていますが、漢数字だった部署名は全て置換されています。

このように、辞書ファイルに処理の順番で正規表現を記述しておく事で、色々な処理を行う事ができます。

なお、辞書の置換元用語にある「([0-9]{1,})」は、半角数字で1桁以上連続した数字を意味します。1課でも12課でも、123課でも対象となります。そして置換先用語にある「\1」は、置換元用語のカッコ内「()」で該当した数字が代入されます。
つまり、「経理900課」があると、900 が \1 の位置に代入され、Accounting Dept. 900 と置換されます。

 

 


【アップデート】 GlossaryMatch 用語置換ワードマクロ

今回、ワード版のGlossaryMatchの置換方法を変え、若干の機能追加をしましたので、公開します。

GlossaryMatch

今回の変更は以下の通りです。

  • ワイルドカードを使った置換が出来るように変更しました。
    辞書ファイルにワイルドカードによる記述を入れておくことで、色々な検索と置換が可能になりました。但し、細かな記述のチェックを行っていないので、記述内容によってはエラーを吐き出すかもしれません。
  • 「アドイン」メニューにGlossaryMatchのメニューを追加。
  • 大きな辞書や文書を処理する場合、反応なしとなって、ワードが死んだような状態になる(但し、処理はバックグラウンドで行われている)のを回避するため、プログレスバーを表示し、処理残時間を表示するように変更しました。
  • また、処理中に「中止」ボタンにて、中止できるようにしました。
  • モードを、1) 蛍光ペン付け、2) 完全置換、3) 併記置換、4) コメント挿入、の4モードに変更。
  1. 蛍光ペン付け
    辞書に登録された用語が本文に見つかれば、蛍光ペンを付けます。
    このモードは、チェック作業に使用する事を目的に作りました。チェック用の辞書を作っておくと便利です。この記事の後に、いくつか自分用に作ったテキスト辞書を紹介します。
  2. 完全置換
    辞書に登録された用語(置換元用語、置換する用語)に従って、完全に用語を置き換えます。置き換えた用語は蛍光ペン付けされます。
    置換する用語が登録されていない場合は、置換せず、蛍光ペン付けだけ行います。
    (蛍光ペンは、メニューの「蛍光ペンを解除する」を選択すると、解除できます。)
  3. 併記置換
    辞書に登録された用語(置換元用語、置換する用語)に従って、用語を置き換えます。その際、「置換元用語(置換する用語)」で置き換えられます。
    置換する用語が登録されていない場合は、置換せず、蛍光ペン付けだけ行います。
  4. コメント挿入
    辞書に登録された用語(置換元用語)が本文に見つかれば、コメント機能を使って「置換する用語+備考」でコメント付します。

訳文チェック用の辞書を幾つか紹介します。自分の為に作ったもののため、記述間違いなどあって正常に動作しない場合があるかもしれませんが、ご了承ください。あとは、ご自身で改造・追加して頂ければと思います。

  • GMDIC_CHK_数字チェック.txt
    [対象:和英訳、英和訳] 原稿と訳文の数値を蛍光ペン付けします。半角全角数字、月、漢数字、丸付数字などが対象です。詳細は辞書ファイルを見て下さい。
    私の使い方は、原稿と訳文に「蛍光ペン付け」機能を使ってこのチェック辞書を適用し、横に並べて比較してチェックするという流れです。機械的に照合チェックする手段を持たないので、苦肉の策です(笑)
  • GMDIC_CHK_間違い易い英単語.txt
    [対象:英文] ネイティブが間違いやすい英単語や、タイプミスしてスペルチェッカーで見つからない英単語を登録してチェックしています。単に蛍光ペンが付くだけですが、意識してチェックするようになるので検出力が上がります。
  • GMDIC_CHK_JTF日本語標準スタイルガイド.txt
    [対象:日本文] 言わずと知れたJTFの日本語標準スタイルガイドに沿ったチェックをする為のチェック辞書です。全てを網羅している訳ではありませんし、記述ミスもあるかもしれませんので「参考」として見て下さい。

これらの辞書は、いずれ少しづつ更新していこうと思います。また、みなさんもお作りになった辞書を公開してくれると嬉しいですね。

なお、ワードのワイルドカードの記述については、水野麻子さんの「Wordワイルドカード徹底活用ガイド」が役立ちます。(登録不要版がこちらにもあります)

以上、お役に立つようでしたら、ご利用下さい。


1件のコメント

[ワードマクロ] 戸籍翻訳支援マクロ

戸籍翻訳に絡む話題を、過去2回記事にしました。

これらをベースに、戸籍翻訳支援用ワードマクロ(アドイン)を作成しましたので、公開致します。

Koseki-support.dotm

右クリックにてダウンロードして下さい。

【登録されているマクロとその機能】

1) TRY_戸籍_下方置換

  • 置換したい語を範囲指定してから、このマクロを起動してください。
  • 置換後の語句を聞いてきますので、入力してください。
  • 範囲指定された語句を、入力された語句で置換します。
  • 置換はカーソル位置から文書の下方へのみ行われます。(カーソル位置より前には適用されません)
  • 使用例) 姓名など、複数回出現するものについて、一括で置換する。

2) TRY_戸籍_和暦西暦変換

  • 先に公開したワードマクロのバージョンアップ版です。
  • 操作方法は変わりません。
  • 但し、範囲指定されている語句があった場合は、その語句と変換された西暦が置換されます。
  • 置換は、カーソル位置から文書の下方へのみ行われます。(カーソル位置より前には適用されません)
  • 使用例) 婚姻日や誕生日など、複数回出現するものに対して、一括して入力(置換)が掛けられます。

3) TRY_郵次郎検索

  • 郵次郎検索を行います。
  • マクロを実行すると、検索する文字列を聞いてきますので、県名、市名、郡名、町名、郵便番号等を入力すれば、ブラウザが立ち上がり、検索結果が表示されます。
  • 先の記事にも書きましたが、町名で検索が手っ取り早いです。

このアドインのインストール方法については、GlossaryMatch の記載を参考にして下さい。