翻訳横丁の裏路地

We can do anything we want to do if we stick to it long enough.


【アップデート】GlossaryMatch 0.09 用語集エクセルファイル

1年半以上振りに、用語集エクセルファイル「GlossaryMatch」をバージョンアップしました。

なぜ、いまさらバージョンアップなのか?と思われるでしょう。実は、近々、ワードマクロ「WildLight」のマルチ言語対応版(Unicode対応版)である Ver. 2.00 をリリースする予定ですが、Unicodeによる辞書管理を容易にするために GlossaryMatch を使えるように変更致しました。具体的には、WildLight用のテキスト辞書は全て Unicode で出力されるように変更しました。また、「テキスト辞書の読込み」は、従来辞書の Shift-JIS と Unicode の両方を自動判別により読み込めるようにしました。

以上、お役立て下さい。

広告


MSワード正規表現 〜お題に沿って〜 その3

禿頭帽子屋の独語妄言 side A」の「# 翻訳者のための正規表現~勉強会の解説、その3」になぞって、お題その4をワードの正規表現を使って表現してみたいと思います。

お題その4:

・数字の全角半角、それに続く丸カッコの全角半角が混在しているとき、
ぜんぶ一括して「半角数字 + 半スペ + 半角丸カッコ(この中は任意) + 半スペ」に置換する

今回は、かなり難題です。前回のお題の経験を生かして1行で記述してみました。但し、「半角数字」への置換は現状のワードの正規表現では実現できません。(但し、WildLight等を使って複数行の正規表現を実行すれば可能ですが)

【検索】

([0-90-9]{1,})[ ¥((]{1,2}(*)[¥))]

【置換】

¥1 (¥2)

【説明】

([0-90-9]{1,}) で、半角か全角の1桁以上の数字の羅列…にヒットします。それを¥1へ代入。

[△¥((]{1,2} で、半角スペース、もしくは半角か全角の丸括弧開く…にヒット。ヒットする組合せとして「△」「(」「(」「△△」「△(」「△(」「((」「((」「(△」「((」「((」「(△」になります。欲しいのは青文字にした4つです。それ以外の組合せが不幸にもあると同様にヒットする事になります。
半角括弧を検索文字とする際には、¥を前に付ける必要があります。

* で、任意の文字列。
[¥))] で、半角か全角の丸括弧閉じる…にヒット。

[¥((]{1,2}(*)[¥))] で、丸括弧に囲まれた任意の文字列を¥2へ代入。

  • ¥1△(¥2)△

置換句には、半角括弧の前後に半角スペースが入っています。

〜〜〜番外編〜〜〜

全角数字を半角に変換し、上記の正規表現を実行する WildLight の辞書を付けておきます(笑)

やっている事は、全角数字1文字毎を半角へ置き換えて、最後に上記お題の正規表現文字列を実行するようになっています。


GlossaryMatch 実用例その1

Word版GlossaryMatchをちょっとだけ修正して、Ver. 1.01 にしました。

修正内容は、辞書の置換元用語の先頭に半桁の「~」(チルダ)を入れておくと、蛍光ペン付けしないようにしました。

ここでは、この機能を使った使用例を示します。

原稿

 

このような部署名を企業の中で見掛けないでしょうか?
色々な文書に、作成者や改訂者情報、検討チームリストなど、部署名が良く書かれています。こういう部署名などは間違いをなくすために、置換作業で処理したいところです。しかし、困るのが、漢数字に全角半角数字の混在ですね。

これを解決する為に作った辞書ファイルのサンプルが次のものです。(漢数字へ対応するためのサンプルです)

辞書

 

GlossaryMatchでは、蛍光ペンのない文字列に対して、置換元用語の検索を行い、該当するものがあれば置換先用語に置換し、最後に蛍光ペンを付けます。
但し、置換元用語の先頭に、半角「~」(チルダ)が入っている場合は、置換後に蛍光ペンが付きません。例えば上の辞書の第一行目の記述に従うと、「一課」が「1課」と置換されますが、蛍光ペンは付かず、その後の処理でも、この「1課」は置換対象となります。

この辞書ですと、漢数字の一課~五課までを半角数字の1課~5課に置換するものの、蛍光ペンは付けない為、その後の行の処理では置換対象となります。つまり、六行目の「経理([0-9]{1,})課」以降の行で置換の対象となります。

モード選択

 

モードの選択で「2. 完全置換」を選択すると、以下のようなプログレスバーが現れ、置換が終了すると終了画面が出ます。

ProgressBar

 

完成

 

上記のサンプル辞書には、全角数字を半角にするための処理を入れていなかったため、経理1課~経理5課までが置換されずに残っていますが、漢数字だった部署名は全て置換されています。

このように、辞書ファイルに処理の順番で正規表現を記述しておく事で、色々な処理を行う事ができます。

なお、辞書の置換元用語にある「([0-9]{1,})」は、半角数字で1桁以上連続した数字を意味します。1課でも12課でも、123課でも対象となります。そして置換先用語にある「\1」は、置換元用語のカッコ内「()」で該当した数字が代入されます。
つまり、「経理900課」があると、900 が \1 の位置に代入され、Accounting Dept. 900 と置換されます。

 

 


【アップデート】 GlossaryMatch 用語置換ワードマクロ

今回、ワード版のGlossaryMatchの置換方法を変え、若干の機能追加をしましたので、公開します。

GlossaryMatch

今回の変更は以下の通りです。

  • ワイルドカードを使った置換が出来るように変更しました。
    辞書ファイルにワイルドカードによる記述を入れておくことで、色々な検索と置換が可能になりました。但し、細かな記述のチェックを行っていないので、記述内容によってはエラーを吐き出すかもしれません。
  • 「アドイン」メニューにGlossaryMatchのメニューを追加。
  • 大きな辞書や文書を処理する場合、反応なしとなって、ワードが死んだような状態になる(但し、処理はバックグラウンドで行われている)のを回避するため、プログレスバーを表示し、処理残時間を表示するように変更しました。
  • また、処理中に「中止」ボタンにて、中止できるようにしました。
  • モードを、1) 蛍光ペン付け、2) 完全置換、3) 併記置換、4) コメント挿入、の4モードに変更。
  1. 蛍光ペン付け
    辞書に登録された用語が本文に見つかれば、蛍光ペンを付けます。
    このモードは、チェック作業に使用する事を目的に作りました。チェック用の辞書を作っておくと便利です。この記事の後に、いくつか自分用に作ったテキスト辞書を紹介します。
  2. 完全置換
    辞書に登録された用語(置換元用語、置換する用語)に従って、完全に用語を置き換えます。置き換えた用語は蛍光ペン付けされます。
    置換する用語が登録されていない場合は、置換せず、蛍光ペン付けだけ行います。
    (蛍光ペンは、メニューの「蛍光ペンを解除する」を選択すると、解除できます。)
  3. 併記置換
    辞書に登録された用語(置換元用語、置換する用語)に従って、用語を置き換えます。その際、「置換元用語(置換する用語)」で置き換えられます。
    置換する用語が登録されていない場合は、置換せず、蛍光ペン付けだけ行います。
  4. コメント挿入
    辞書に登録された用語(置換元用語)が本文に見つかれば、コメント機能を使って「置換する用語+備考」でコメント付します。

訳文チェック用の辞書を幾つか紹介します。自分の為に作ったもののため、記述間違いなどあって正常に動作しない場合があるかもしれませんが、ご了承ください。あとは、ご自身で改造・追加して頂ければと思います。

  • GMDIC_CHK_数字チェック.txt
    [対象:和英訳、英和訳] 原稿と訳文の数値を蛍光ペン付けします。半角全角数字、月、漢数字、丸付数字などが対象です。詳細は辞書ファイルを見て下さい。
    私の使い方は、原稿と訳文に「蛍光ペン付け」機能を使ってこのチェック辞書を適用し、横に並べて比較してチェックするという流れです。機械的に照合チェックする手段を持たないので、苦肉の策です(笑)
  • GMDIC_CHK_間違い易い英単語.txt
    [対象:英文] ネイティブが間違いやすい英単語や、タイプミスしてスペルチェッカーで見つからない英単語を登録してチェックしています。単に蛍光ペンが付くだけですが、意識してチェックするようになるので検出力が上がります。
  • GMDIC_CHK_JTF日本語標準スタイルガイド.txt
    [対象:日本文] 言わずと知れたJTFの日本語標準スタイルガイドに沿ったチェックをする為のチェック辞書です。全てを網羅している訳ではありませんし、記述ミスもあるかもしれませんので「参考」として見て下さい。

これらの辞書は、いずれ少しづつ更新していこうと思います。また、みなさんもお作りになった辞書を公開してくれると嬉しいですね。

なお、ワードのワイルドカードの記述については、水野麻子さんの「Wordワイルドカード徹底活用ガイド」が役立ちます。(登録不要版がこちらにもあります)

以上、お役に立つようでしたら、ご利用下さい。


[Ver.Up] GlossaryMatch ちょこっとね

GlossaryMatch を固定ページに移動しました。今後の細かな変更は、ブログ上で積極的にアナウンス致しませんので、今後はそちらのページを随時ご覧ください。

https://terrysaito.com/glossarymatch/

今回は、Excel版を 0.07 へ、Word版を0.02 へそれぞれバージョンアップしました。

【変更点】
Excel版:
テキスト形式の辞書ファイル(Word版で使用するテキスト形式辞書)を取り込める機能を追加しました。
これにより、Word版を主に使用される方は、Excel版GlossaryMatchを辞書編集のみの目的に使用する事ができます。具体的には、
1) 最初にExcel版で辞書を作成し、TAB付きテキストファイルに出力。
2) テキスト版辞書をWord版GlossaryMatchで運用。
3) 辞書編集時は、Excel版へ読み込み、編集後、再度テキストファイルへ出力。

カーソルのあるセルから取り込まれたデータを流し込みます。既にデータが入っているセルも上書きされますから注意してください。複数のテキスト版辞書ファイルを読み込む場合は、最初の辞書を読み込み後、データの入っていない行へカーソルを移動し、次の辞書を読み込んでください。(これにより、辞書がマージできる。但し、重複はチェックされません。重複データがあった場合は、セルの色が変わりますので分かります。手作業で重複部を編集してください。)

Word版:
「蛍光ペンなし」時の処理方法を変更。
置換後の文字も置換対象となっていたが、それを回避した。

以上です。