翻訳横丁の裏路地

We can do anything we want to do if we stick to it long enough.


GlossaryMatch 実用例その1

Word版GlossaryMatchをちょっとだけ修正して、Ver. 1.01 にしました。

修正内容は、辞書の置換元用語の先頭に半桁の「~」(チルダ)を入れておくと、蛍光ペン付けしないようにしました。

ここでは、この機能を使った使用例を示します。

原稿

 

このような部署名を企業の中で見掛けないでしょうか?
色々な文書に、作成者や改訂者情報、検討チームリストなど、部署名が良く書かれています。こういう部署名などは間違いをなくすために、置換作業で処理したいところです。しかし、困るのが、漢数字に全角半角数字の混在ですね。

これを解決する為に作った辞書ファイルのサンプルが次のものです。(漢数字へ対応するためのサンプルです)

辞書

 

GlossaryMatchでは、蛍光ペンのない文字列に対して、置換元用語の検索を行い、該当するものがあれば置換先用語に置換し、最後に蛍光ペンを付けます。
但し、置換元用語の先頭に、半角「~」(チルダ)が入っている場合は、置換後に蛍光ペンが付きません。例えば上の辞書の第一行目の記述に従うと、「一課」が「1課」と置換されますが、蛍光ペンは付かず、その後の処理でも、この「1課」は置換対象となります。

この辞書ですと、漢数字の一課~五課までを半角数字の1課~5課に置換するものの、蛍光ペンは付けない為、その後の行の処理では置換対象となります。つまり、六行目の「経理([0-9]{1,})課」以降の行で置換の対象となります。

モード選択

 

モードの選択で「2. 完全置換」を選択すると、以下のようなプログレスバーが現れ、置換が終了すると終了画面が出ます。

ProgressBar

 

完成

 

上記のサンプル辞書には、全角数字を半角にするための処理を入れていなかったため、経理1課~経理5課までが置換されずに残っていますが、漢数字だった部署名は全て置換されています。

このように、辞書ファイルに処理の順番で正規表現を記述しておく事で、色々な処理を行う事ができます。

なお、辞書の置換元用語にある「([0-9]{1,})」は、半角数字で1桁以上連続した数字を意味します。1課でも12課でも、123課でも対象となります。そして置換先用語にある「\1」は、置換元用語のカッコ内「()」で該当した数字が代入されます。
つまり、「経理900課」があると、900 が \1 の位置に代入され、Accounting Dept. 900 と置換されます。