さて、「禿頭帽子屋の独語妄言 side A」の「# 翻訳者のための正規表現~勉強会の解説、その2」になぞって、お題その3をワードの正規表現を使って表現してみたいと思います。
お題その3
- 和文中の余分なスペースを削除する
例:国内の△農業△生産 → 国内の農業生産
【検索】
([一-鶴ァ-ヾぁ-んー。、・]) ([一-鶴ァ-ヾぁ-んー。、・])
【置換】
¥1¥2
【解説】
- [一-鶴ァ-ヾぁ-んー。、・]………漢字、全角カタカナ、ひらがな、長音、句読点、中黒…の中の任意の文字
- () ………括弧内の式の結果が、置換語の¥nへ代入されます。()の登場順番に従い ¥1, ¥2 … となります。
例えば、「あいうえお△かきくけこ」の場合は、「お△か」が対象としてヒットします。¥1には「お」が代入され、¥2には「か」が代入されます。置換句に「¥1¥2」と半角スペースなく記述しているので、置換結果は「おか」となります。
このようなワードの正規表現を使う上で、指定する文字範囲を知る必要がありますね。以下に参考として列記します。
(「」内が対象の文字範囲指定です)
- ひらがな …… 「ぁ-ん」
- 半角カタカナ …… 「ヲ-゚」
- 半角数字 …… 「0-9」
- 半角英字 …… 「a-zA-Z」
- 全角カタカナ …… 「ァ-ヾ」
- 全角数字 …… 「0-9」
- 全角英字 …… 「a-zA-Z」
- 漢字 …… 「一-鶴」
- 全角ギリシャ文字 …… 「Α-Ωα-ω」
- 全角ひらがな&カタカナ&漢字&記号) …… 「、-鶴」
スペースの処理は、私も結構使います。原稿処理や翻訳文チェック時に使用しています。英文のスペーシングが2スペース以上のもの(入力ミス等による)を1スペースに修正したり(「([a-zA-Z0-9,.])△{2,}([a-zA-Z0-9])」→「¥1△¥2」)、紛れ込んだ全角スペースを半角スペースへ置き換えたり(「□」→「△」)、でも、こういう置換作業をしていて心配なのは、思いもよらないところまで置換されてしまう事ですね。そういう時のために、置換作業をする際に、置換後の文字列が蛍光ペン表示されるようにすると良いです。また、自分が指定した検索文字列がどのようにヒットするのかを勉強する上でもビジュアル化するのに便利です。
置換後文字に蛍光ペンを付ける方法:「検索と置換」ウインドウで、「置換後の文字列」を入力する際に、「検索」のところの「書式」をクリックし、「蛍光ペン」を選択します。