GlossaryMatchの簡易機能版を作成しましたので公開します。
詳しくはトップページのタブにある「WildLight」をご参照ください。
ワード正規表現の記事にある「お題3」を記述したWildLight用辞書ファイルを、以下にサンプルとして置いておきます。
どうぞ、ご参考にされてください。
投稿者: Terry Saito コメントする
GlossaryMatchの簡易機能版を作成しましたので公開します。
詳しくはトップページのタブにある「WildLight」をご参照ください。
ワード正規表現の記事にある「お題3」を記述したWildLight用辞書ファイルを、以下にサンプルとして置いておきます。
どうぞ、ご参考にされてください。
投稿者: Terry Saito 2件のコメント
さて、「禿頭帽子屋の独語妄言 side A」の「# 翻訳者のための正規表現~勉強会の解説、その2」になぞって、お題その3をワードの正規表現を使って表現してみたいと思います。
お題その3
【検索】
([一-鶴ァ-ヾぁ-んー。、・]) ([一-鶴ァ-ヾぁ-んー。、・])
【置換】
¥1¥2
【解説】
例えば、「あいうえお△かきくけこ」の場合は、「お△か」が対象としてヒットします。¥1には「お」が代入され、¥2には「か」が代入されます。置換句に「¥1¥2」と半角スペースなく記述しているので、置換結果は「おか」となります。
このようなワードの正規表現を使う上で、指定する文字範囲を知る必要がありますね。以下に参考として列記します。
(「」内が対象の文字範囲指定です)
スペースの処理は、私も結構使います。原稿処理や翻訳文チェック時に使用しています。英文のスペーシングが2スペース以上のもの(入力ミス等による)を1スペースに修正したり(「([a-zA-Z0-9,.])△{2,}([a-zA-Z0-9])」→「¥1△¥2」)、紛れ込んだ全角スペースを半角スペースへ置き換えたり(「□」→「△」)、でも、こういう置換作業をしていて心配なのは、思いもよらないところまで置換されてしまう事ですね。そういう時のために、置換作業をする際に、置換後の文字列が蛍光ペン表示されるようにすると良いです。また、自分が指定した検索文字列がどのようにヒットするのかを勉強する上でもビジュアル化するのに便利です。
置換後文字に蛍光ペンを付ける方法:「検索と置換」ウインドウで、「置換後の文字列」を入力する際に、「検索」のところの「書式」をクリックし、「蛍光ペン」を選択します。
投稿者: Terry Saito コメントする
4月23日に翻訳勉強会「十人十色」で、正規表現入門セミナーを行いました。その時の講師の一人 高橋さんが、受講者から寄せられたお題を例にして、秀丸エディタによる正規表現の実例と説明をブログ「禿頭帽子屋の独語妄言 side A」で連載されています。
私は、業務ではマイクロソフトワードを使ってそういった処理しているので、どうしてもワードの「ワイルドカード+正規表現」の組合せでの実現方法を考えてしまいます。Twitter で、高橋さんのお題説明に沿ってワードの正規表現説明をしてみようか?とツイートしたら、意外に反響がありましたので、高橋さんのご了解をいただいて「ワード正規表現」を当ブログで説明していきたいと思います。
最初に断っておきますが、私もワードの正規表現を使い始めて、まだ日が浅いです。「それ違うぞ」「こう表現した方がいい」というツッコミを是非お願い致します。
〜〜〜〜
ここでは、私の持つWindows Word 2007とMac Word 2011をベースに説明を進めます。他バージョンの方はごめんなさい。でも、やり方は同じ筈です。
ワード上でこれらの検索・置換を行う上でのお約束として、「ワイルドカードを使用する」をレ点してONにして下さい。
Windows Word 2007: CTRL+H で「検索と置換」ウインドウを出し、「オプション(M)」を押すと「検索オプション」が出ます。そこに「ワイルドカードを使用する」がありますので、レ点を入れてONにしておいて下さい。
Mac Word 2011: shift+command+H で「検索と置換」サイドウインドウを出し、ギアマークを押して「高度な検索と置換」を選択します。「▼」を押すと「検索オプション」が出ますので、そこにある「ワイルドカードを使用する」にレ点を入れてONにします。
〜〜〜〜
今回は、高橋さんのブログの「# 翻訳者のための正規表現~勉強会の解説、その1」のお題内容をワードの正規表現を使ってやってみます。
表記については、高橋さんのブログの記述に従います。
- 「お題」と【解説】の中では半角スペースを△、全角スペースを□で表します。
- 【検索】、【置換】の中では、半角スペースも全角スペースも実際の文字で表しています。
したがって、【検索】【置換】の文字列は、そのままコピペすれば試すことができます。
お題その1
・Page△12 → 12ページ
【検索】
Page ([0-9]{1,})
【置換】
¥1ページ
【解説】
この場合の「([0-9]{1,})」とは、検索対象は「半角数字が1回以上連続している箇所」で、それを¥1へ代入します。お題の例ですと「12」がこれに該当します。
秀丸エディタの正規表現で、 ¥f (区切り文字)で区切られた前後の式の結果が、それぞれ ¥0, ¥1 へ代入されると習いました。ワードでは半角括弧()内の式の結果が代入されます。()の登場する順番で ¥1, ¥2… と代入されます。秀丸エディタは¥0からでしたが、ワードは ¥1 から始まります。
お題その1の応用
・Page△12 → 12ページ
・Page24 → 24ページ
さて、これがワードでは問題なのです。私の知る限り、秀丸エディタの正規表現にある「?」(0か1回)に該当する表現がないのです(ちなみにワードでは「?」は任意の一文字という意味になります)。従って、上記のお題その1の置換を行い、かつ、以下の置換を行って初めて、この応用問題をクリアできます。
(もし、1文で表現できる方法をご存知の方は、教えて下さい)
きました!きました!読者さんから、こうすれば一行で表現できる!という案が、それを以下に示します。
【検索】
Page([0-9]{1,})
Pag[e ]{1,2}([0-9]{1,})
【置換】
¥1ページ
【解説】
Pag[e△]{1,2} で、Page, Pag△, Page△, Pagee, Pag△e, Pag△△ が対象になります。ここで欲しいのは「Page」と「Page△」ですね。それ以外の「Pag△, Pagee, Pag△e, Pag△△」 が有り得るか?って事ですが、無いと考えていいでしょう。
正規表現は組合せ方を工夫する事で、色々な事ができますが、こういう発想はとても素敵ですよね。参りました(笑)
@trantran93 さん、ありがとうございました。
先のお題その1と違うのは、Pageの後ろにあった半角スペースをなくしただけです。半角スペースがあるのとないのと…という表現ができないので、2段階で置換する形になってしまいます。
例えば、Page△{0,}([0-9]{1,}) なんて記述ができれば良いのですが、上で説明した通り {0,} というゼロ指定が許されていません。(「検索した文字列」に指定したパターン マッチングが正しくありません…というエラーになる)
お題その2
・長いカタカナ語を最初の3文字にしたい
例:「クルーズ・コントロール」を「クルー」に
【検索】
([ァ-ヾ][ァ-ヾー・]{2})[ァ-ヾー・]{1,}
【置換】
¥1
【解説】
([ァ-ヾ][ァ-ヾー・]{2})[ァ-ヾー・]{1,} :1文字目が全角カタカナで、2文字と3文字目が長音、中黒、全角カタカナのいずれか、4文字目以降が長音、中黒、全角カタカナのいずれかである文字列が検索され、最初の3文字の文字列が ¥1 へ代入される。
〜〜〜〜〜〜〜
上記のお題その1の応用のようなケースですと、2つの置換作業を行わないと対応できません。こういう作業を一括で行うにはマクロに盛り込んでしまうのが1つの手ですが、検索対象が変わるたびにマクロを書き換えるのも手間が掛かります。
そこで私が使っているのが拙作のGlossaryMatchなんです。上記のケースですと、以下のようなテキスト型の辞書ファイルを作り、全置換で適用すれば、一度に適用できます。
Page ([0-9]{1,}) <TAB> ¥1
Page([0-9]{1,}) <TAB> ¥1
検索対象が変われば記述を変えるだけで対応できます。ちょこちょこ検索対象を変えるなら、辞書ファイルをノートパッド等で開いたままにして、記述を変更→上書き保存→GlossaryMatchで実行…のサイクルを繰り返せば楽です。
以上、ご参考です。
投稿者: Terry Saito 1件のコメント
SNSを題材とした物書きをしながら、色々と考えを巡らしているのですが、翻訳者にとってネット上で実名を晒す事は、果たしてマイナスなのでしょうか?
SNSをパーソナルブランディングのために積極的に使う通訳者・翻訳者さんは、当然実名を使っています。自らの名前をブランドとして前面に打ち出しているのですから当然ですよね。
では、そうではない通訳者・翻訳者さん達はどうでしょうか?
同業者とコミュニケーションできる程度でいい…と考えている人には、ネットで実名を晒すなんて飛んでもないと考える方が多い事でしょう。
遡る事二年前、翻訳者募集をした事があります。その時の事を思い出してみたのですが、募集戴いた翻訳者さんの情報を見て、一番最初に行った事は、Googleの検索窓に応募者のフルネームを入力し、検索する事でした。
目的は、ネット上にその方の情報が存在しているか?を確認し、その情報を読むためです。
最近は企業の人事が、新卒者採用時にネットで人物検索しているというあれと同じです。
私とネットで繋がっている方であれば、その方を多少なりでも知っている訳ですから、人物理解の参考になります。また、ネット上で実名を使っている方だった場合、例えば、ブログを持っていて、実名で記事を書いている方だった場合には、その記事からどのような方かが分かります。もし、翻訳に関するブログであれば、履歴書・経歴書では表現されない「プロ意識」を理解する助けになり、また、翻訳の実力を類推する事が出来ます。少なくとも実名で勝負している点は、信用できる人物かも?と言う評価に繋がるでしょう。
つまり、ありきたりで能面のような履歴書や職務経歴書では汲み取れない「どんな人なのか?」「信頼できそうか?」「どんな意識を持った人なのか?」と言う人物像を、ネットの情報から得ようとしています。
そういった情報がネット上に見られる応募者を他の応募者より優先するのは、考えて頂ければ分かると思います。
インターネットがここまで普及し、携帯電話やスマートフォンで誰でも検索できる今の時代に、昔ながらの履歴書・職務経歴書だけに依存する従来のやり方を踏襲しているのはナンセンスでしょう。
「ネット検索で見つからなければ、存在していないのと同じ」
良く聞く言葉ですね。今の時代、翻訳者も同じ事が言えるのかもしれません。仕事を得る上で、エージェントやソースクライアントとの接触が不可欠な翻訳者や通訳者にとって、ネット上で実名を使って活動する事のメリットは大きいと思います。
こんな実例があります。ある応募者は、自己アピールにご自身のブログのURLを書いておられました。勿論、アクセスして読ませて頂いたのですが、しっかりと実名でブログを書いておられました。ブログ記事から読み取れたのは、ある分野の知識にとても明る事。翻訳品質を確保するための仕掛けを色々と生み出し、実践されている事。勉強に余念が無いと言う事。そして、TRADOSに精通している事でした。
他の応募者は後回しにして、この方に即座に連絡をつけたのは想像できると思います。
逆にマイナス評価になる場合があるのでは??と心配になりますか?
そんな方には逆に質問したくなります。「マイナス評価になるような事をネット上でやっているのですか?」
少なくとも実名を使うとしたならば、自分にマイナスとなるような間違ったことはやらないでしょう?
プライバシーに関する情報を出す時には注意が必要になりますが、通訳者・翻訳者さんは実名でのネット利用が意外なところで有利に働くのだと言うことを知って欲しいと思います。
皆さんも、実名でブログを書きましょう。
投稿者: Terry Saito
以前、Twitter上で呼び掛けた「オンラインお茶会」、略して「オン茶会」。
そのオン茶会のグループをFacebookに作り、今月より少しづつですが、オン茶会を始めました。
この「オン茶会」は、Google Hangout を使って、オフ会をバーチャルにオンラインでやろう!と言うのがコンセプトです。
オフ会の良いところは、お互いの顔を見ながら、深い色々な話ができるところ。普段、オンラインでは聞けない、言えない話が話題に出る。例えばレートの話、ブラックなエージェント話、仕事のちょっと困った事の相談、そして恋バナ?(笑)
そんなコミュニケーションの場をGoogle Hangout のオンライン上に作るのが「オン茶会」です。
この「オン茶会」の良いところは、時間と距離を超越できるところ。先日のオン茶会では、関西地方、中国地方、そしてカナダ在住の方とお話をしました。
海外の方もそうですが、地方在住の方達とも手軽にあたかもお会いして話をしてるような深いコミュニケーションを取れるのは、とても素敵な事です。
なかなか都市部で行われるイベントには出掛けていけないとか、小さなお子さんを抱えていて出掛けられないと言った方達にも、インターネットとPC(スマホでもOK)があれば通訳者や翻訳者の仲間達と会って話ができる。
そんな場が作れればと思って立ち上げたのが「オン茶会」です。
会の目的から実名主義です。グループをFacebookに作ったのも、それが理由です。
貴方も参加しませんか?
Facebookからグループへの参加申請して下さいね。
〜〜〜〜〜〜〜
オン茶会でお話しさせて頂いた方達から、色々な刺激を頂いています。あまり考えた事もない考え方を教えて頂いたり、新しい世界を垣間見せて頂いたり、自分も頑張らねばと言う思いにさせて頂いたり。
人と接する事は自分にないものを知る良い機会になりますね。お話をさせて頂いている方々には、本当に感謝です。