これから、何回かに分けて、WildLight の使用実例を紹介していこうと思います。
今日は、ツイッターで流した「用語抜き」
漢字とカタカナをエクセルへ抽出するには、以下のような記述を辞書に記します。
[ァ-ヾ一-鶴]
ExtractH2Excel
ワードへ抽出する場合は、以下のような記述を辞書に記します。
[ァ-ヾ一-鶴]
ExtractH2Word
1行目の「ァ-ヾ」がカタカナ、「一-鶴」が漢字を検索する検索文字列です。[ァ-ヾ一-鶴]で、カタカナと漢字を検索し、蛍光ペンを付けます。
2行目の「ExtractH2Excel」で、蛍光ペンが付いた文字列を抽出し、抽出した文字列からユニークな文字列だけをその登場頻度データと一緒にエクセルへ出力します。「ExtractH2Word」の場合は、同様に抽出処理を行った後、ユニークな文字列だけをワードの新規文書として出力します。
この方法を、用語集作成の下準備に使う事ができます。
【参考辞書ファイル】
上記の記述を入れた辞書ファイルを貼り付けておきますので、実験してみて下さい。