簡単辞書作成 WildLightDictionary

翻訳している時やチェックしている時に、用語や対訳をWildLightの辞書へ簡単に登録できたら…と以前から考えていました。そこで、このようなユーティリティソフトを作ってみました。

WildLightDictionaryは、範囲指定した箇所をテキスト形式の辞書ファイルへ保存するユーティリティソフトです。先日公開した WildTextSearch の機能も持っています(したがって、WildTextSearchは今後バージョンアップしません)。

以下のURLよりダウンロードして、使用してください。

WildLightDictionary Ver. 0.02b

同梱されている readme.txt の一部を以下に転記しておきます。

 ◇ 概要 ◇
拙作ワードマクロ「WildLight」用の常駐型ユーティリティソフトです。

指定されたユーザー辞書に、Windowsの各種アプリケーション上で範囲指定した語句を登録します。検索語の登録と置換語の登録の両方が行えます。また、WildTextSearchの機能も入っており、指定したフォルダ内にあるテキストファイルを串刺検索できます。

◇ 機能 ◇
1)WildLight用辞書登録機能
2)フォルダ内テキストファイルの検索機能
3)クリップ機能

◇ 動作条件 ◇
Windows7でしか動作確認はしておりませんが、7以降で動くかも?

◇ ファイル構成 ◇
[WildLightDictionary.exe]  ユーティリティソフト本体
[readme.txt] このファイル

◇ インストール ◇
任意のフォルダへ保存してください。

◇ アンインストール ◇
展開してできたフォルダをまるごと削除すれば、アンインストール完了です。
レジストリは一切変更していません。

◇ 起動の仕方 ◇
WildLightDictionary.exe をダブルクリックして起動します。
初めて使用する時、「保存するユーザー辞書を選択してください」の画面が現れますので、用語登録したい辞書を選択してください。(新規に作成する時は、事前に空のテキストファイルを作成しておいてください)

次に「フォルダの参照」画面が現れますので、検索するテキストファイルが入ったフォルダーを指定して、[OK]を押してください。

次に、ヘルプメニューが現れ、簡単な操作方法が表示されます。
[OK]を押すとメモリーに常駐し、タスクバーに[W]のアイコンが現れます。

◇ 使い方 ◇
【検索語登録】
登録したい用語を範囲指定し、WIN + J を押してください。
(WINキーを押しながらマウス右クリックで「単語登録」→「検索語登録」でも同じことができます)

※範囲指定内の改行はタブに変換され、用語の先頭に改行を付与して保存されます。

【置換語登録】
登録したい用語を範囲指定し、WIN + ALT + J を押してください。(WINキーを押しながらマウス右クリックで「単語登録」→「置換語登録」でも同じことができます)

※範囲指定内の改行はタブに変換され、用語の先頭にタブを付与して保存されます。

WildLightの辞書形式で保存されます。

検索語 (TAB) 置換語

用語登録の流れは以下の通り

  1. 用語を抽出しようとしているアプリのウインドウを1度クリックしアクティブ状態にする。
  2. 検索語(原語)を範囲指定し、WIN + J を押す。
  3. 置換語(訳語)を範囲指定し、WIN + ALT + J を押す。

これにより、「検索語 (TAB) 置換語」の形で登録されます。
上記の2,3を繰り返す事で、対訳用語集が作成できます。

※Microsoft Office 製品は、複数個所の同時範囲指定が可能ですので検索語と置換語を同時に範囲指定して WIN + J を押せば、上記と同じスタイルで登録されます。
※検索語ばかりを登録しても問題ありません。

【テキストファイル検索】
検索したい文字列を範囲指定し、WIN + B を押してください。
指定したフォルダ内にあるテキストファイルからヒットした行がポップアップ画面に表示されます。マウスを動かすと、画面は消えます。

【クリップ機能】
クリップしたい箇所を範囲指定して WIN + C を押してください。
例えば、ウエブ検索をしていて、気になった情報があれば範囲指定し、WIN + C を押せば、辞書ファイルへクリップされます。

※範囲指定内の改行、タブは全て削除され、
「【Clip】(TAB) 範囲指定文字列」の形で保存されます。
前後に改行が付与されます。

 もし、改行などをそのままクリップしたい場合は、WIN + ALT + C を押してください。

◇ メニュー ◇
タスクバーのアイコンを右クリックすると以下のメニューが現れます。

プログラム名+バージョン情報:
WildLightのクラウドシェアライブラリーが表示されます

選択されている辞書ファイル名:
ノートパッドで辞書ファイルを開きます。

登録ユーザー辞書選択
用語登録するユーザー辞書を変更します。

ASCIIコード順
辞書内容を、検索語のASCIIコード順に並び替えます。
(重複データは削除されます)

検索語文字数順
辞書内容を、検索語の文字数が大きい順に並び替えます。
(重複データは削除されます)

※なお、上記2つの並び替えを実行した場合、拡張子 .bak で辞書のバックアップが作成されます。

(選択されているフォルダ名):
選択されたフォルダをエクスプローラで開きます。

フォルダ内のテキストファイルリスト
選択されたフォルダ内にあるテキストファイルリストを表示します。

検索フォルダの選択
テキストファイルを検索するフォルダを変更します。

常駐終了
プログラムを終了します。

ヘルプ
簡単なヘルプ画面を表示します。

◇ キー操作 ◇
WIN + J
範囲指定箇所を検索語として辞書ファイルへ保存

WIN + ALT + J
範囲指定箇所を置換語として辞書ファイルへ保存

WIN + C
範囲指定箇所をクリップして辞書ファイルへ保存。

WIN + ALT + C
範囲指定箇所を無加工でクリップして辞書ファイルへ保存。

WIN + マウス右クリック
サブメニューが表示され、上記4つの機能が選択できます。

◇ その他 ◇
・実行ファイルと同じフォルダーに WildLightDictionary.ini が作成されます。これは初期設定ファイルです。

◇ TIPS ◇
・他のマクロ・アプリ用の辞書作成ツールとして使用する。

用語 (TAB) 用語

このコンビネーションの用語集/辞書ファイルを利用するマクロやアプリケーションは多いようですので、それらの用語集作成に使用できると思います。

・閲覧している情報で保存しておきたいものは、範囲指定してクリップするという使い方に利用できます。(WIN + C)
・クリップしたファイルを検索対象とすれば、情報検索にも使用できます。

・ファイルリストを作りたい時、エクスプローラでファイルリストを表示しておき、CTRL + A にてファイル全てを選択後、WIN + ALT + C すれば、ファイルリストがクリップされます。

SFAオープンスクールの質問から

昨日、2月28日(土)はサン・フレアアカデミーのオープンスクールでした。

クラスの中でWildLightの使い方に関する質問がありました。これは他の皆さんも利用できる情報ですので、ここにシェアしておきます。

1. 蛍光ペンのついた文字列をワードやエクセルへ抜き出せるか?

WildLight特殊コマンドの「ExtractH2Word」もしくは「ExtractH2Excel」を使います。

例)
ExtractH2Excel

いずれかのコマンドを1行記述した辞書ファイルを準備し、蛍光ペンされたテキストを抜き出したいワード文書へ適用すれば、抜き出せます。

この例を記述した辞書を「WLDIC_抽出_蛍光ペン部をExcelへ抜く.txt」として作成しておきました。ライブラリーからダウンロードしてご利用下さい。

2. PDFファイルからワードにしたものを整形するには、どうしたらいいか?

 この質問については明確な回答ができませんでした。PDFからワードファイルを起こした場合、使用したアプリケーションや原稿PDFの中身によって、出る症状が違うからです。

  • 私の経験した症状として、以下のようなものがあります。
    1. 全角文字間に全半角スペースが紛れ込んでいる。
    2. 全半角数字の後ろに複数の半角スペースが入っている。
    3. 半角英数字間のスペースに全角スペースが入っている。
    4. 文頭に不要なスペースが入っている。

これらへの対処として、以下のような処理を行っています。

' 全角英文字カタカナ漢字の間に挟まった全半角スペースを除去する
 
 ([a-zA-Zァ-ヾ一-鶴ぁ-ゞ])[  ]{1,}([a-zA-Zァ-ヾ一-鶴ぁ-ゞ])     \1\2
' 全半角数字の後のスペースを半角スペース1つにする

 ([0-90-9])[  ]{2,}     \1
' 半角英数字間のスペースを半角スペース1つにする

 ([\!-~])[  ]{1,}([\!-~])     \1 \2
' 文頭の不要なスペースを削除する

 ^13[  ]{1,}     ^p

上記4例とも、[ ]の中は全角スペース1つと半角スペース1つが入っています。
また、セパレーターはTABです。
これらが記述された辞書は、「WLDIC_編集_日本語:PDF抽出文書の成形.txt」として提供しています。

3. エクセルやパワーポイントファイルからテキスト抽出するには、どうしたらいいか?

Microsoft Office Personal以外(Excel, PowerPointが入っているもの)をお使いの方は、WildLight Users Group でのみ配布されている Full バージョンを使えば、エクセルやパワーポイントからテキスト抽出する機能を利用できます。

4. 全角文字の間にまぎれた半角スペースを除去する方法は?

全角文字の間に半角スペースが入っているケースは、PDFファイルからワードへ変換した時に良く見かけるので、質問2への対処の1つとしても有効だと思います。

全角文字をワイルドカードで表現すると以下のようになります。

 、-鶴

そして、全角文字に挟まれる半角スペースを検出して削除するには、辞書に次のように記述します。

 ([、-鶴])[ ]([、-鶴])                  \1\2

[ ]の間には半角スペースを入れます。
([、-鶴]) ([、-鶴])と\1\2の間はセパレーターのTABです。

この辞書を「WLDIC_変換_全角文字間の半角スペースを除去.txt」として作成しておきました。ライブラリーからダウンロードしてご利用下さい。