WildLight 2.04 へバージョンアップ

ひさしぶりのバージョンアップです。今回追加した機能は以下の2点です。

  1. ワードのテキストをエクセルに抜く (Full版のみ対応)
  2. 複数の対訳表をバッチ処理で作成

これらの機能は、どちらかというと翻訳会社向けの機能だと思います。(自分で使うためw)

ワードのテキストをエクセルに抜く

1の使途としては、例えば、納品仕様がエクセルへのベタ打ちとなっているが、翻訳者さんへは取り扱いやすいワード原稿で依頼したいような場合に使えます。翻訳者さんから納品されたワードの翻訳物を、エクセルに吐き出して納品物にする形になります。

この機能はメニューで「テキスト抽出」→「テキストをエクセルへ抽出」を選択すると実行されます。実行すると、テキストを抜くワードファイルを聞いてきますので、指定してください。ワードのテキストがエクセルへ抽出されます。

複数の対訳表をバッチ処理で作成

2の機能は、大量にある過去の翻訳物と原稿を対訳表にしておき、翻訳資産として活用するというような場合に役立ちます。もちろん、細かなアライメントが必要となりますが、取り敢えず、一気に対訳表にしてしまいたいという方にはお勧めです。(アライメントして保存しておけば、後からエクセルに起こし直したり、TMへ流し込んだりと再利用できます。)

バッチ処理を行うためには、対訳表にする2つのファイルを1セットにした情報を、対訳表作成リストファイルとして作成します。これは任意な名前を付けたテキストファイルで、Shift-JIS か Unicode を使用します。以下の例のように、対訳表にする2つのファイルをタブで挟んで、フルパスで記述します。

例)
C:¥Documents¥原稿.docx (tab) D:¥temp¥訳文.doc
C:¥original¥方針説明.docx (tab) F:¥Storage¥翻訳結果.docx

そうです。ファイルの形式としては、WildLight の辞書と同じで、TABをセパレータとして使います。

対訳表作成したいファイル群をすべて記述してください。WildLight は上から順番に対訳表を作成し、対訳表作成リストファイルが保存されているフォルダーに、対訳表を保存していきます。

存在しないファイルが指定された場合は、作業は行われずにスキップし、次のファイルセットの処理へ移ります。リスト内のすべてのファイルを処理したのち、新規文書を自動作成して、作業結果を出力します。処理されなかったファイル群や、作成された対訳表のファイル名を知る事ができます。(対訳表を保存したフォルダーをエクスプローラーで自動的に開くようになっています。)

起動方法は、メニューの「対訳表機能」→「対訳表作成をバッチ処理する」を選択します。ファイル選択画面になりますので、上で作成した対訳表作成リストファイルを指定します。すると、ファイルのリストに従って、対訳表が次々と作成されます。

ダウンロードは、当ブログの「ダウンロード/インストール」タブから行えます。

テキスト辞書はクラウドへ

WildLightやMildLiteといったツールを使う際、利用するテキスト辞書はすべてクラウドストレージに入れています。

理由は簡単ですね。自宅でも、外出先でも同じテキスト辞書環境で作業ができるからです。WildLightを使っていると、ちょこちょことテキスト辞書を修正したり、MildLiteで辞書登録するわけですが、そういった変更を他マシンへ反映する手間を考えることなく、作業を行えるメリットは大きいです。

また、MildLiteのようなユーティリティソフトもクラウドストレージに置いています。バージョンアップがあった場合、上書きするだけで使用するPC全部へ自動的に反映されるからです。

WildLight を紹介いただいてるブログ

今までグクることもしなかったのですが、思い立って WildLight をキーワードに検索してみると、知らないブログ記事も見つかって感動いたしました。拙作のワードアドインマクロ「WildLight 」を紹介いただいているブログをご紹介します。

最近はWildLight の開発も一段落し、アップデートをしていませんが、こういう記事を読むと、とても励みになります。

また、参加したセミナー、懇親会やオフ会で「WildLight を使ってますよ」と声を掛けていただいたり、ブログ経由でメッセージをいただくことも増え、そろそろ機能改善に動き出そうかと考えているところです。

少しでも皆さんの翻訳品質底上げにお役に立てたら…という想いで開発しています。何か要望やコメントがありましたら、お気軽にご連絡くださいね。

MildLite をリリース (用語置換ツール)

冗談で言っていた WildLight の姉妹ユーティリティツール「MildLite」をリリースする事にいたしました。

このツールは、AutoHotKey で作成されている常駐型ツールですので、使用するアプリケーションを限定しません。Microsoft Word, Excel, PowerPointや Trados といった Windows アプリケーション上であれば使用できる筈です。

以下の機能を持っています。

  1. 用語辞書による用語置換(置換辞書であれば、WildLightの辞書をそのまま使えます)
  2. 辞書登録
  3. テキストファイル検索(WildLight辞書の串刺し検索ができます)
  4. 情報のクリップ機能
  5. ウエブ辞書の検索

以下のURLからダウンロードできます。詳細は、同梱されている readme.txt をご覧ください。

MildLite

【例えばこんな使い方】

  • Trados の原文TUを範囲指定して、WIN + ALT + T を押すと、指定された用語集で置換が行われて表示されます。そのまま、訳文TU上で Ctrl + V する事で置換結果を貼り付けられます。
  • 適用する辞書はプルダウンメニューで変更が可能。複数の辞書を適用したい時は、まず1番目の辞書で置換。辞書を変更し、結果を範囲指定して置換実行。また、辞書を変更して、置換結果を範囲指定して置換実行・・・この繰り返しで、辞書を複数掛けることもできます。
  • Webベースの翻訳支援ツール上で、原文を範囲指定し WIN + ALT + T で用語置換。
  • 正規表現を使った辞書を作り、汎用性のある置換も行えます(WildLightのワイルドカード辞書と同様)。
  • 翻訳チェックをしている時に、辞書登録したい用語を範囲指定して WIN + ALT + J で辞書登録(検索語)。対訳語を範囲指定して WIN + CTRL + J で辞書登録(置換語)。仕事の流れの中で用語集の蓄積が容易になります。
  • 確認したい用語を範囲指定して、WIN + ALT + F で指定されたフォルダー内のテキストファイル全てを検索。ヒットしたものを一覧にして表示します。WildLight用辞書を持つフォルダーを検索するようにすれば、辞書の串刺し検索になります。
  • エージェントから提供されるエクセル用語集もテキストファイルにしてしまえば、この検索で引っ掛けられるようになります。
  • 正規表現を使ったテキストファイル検索がしたければ、何も範囲指定せずに WIN + ALT + F を押すと検索窓が現れ、正規表現を利用した検索が可能となります。
  • 翻訳中の原稿や資料で、残しておきたい情報があったら範囲指定して WIN + ALT + C で情報クリップ。後から閲覧/編集ができます。
  • クリップファイルを、テキストファイル検索対象のフォルダーに入れておけば、WIN + ALT + F の検索対象になって便利だったりします。
  • ウエブ上に点在する辞書で用語を検索したい!とか Google で表現のチェックをしたい!とか、そういう時は、対象の用語やフレーズを範囲指定して ALT + ファンクションキーを押すと、ウエブ検索してくれます。また、検索するサイトも自分でカスタマイズできるのが便利。
  • 一番良く使う Google 検索は、検索対象を範囲指定した後、Ctrl キーを押しながらマウスの右クリックをするとメニューに現れるので、それを選択。アプリケーションを選ばず Google 検索ができて作業効率がアップ。(WIN + G でも検索できます)
  • MildLite はWildLightと同様、Unicode に対応しているのでマルチ言語に対応。

Word の起動・終了が遅くなったら試してみること

Microsoft Word を使っているうち、立ち上げや終了に凄く時間が掛かるようになる場合があります。Google検索すると標準テンプレートである normal.dotm が肥大化することにより、起動・終了が遅くなるようで、「normal.dotm を削除せよ」という指示になっています。 (以下は Windows版 Microsoft Word のケースです)

Normal.dotm ってどこにあるの?

コマンドプロンプトを立ち上げ、以下の文字列を入力してください。

explorer %APPDATA%¥Microsoft¥templates

すると、エクスプローラーが立ち上りますが、そこに Normal.dotm がある筈です。(Windows 7, 8) ※WildLightシェアフォルダーにある OpenTemplatesFolder.EXE を使うと簡単に開けます。 Normal.dotm を削除すると、登録してあるショートカットキーなども消えてしまうことになります。そこで、私は以下のような運用をしています。

  1. まず、ワードを終了し、今ある Normal.dotm を削除します。
  2. 次にワードを立ち上げて、必要なショートカット等を登録し、終了します。
  3. 新しい Normal.dotm が作成されているので、それをバックアップとして別名で保存します。
  4. ワードの起動/終了が遅くなり始めたら、また normal.dotm を削除し、3で保存しておいたバックアップを normal.dotm へリネームします。

まず、必要なショートカット等の登録が全てされた保管すべき(容量が最小の) normal.dotm を準備(1,2)し、それを復元用のバックアップとして保存しておき(3)、起動・終了が遅くなったら normal.dotm へ書き戻して元のパフォーマンスに戻す(4)という運用です。 この作業を簡素化するために、以下のユーティリティソフトを作って利用していますので、よろしければご活用ください。 DeleteNormalDotm.exe BackupNormalDotm.exe RecoverNormalDotm.exe 

【使い方】(上記運用を例にします)

  1. まず、ワードを終了し、DeleteNormalDotm.exe を実行し Normal.dotm を削除します。
  2. 次にワードを立ち上げて、必要なショートカット等を登録し、終了します。
  3. BackupNormalDotm.exe を実行して、 Normal.dotm のバックアップを作成します。
  4. ワードの起動/終了が遅くなり始めたら、RecoverNormalDotm.exe を実行し、バックアップから normal.dotm を復元します。

何か新しいショートカットキー登録など、標準テンプレートへ手を加える必要が生じた場合は、RecoverNormalDotm.exe で Normal.dotm を復元した後に、それらの登録作業を行い、最後に BackupNormalDotm.exe でバックアップを取れば良いです。

[Version up] WildLightDictionary 0.05b

WildLightDictionary をバージョンアップしました。多分、これが最終形になると思います。

【今回の主な変更点】

  • 指定フォルダ内のテキストファイル検索を、検索窓から行えるようにしました。また、正規表現を使用できるようにしました。
  • テキストファイル検索のキーを Win + B から Win + F に変更しました。検索文字列を範囲指定してキーを押せば、その文字列が検索されます。範囲指定なしでキーを押した場合は、検索窓が現れます。
  • クリップを独立したファイルへ保存するようにしました。また、範囲指定せずに Win + C を押した場合、クリップを表示するようにしました。
  • 最新版 WildLight.dotm をデスクトップへダウンロードするメニューを追加しました。また、ワードのアドインファイルを登録する、スタートアップフォルダーを開くメニューを追加しました。

その他、詳細は同梱されいている readme.txt をご覧ください。

WildLightDictionary 0.05b

「FIGURE 1A」を「図 1A」に変換したい

今日、以下のような変換をしたいという問合せをもらいました。

英語から和訳を行う際、英語の「FIGURE 1A」とか「FIGURE 10B」を、それぞれ「図 1A」、「図 10B」に変換したいとの事でした。

これをWildLightで変換する場合、ワイルドカードと特殊コマンド Han2Zen を使えば変換できます。

WILDCARD:ON
FIGURE ([0-9A-Z]{1,})                 図 ¥1
Han2Zen,[0-9A-Z]

この3行を記述した辞書ファイルを準備すれば良いです。(2行目の検索語と置換語の間は TABです)

1行目の「WILDCARD:ON」でワイルドカードモードをONにします。

2行目は、検索語に「FIGURE ([0-9A-Z]{1,})」、置換語に「図 ¥1」を指定して置換します。「([0-9A-Z]{1,})」にヒットする図番号が、置換語の「¥1」に代入されて置換されます。

3行目の「Han2Zen,[0-9A-Z]」で半角数字と英大文字を全角文字へ変換します。

お試しください。

[Version up] WildLightDictionary 0.03b

WildLightDictionary をバージョンアップしました。

【主な変更点】

  • このバージョンから、WIN + F1~12 の組み合わせでウェブ検索を行えます(WebDicSearcher機能の取り込み)。
  • また、呼び出すサイトの設定は INI ファイルを編集する事でカスタマイズできるようにしました。
  • テキストファイル/辞書の検索結果の表示方法をテキストボックスに変更し、検索結果をコピペできるようにしました。
  • また、検索結果が多かった場合、画面をはみ出して表示されませんでしたが、テキストボックスをスクロールして閲覧できるように変更しました。
  • クリップモードで複数行をクリップした場合、検索時、各行が別々の情報として取り扱われていましたが、1つの情報の塊として検索され、結果出力されるように変更しました。

その他、詳細は同梱されている readme.txt をご覧ください。

WildLightDictionary 0.03b

簡単辞書作成 WildLightDictionary

翻訳している時やチェックしている時に、用語や対訳をWildLightの辞書へ簡単に登録できたら…と以前から考えていました。そこで、このようなユーティリティソフトを作ってみました。

WildLightDictionaryは、範囲指定した箇所をテキスト形式の辞書ファイルへ保存するユーティリティソフトです。先日公開した WildTextSearch の機能も持っています(したがって、WildTextSearchは今後バージョンアップしません)。

以下のURLよりダウンロードして、使用してください。

WildLightDictionary Ver. 0.02b

同梱されている readme.txt の一部を以下に転記しておきます。

 ◇ 概要 ◇
拙作ワードマクロ「WildLight」用の常駐型ユーティリティソフトです。

指定されたユーザー辞書に、Windowsの各種アプリケーション上で範囲指定した語句を登録します。検索語の登録と置換語の登録の両方が行えます。また、WildTextSearchの機能も入っており、指定したフォルダ内にあるテキストファイルを串刺検索できます。

◇ 機能 ◇
1)WildLight用辞書登録機能
2)フォルダ内テキストファイルの検索機能
3)クリップ機能

◇ 動作条件 ◇
Windows7でしか動作確認はしておりませんが、7以降で動くかも?

◇ ファイル構成 ◇
[WildLightDictionary.exe]  ユーティリティソフト本体
[readme.txt] このファイル

◇ インストール ◇
任意のフォルダへ保存してください。

◇ アンインストール ◇
展開してできたフォルダをまるごと削除すれば、アンインストール完了です。
レジストリは一切変更していません。

◇ 起動の仕方 ◇
WildLightDictionary.exe をダブルクリックして起動します。
初めて使用する時、「保存するユーザー辞書を選択してください」の画面が現れますので、用語登録したい辞書を選択してください。(新規に作成する時は、事前に空のテキストファイルを作成しておいてください)

次に「フォルダの参照」画面が現れますので、検索するテキストファイルが入ったフォルダーを指定して、[OK]を押してください。

次に、ヘルプメニューが現れ、簡単な操作方法が表示されます。
[OK]を押すとメモリーに常駐し、タスクバーに[W]のアイコンが現れます。

◇ 使い方 ◇
【検索語登録】
登録したい用語を範囲指定し、WIN + J を押してください。
(WINキーを押しながらマウス右クリックで「単語登録」→「検索語登録」でも同じことができます)

※範囲指定内の改行はタブに変換され、用語の先頭に改行を付与して保存されます。

【置換語登録】
登録したい用語を範囲指定し、WIN + ALT + J を押してください。(WINキーを押しながらマウス右クリックで「単語登録」→「置換語登録」でも同じことができます)

※範囲指定内の改行はタブに変換され、用語の先頭にタブを付与して保存されます。

WildLightの辞書形式で保存されます。

検索語 (TAB) 置換語

用語登録の流れは以下の通り

  1. 用語を抽出しようとしているアプリのウインドウを1度クリックしアクティブ状態にする。
  2. 検索語(原語)を範囲指定し、WIN + J を押す。
  3. 置換語(訳語)を範囲指定し、WIN + ALT + J を押す。

これにより、「検索語 (TAB) 置換語」の形で登録されます。
上記の2,3を繰り返す事で、対訳用語集が作成できます。

※Microsoft Office 製品は、複数個所の同時範囲指定が可能ですので検索語と置換語を同時に範囲指定して WIN + J を押せば、上記と同じスタイルで登録されます。
※検索語ばかりを登録しても問題ありません。

【テキストファイル検索】
検索したい文字列を範囲指定し、WIN + B を押してください。
指定したフォルダ内にあるテキストファイルからヒットした行がポップアップ画面に表示されます。マウスを動かすと、画面は消えます。

【クリップ機能】
クリップしたい箇所を範囲指定して WIN + C を押してください。
例えば、ウエブ検索をしていて、気になった情報があれば範囲指定し、WIN + C を押せば、辞書ファイルへクリップされます。

※範囲指定内の改行、タブは全て削除され、
「【Clip】(TAB) 範囲指定文字列」の形で保存されます。
前後に改行が付与されます。

 もし、改行などをそのままクリップしたい場合は、WIN + ALT + C を押してください。

◇ メニュー ◇
タスクバーのアイコンを右クリックすると以下のメニューが現れます。

プログラム名+バージョン情報:
WildLightのクラウドシェアライブラリーが表示されます

選択されている辞書ファイル名:
ノートパッドで辞書ファイルを開きます。

登録ユーザー辞書選択
用語登録するユーザー辞書を変更します。

ASCIIコード順
辞書内容を、検索語のASCIIコード順に並び替えます。
(重複データは削除されます)

検索語文字数順
辞書内容を、検索語の文字数が大きい順に並び替えます。
(重複データは削除されます)

※なお、上記2つの並び替えを実行した場合、拡張子 .bak で辞書のバックアップが作成されます。

(選択されているフォルダ名):
選択されたフォルダをエクスプローラで開きます。

フォルダ内のテキストファイルリスト
選択されたフォルダ内にあるテキストファイルリストを表示します。

検索フォルダの選択
テキストファイルを検索するフォルダを変更します。

常駐終了
プログラムを終了します。

ヘルプ
簡単なヘルプ画面を表示します。

◇ キー操作 ◇
WIN + J
範囲指定箇所を検索語として辞書ファイルへ保存

WIN + ALT + J
範囲指定箇所を置換語として辞書ファイルへ保存

WIN + C
範囲指定箇所をクリップして辞書ファイルへ保存。

WIN + ALT + C
範囲指定箇所を無加工でクリップして辞書ファイルへ保存。

WIN + マウス右クリック
サブメニューが表示され、上記4つの機能が選択できます。

◇ その他 ◇
・実行ファイルと同じフォルダーに WildLightDictionary.ini が作成されます。これは初期設定ファイルです。

◇ TIPS ◇
・他のマクロ・アプリ用の辞書作成ツールとして使用する。

用語 (TAB) 用語

このコンビネーションの用語集/辞書ファイルを利用するマクロやアプリケーションは多いようですので、それらの用語集作成に使用できると思います。

・閲覧している情報で保存しておきたいものは、範囲指定してクリップするという使い方に利用できます。(WIN + C)
・クリップしたファイルを検索対象とすれば、情報検索にも使用できます。

・ファイルリストを作りたい時、エクスプローラでファイルリストを表示しておき、CTRL + A にてファイル全てを選択後、WIN + ALT + C すれば、ファイルリストがクリップされます。

SFAオープンスクールの質問から

昨日、2月28日(土)はサン・フレアアカデミーのオープンスクールでした。

クラスの中でWildLightの使い方に関する質問がありました。これは他の皆さんも利用できる情報ですので、ここにシェアしておきます。

1. 蛍光ペンのついた文字列をワードやエクセルへ抜き出せるか?

WildLight特殊コマンドの「ExtractH2Word」もしくは「ExtractH2Excel」を使います。

例)
ExtractH2Excel

いずれかのコマンドを1行記述した辞書ファイルを準備し、蛍光ペンされたテキストを抜き出したいワード文書へ適用すれば、抜き出せます。

この例を記述した辞書を「WLDIC_抽出_蛍光ペン部をExcelへ抜く.txt」として作成しておきました。ライブラリーからダウンロードしてご利用下さい。

2. PDFファイルからワードにしたものを整形するには、どうしたらいいか?

 この質問については明確な回答ができませんでした。PDFからワードファイルを起こした場合、使用したアプリケーションや原稿PDFの中身によって、出る症状が違うからです。

  • 私の経験した症状として、以下のようなものがあります。
    1. 全角文字間に全半角スペースが紛れ込んでいる。
    2. 全半角数字の後ろに複数の半角スペースが入っている。
    3. 半角英数字間のスペースに全角スペースが入っている。
    4. 文頭に不要なスペースが入っている。

これらへの対処として、以下のような処理を行っています。

' 全角英文字カタカナ漢字の間に挟まった全半角スペースを除去する
 
 ([a-zA-Zァ-ヾ一-鶴ぁ-ゞ])[  ]{1,}([a-zA-Zァ-ヾ一-鶴ぁ-ゞ])     \1\2
' 全半角数字の後のスペースを半角スペース1つにする

 ([0-90-9])[  ]{2,}     \1
' 半角英数字間のスペースを半角スペース1つにする

 ([\!-~])[  ]{1,}([\!-~])     \1 \2
' 文頭の不要なスペースを削除する

 ^13[  ]{1,}     ^p

上記4例とも、[ ]の中は全角スペース1つと半角スペース1つが入っています。
また、セパレーターはTABです。
これらが記述された辞書は、「WLDIC_編集_日本語:PDF抽出文書の成形.txt」として提供しています。

3. エクセルやパワーポイントファイルからテキスト抽出するには、どうしたらいいか?

Microsoft Office Personal以外(Excel, PowerPointが入っているもの)をお使いの方は、WildLight Users Group でのみ配布されている Full バージョンを使えば、エクセルやパワーポイントからテキスト抽出する機能を利用できます。

4. 全角文字の間にまぎれた半角スペースを除去する方法は?

全角文字の間に半角スペースが入っているケースは、PDFファイルからワードへ変換した時に良く見かけるので、質問2への対処の1つとしても有効だと思います。

全角文字をワイルドカードで表現すると以下のようになります。

 、-鶴

そして、全角文字に挟まれる半角スペースを検出して削除するには、辞書に次のように記述します。

 ([、-鶴])[ ]([、-鶴])                  \1\2

[ ]の間には半角スペースを入れます。
([、-鶴]) ([、-鶴])と\1\2の間はセパレーターのTABです。

この辞書を「WLDIC_変換_全角文字間の半角スペースを除去.txt」として作成しておきました。ライブラリーからダウンロードしてご利用下さい。