WildLightの対訳表作成機能

WildLightの「対訳表作成機能」について、説明ビデオをYouTubeにアップロードしましたので、お役立てください。

今後、WildLightの機能紹介をYouTubeへ続々とアップロードしていく予定です。(場合によっては、オンラインセミナーの開催も考えています。)

WildLight関連の動画リスト

※アライメントをする前に「数チェック辞書」を適用しておくと、作業がやりやすいです。

広告

WildLightで「翻訳したら勝手に対訳表」

本家「翻訳横丁の裏路地」に「翻訳したら勝手に対訳表」という記事をあげましたが、原稿を変換する作業をWildLightに自動で行わせるために辞書ファイルを作成しました。

辞書名の番号(1)(2)は適用する順番を示しています。具体的な手順は以下のようになります。

  1. 翻訳前の原稿に(1)のファイルを適用します。
  2. 変換された原稿の罫線の間に、パラグラフごとに訳文を入力していきます。
  3. 翻訳後の原稿に(2)の辞書を適用します。
  4. WildLightのメニューから「辞書管理」→「TAB区切りテキストを表にする」を選択して実行します。すると対訳表が出来上がります。
    なお、このステップ4は Ver. 2.54以降では必要ありません。ステップ3で自動的に対訳表が作成されます。(特殊コマンド「Tab2Table」が有効になるため)

どのように使うかは、以下のYouTube動画を参照してください。

各ファイルが何をやっているかは、辞書を読んで解析してください(笑)

大雑把な説明をすれば、(1)のファイルで余分な改行を削除して1パラグラフ1改行にし、各パラグラフの後ろに訳文を入力するためのマーカーとなる罫線セット(罫線上と罫線下)を追加しています。(2)のファイルは、原文パラグラフの後ろにある改行とマーカー(罫線上)をTABへ変換し、改行をすべて半角スペースに変換後、残ったマーカー(罫線下)を改行に変換して、TAB区切りテキストに変換しています。

これでお分かりいただけるとおり、訳文を入力する際に、視認性や読みやすさを確保するために訳文パラグラフの中で改行が行われても、対訳表に変換する前作業ですべて半角スペースに置換されますから、対訳表にするときに問題になりません。

この方法は、ワードで原文パラグラフの下に訳文を入力して翻訳するスタイルを多用される方には、便利かもしれません。

以前からWildLightセミナーや翻訳チェックのセミナーでお伝えしているとおり、翻訳チェックをする上で、対訳表作成で得られる効果は絶大です。翻訳チェックの精度が向上するのみならず、対訳表になったものをCSVファイルなどへ変換すれば、翻訳支援ツールの翻訳メモリーへ持ち込むことも容易となり、翻訳資産としての活用にも役立ちます。

非常に簡単な方法ですので、一度試してみることをお勧めいたします。

WildLight 2.04 へバージョンアップ

ひさしぶりのバージョンアップです。今回追加した機能は以下の2点です。

  1. ワードのテキストをエクセルに抜く (Full版のみ対応)
  2. 複数の対訳表をバッチ処理で作成

これらの機能は、どちらかというと翻訳会社向けの機能だと思います。(自分で使うためw)

ワードのテキストをエクセルに抜く

1の使途としては、例えば、納品仕様がエクセルへのベタ打ちとなっているが、翻訳者さんへは取り扱いやすいワード原稿で依頼したいような場合に使えます。翻訳者さんから納品されたワードの翻訳物を、エクセルに吐き出して納品物にする形になります。

この機能はメニューで「テキスト抽出」→「テキストをエクセルへ抽出」を選択すると実行されます。実行すると、テキストを抜くワードファイルを聞いてきますので、指定してください。ワードのテキストがエクセルへ抽出されます。

複数の対訳表をバッチ処理で作成

2の機能は、大量にある過去の翻訳物と原稿を対訳表にしておき、翻訳資産として活用するというような場合に役立ちます。もちろん、細かなアライメントが必要となりますが、取り敢えず、一気に対訳表にしてしまいたいという方にはお勧めです。(アライメントして保存しておけば、後からエクセルに起こし直したり、TMへ流し込んだりと再利用できます。)

バッチ処理を行うためには、対訳表にする2つのファイルを1セットにした情報を、対訳表作成リストファイルとして作成します。これは任意な名前を付けたテキストファイルで、Shift-JIS か Unicode を使用します。以下の例のように、対訳表にする2つのファイルをタブで挟んで、フルパスで記述します。

例)
C:¥Documents¥原稿.docx (tab) D:¥temp¥訳文.doc
C:¥original¥方針説明.docx (tab) F:¥Storage¥翻訳結果.docx

そうです。ファイルの形式としては、WildLight の辞書と同じで、TABをセパレータとして使います。

対訳表作成したいファイル群をすべて記述してください。WildLight は上から順番に対訳表を作成し、対訳表作成リストファイルが保存されているフォルダーに、対訳表を保存していきます。

存在しないファイルが指定された場合は、作業は行われずにスキップし、次のファイルセットの処理へ移ります。リスト内のすべてのファイルを処理したのち、新規文書を自動作成して、作業結果を出力します。処理されなかったファイル群や、作成された対訳表のファイル名を知る事ができます。(対訳表を保存したフォルダーをエクスプローラーで自動的に開くようになっています。)

起動方法は、メニューの「対訳表機能」→「対訳表作成をバッチ処理する」を選択します。ファイル選択画面になりますので、上で作成した対訳表作成リストファイルを指定します。すると、ファイルのリストに従って、対訳表が次々と作成されます。

ダウンロードは、当ブログの「ダウンロード/インストール」タブから行えます。

簡易対訳表を作ってみる

WL_HowToAlign

原稿と訳文を比較して、訳抜けを検出する事を目的に、簡易的に対訳表を作成するおまけ機能を WildLight に盛り込んであります。但し、他ソフトウェアのように完璧なものではありません。あくまでもチェックして問題を検出する事を目的としているので、この程度のレベルでも目的十分と考えています。

  1. プルダウンメニューの「機能」→「2文書を比較表にする(β)」を選択する
  2. ファイル選択ウインドウが出たら、原稿ファイルを選択する。
  3. ファイル選択ウインドウが出たら、訳文ファイルを選択する。
  4. 機能が実行され、対訳表が作成されれば終了です。
  5. 表操作を使い、原文と訳文をアライメントします。

表作成後のアライメント作業は、メニューの「表操作」にセルの削除・挿入・結合機能があり、それを使う方法がありますが、毎回メニュー選択するのは作業効率が良くありません。そこで、これらの機能をショートカットキーに登録して作業する事をお勧めします。

方法は、ショートカットキー登録の方法のマニュアルを作ってありますので参照して下さい。

翻訳文の数値チェックする

WildLight は、翻訳文チェックにおけるヒューマンエラーのチェックを支援するツールとして開発したという経緯があります。

そのヒューマンエラーの1つである「数値の転記ミス」を検出する手段として、辞書ライブラリーに以下の辞書ファイルが登録されています。

WLDIC_数チェックVer2(色付).txt

※この辞書の情報は別記事「数チェック辞書をアップデート」に書いています。

この辞書は、日本語、英語の両方に使用する事ができます。WildLightを実行し、上記辞書ファイルを読み込ませ、原稿文書、及び翻訳文書へ適用する事で数に色付けがされ、チェックし易くなります。

WL_HowToExecuteWildLight数の色付け辞書結果

上の写真は、原稿(日本語)と訳文(英語)を WildLight の「2文書を比較表にする」機能を使って表にしたもの(表にした後、手作業でアライメントする必要があります)に、上記辞書を適用したものです。

比較表にしなくても、ワードを2画面立ち上げて、それぞれに原文と訳文を表示しておき、上記辞書を適用すれば比較確認ができます。(私が比較表にしている意味は、訳抜けの有無を検出するのが目的です。→抜けがあれば空きセルができる)

この例では、表の2行目のセルで、原文は25、訳文は24となっており、色の違いから転記ミスの可能性を検出できます。「可能性」と書いた理由は、原文の間違いを修正した可能性もあるからです。大切なのは、違っているという事を検出する事、そしてその違いの原因が何かを判断する事です。こういう検出をする上で、WildLight + 数チェック辞書 は非常に役立ちます。

注意して欲しいのは、WildLightがミスを指摘する訳ではないという事です。違いを見易く、見つけ易くするしているだけで、あくまでも判断をするのは人間です。その点を勘違いしないで利用して下さい。(自動検出は、人心に依存心を抱かせ、結果、スルーするという他のヒューマンエラーを引き起こす可能性がありますので注意が必要です。)

WildLight の良いところは、検出したいものを辞書に追加登録する事で、どんどんと検出力を上げていけると言う事です。上記の辞書ファイルをベースに自分だけの辞書を作れば、さらに多くのミスを検出できるようになるでしょう。

私が行っている具体的な辞書の育て方は、以下のようなやり方です。

  • 辞書ファイル(テキストファイル)をノートパッドやエディタで開いたままにしておく。
  • WildLight を起動し、該当する辞書ファイルを適用する。
  • 訳文のチェック作業を行い、適用した辞書で検出されなかったミスを見つけたら、直ぐに辞書へ追記する。
  • この作業を繰り返し、チェック作業が終わったら、開いていた辞書を上書き保存して終了する。

このような流れで作業する事で、訳文チェックを行うたびに辞書ファイルが育っていきます。

訳文チェックに是非、お役立て下さい。