単純なチェック辞書の作り方

WildLight で用語や単語を蛍光ペン付けしたい…という単純な使い方をする場合、辞書ファイルはとても簡単に作成できます。

テキストファイルを新規作成し、蛍光ペン付けしたい文字列を入れていけばいいのです。

<

p style=”padding-left:30px;”>例)
見れ
食べれ

(ら抜き言葉に蛍光ペンを付ける)

この使い方が一番単純でありながら、用途が多いのではないかと思います。ワイルドカードって何?って方でも、この方法でチェックしたい単語や用語をそのまま登録してしまえばいいのです。

WildLight の辞書の作り方がよく分からないという方は、この方法からスタートしてみましょう。

※Windowsであれば「メモ帳」を使えば作成できます。

広告

英数字の全角・半角チェック

翻訳チェックの中で、スタイルガイドの指定に従って英数字の全角・半角チェックを行う事があります。また、翻訳文中で同じ文字種において全角と半角の不統一は好ましくありません。ここでは、英数字の半角・全角チェックをWildLightで行うための辞書の記述方法を説明します。

全角数字のチェック: [0-9]
全角英字のチェック: [a-zA-Z]
半角数字のチェック: [0-9]
半角英字のチェック: [a-zA-Z]

これらの文字列を、行いたいチェックに合わせて組合せ、WildLight用の辞書に記述すれば良いわけです。

例えば、半角英数字を検出して蛍光ペンをつける場合は、以下のように辞書に記述します。

[0-9]
[a-zA-Z]

これだけです。これだけを記述したテキストファイルを準備して WildLight に読み込ませると半角英数字に蛍光ペンが付きます。

ワイルドカードに詳しい方は、 [0-9a-zA-Z] と一文に書き直して頂いても構いません。

WildLightの良いところは、辞書に記述されたワイルドカードを順次に処理してくれるところです。ワードの検索や置換機能を使って一発で処理しようと、ワイルドカードの記述に頭を悩ますくらいなら、やりたい事を分割してワイルドカードで表現し、WildLightの辞書にして実行すれば、簡単に処理ができます。

翻訳文の数値チェックする

WildLight は、翻訳文チェックにおけるヒューマンエラーのチェックを支援するツールとして開発したという経緯があります。

そのヒューマンエラーの1つである「数値の転記ミス」を検出する手段として、辞書ライブラリーに以下の辞書ファイルが登録されています。

WLDIC_数チェックVer2(色付).txt

※この辞書の情報は別記事「数チェック辞書をアップデート」に書いています。

この辞書は、日本語、英語の両方に使用する事ができます。WildLightを実行し、上記辞書ファイルを読み込ませ、原稿文書、及び翻訳文書へ適用する事で数に色付けがされ、チェックし易くなります。

WL_HowToExecuteWildLight数の色付け辞書結果

上の写真は、原稿(日本語)と訳文(英語)を WildLight の「2文書を比較表にする」機能を使って表にしたもの(表にした後、手作業でアライメントする必要があります)に、上記辞書を適用したものです。

比較表にしなくても、ワードを2画面立ち上げて、それぞれに原文と訳文を表示しておき、上記辞書を適用すれば比較確認ができます。(私が比較表にしている意味は、訳抜けの有無を検出するのが目的です。→抜けがあれば空きセルができる)

この例では、表の2行目のセルで、原文は25、訳文は24となっており、色の違いから転記ミスの可能性を検出できます。「可能性」と書いた理由は、原文の間違いを修正した可能性もあるからです。大切なのは、違っているという事を検出する事、そしてその違いの原因が何かを判断する事です。こういう検出をする上で、WildLight + 数チェック辞書 は非常に役立ちます。

注意して欲しいのは、WildLightがミスを指摘する訳ではないという事です。違いを見易く、見つけ易くするしているだけで、あくまでも判断をするのは人間です。その点を勘違いしないで利用して下さい。(自動検出は、人心に依存心を抱かせ、結果、スルーするという他のヒューマンエラーを引き起こす可能性がありますので注意が必要です。)

WildLight の良いところは、検出したいものを辞書に追加登録する事で、どんどんと検出力を上げていけると言う事です。上記の辞書ファイルをベースに自分だけの辞書を作れば、さらに多くのミスを検出できるようになるでしょう。

私が行っている具体的な辞書の育て方は、以下のようなやり方です。

  • 辞書ファイル(テキストファイル)をノートパッドやエディタで開いたままにしておく。
  • WildLight を起動し、該当する辞書ファイルを適用する。
  • 訳文のチェック作業を行い、適用した辞書で検出されなかったミスを見つけたら、直ぐに辞書へ追記する。
  • この作業を繰り返し、チェック作業が終わったら、開いていた辞書を上書き保存して終了する。

このような流れで作業する事で、訳文チェックを行うたびに辞書ファイルが育っていきます。

訳文チェックに是非、お役立て下さい。

ワードアドイン汎用インストーラー

ワードのアドインファイルを、ワードのスタートアップフォルダーへ上書きコピーする汎用ユーティリティを作成したので公開します。

WordAddinInstaller.EXE

このインストーラーと、インストールしたいアドインファイルを同じフォルダーに入れ、コマンドプロンプト上で以下のように入力して実行して下さい。

WordAddinInstaller  アドインファイル

例) WildLight.dotm がインストールしたいアドインファイルの場合:

WordAddinInstaller WildLight.dotm

自動的にワードのスタートアップフォルダーへアドインファイルを上書きコピーします。
アップデーターとしても利用できます。

動作しない環境があるかもしれません。

ワードのスタートアップフォルダを開くユーティリティ

WildLightをインストールする上で、ワードのスタートアップフォルダを探すという事が障壁となっていました。

やっと、自前のユーティリティを作成しましたので公開します。以下の OpenWordStartUp.EXE をクリックして、ダウンロードして利用して下さい。

OpenWordStartUp.EXE

実行すると、ワードのスタートアップフォルダーが開きます。開いたフォルダへ WildLight.dotm をコピーすればインストール完了です。

動かない環境もあるかもしれませんが、その場合は従来通り、自力でワードのスタートアップフォルダーを探して下さい。

マクロは忘れて下さい

一昨日のサンフレアアカデミーのオープンスクールで、遠田先生がWildLightをご紹介下さった事は別ブログで報告しましたが、その後に何人かと話をさせて頂いて分かった事があります。

それは、以下のような事です。
1)WildLightはマクロを知らないと使えないと思っていた。
2)ブログの印象から有料マクロだと思っていた。

このあたりを含め、もっと説明をしていかないといけないなと思いました。

まず、必要となるマクロに類する知識は、WildLightのイントール方法だけです。あとはメニューからWildLightを選択して、自分の目的の辞書ファイルを読み込ませるだけで利用できます。セミナーや説明の中で「インストールしたらマクロは忘れて下さい」とお話ししているのは、そう言う理由です。

それに、もし辞書を自作される方で、WildLightの特殊コマンドを使用されない場合は、現バージョンさえインストールできてしまえばアップデートも必要ありません。(基本機能で不具合修正が発生しない限り)

WildLightの基本的使用法は「ファミコン」を目指しています。つまり、本体(WildLight)へカートリッジ(辞書ファイル)をポン!と入れさえすれば使える環境です。(カートリッジを作ってくれる人が増えると嬉しい)

また、WildLightはフリーウェアです。翻訳品の凡ミス撲滅を祈って、未来永劫有料にするつもりはありません。

赤文字のみ文字カウントする

クライアントからの翻訳指示で、部分翻訳の場合、様々な方法で翻訳対象を指示してきます。フォント色を変える事もその手段のひとつで、「赤字だけを翻訳して下さい」といった指示がされます。

そんな時、見積もりを出すための文字カウントが必要になりますが、普通なら、対象外箇所を削除してカウントするなどの手間を掛けざるを得ません。

WildLightの場合、「CountFontColor」コマンドを使えば、特定色の文字だけの文字カウントができます。赤字だけをカウントする場合、以下の1文を記述した辞書を準備することで、赤字部の文字カウントが行えます。

CountFontColor:Red

この辞書を実行すると、赤文字部の文字カウント情報を出力した新規文書が作成されます。

出力例

【Red色文字のカウント】
単語数:37
文字数(スペースを含めない):82
文字数(スペースを含める):92
全角文字+半角カタカナの数:24

[注]図形やテキストボックス内はカウントされません。

青文字をカウントしたければ、「Blue」を指定すればいい事になります。

蛍光ペン部の文字カウントをする

クライアントからの翻訳指示で、部分翻訳の場合、様々な方法で翻訳対象を指示してきます。蛍光ペンもその手段のひとつで、「蛍光ペンの付いているところだけを翻訳して下さい」といった指示がされます。

そんな時、見積もりを出すための文字カウントが必要になりますが、普通なら、対象外箇所を削除してカウントするなどの手間を掛けざるを得ません。

WildLightの場合、以下の1文を記述した辞書を準備することで、蛍光部の文字カウントが行えます。

CountH

この辞書を実行すると、蛍光ペン部の文字カウント情報を出力した新規文書が作成されます。

出力例

【蛍光ペン部のカウント】
単語数:36
文字数(スペースを含めない):75
文字数(スペースを含める):85
全角文字+半角カタカナの数:24

[注]図形やテキストボックス内はカウントされません。

数チェック辞書をアップデート

数チェック用の辞書ファイルをアップデートしました。

ファイル名は以下の通りです。(以前の辞書ファイルは削除せず、そのまま残してあります。)

WLDIC_数チェックVer2(色付).txt

この辞書ファイルを適用すると、以下の画像のようになります。

WildLight数の色付け辞書結果

この辞書では、数値への色付け以外にアルファベット大文字が連続した文字列(短縮用語)へも色付けを行います。

日本語原稿から簡易的に用語を抜く

昨年11月12日に行った翻訳勉強会「十人十色」のワイルドカードセミナーでちょっとお見せした「用語抜き」ですが、1月11日のWildLightセミナーで紹介したら、同様に関心を示して頂けましたので、その考え方をブログ記事にしておきます。

用語集は、顧客が使用する単語を正しく訳文へ適用し、文書内での揺れを無くす上で不可欠な物です。しかし、用語集を作成し管理している顧客や、それを提供してくれる顧客は非常に限られているのが現状です。

ここで説明する方法は、完璧ではないにしろ、翻訳品質管理上、用語集にして翻訳者へ事前提供した方が良い「用語の候補」を、日本語原稿から自動で抜き出す事を目的としています。

では、どうやって用語と思われるものを判断させるか?

実際に日本語原稿を眺め、用語として抜き出した方がいいものを探してみて欲しいのですが、そこから何と無く見えてくるものがあります。

それは…
用語となるものの多くは「漢字とカタカナの塊」であると言う事です。

つまり、漢字とカタカナの塊を抜き出してやると、用語集に必要な用語と思わしきものが抜き出せる事になります。

まず、「漢字とカタカナの塊」を検索して蛍光ペン付けする方法を考えてみましょう。それぞれを検索するワイルドカード文字列は以下の通りです。

漢字は、[一-鶴]
全角カタカナは、[ァ-ヾ]

これを1行で表すと、[ァ-ヾ一-鶴]となります。これをWildLight用辞書に記述する事で、漢字とカタカナの塊に蛍光ペンが付くことになります。あとは、蛍光ペンが付いたところをワードやエクセルへ抜き出してやれば良いわけですが、そのための特殊コマンドが以下のものです。

ExtractH2Word : 蛍光ペン部をワードへ抜く
ExtractH2Excel : 蛍光ペン部をエクセルへ抜く

エクセルへ抜く場合の記述例)

[ァ-ヾ一-鶴]
ExtractH2Excel

ExtractH2WordとExtractH2Excelでは、ユニークな文字列(用語と思わしきもの)だけが抽出され、文字数の大きい順に出力されます。(重複したものは削除される)
また、エクセルへの出力の場合、文書内での登場頻度の情報も付加して出力されます。

抜き出された用語らしきものは、当然、ひとつづつ精査して、本当に必要なものだけを用語として残す作業が必要です。

そもそも、この作業は完璧を全く求めていません。30%の完成度でも無いよりマシである…というところが発想の原点になっています。この考え方はツールを使う上でとても大切だと私は考えています。

TIPS:他の方法
例えば、文書名や文献、規程、規約、法律などの固有名詞は、良く括弧付きで記載されている場合が多いです。つまり、「」『』で括られた文字列は、用語集に必要な用語である場合が多いです。

同様にワイルドカードで記述して蛍光ペン付けを行えば、用語として抜く事ができます。
ちょっと雑ですが、

[『]{1}(*)[』]{1}(tab)¥1
[「]{1}(*)[」]{1}(tab)¥1
ExtractH2Excel

こんな感じになるでしょうか?

これらの処理を行う辞書は、WildLight Library に登録されていますので、ご活用下さい。

WLDIC_抽出和文から用語集候補をWordへ抜く.txt
WLDIC
抽出_和文から用語集候補をExcelへ抜く.txt

抜き出す対象を色々変えて、自分の意図に合う辞書に作り変えてみて下さい。