複数定義ファイル(辞書)の一括処理 [wprjファイル]

複数の定義ファイル(辞書ファイル)を一括で適用する方法はないかという問合せをいただきました。

以下のページで紹介しているプロジェクトファイル(.wprj)を使うことで、実現できます。
https://wildlight.blog/2017/05/05/wildlight-ver-250/

WildLightセミナーでも説明したことがなく、当ブログでも上記ページしか説明がありませんので、認識している方が少ないかもしれません。

  1. まず、テキストファイルを作成してください。適当なファイル名をつけてください。
    例)日本語チェック.txt
  2. テキストファイルには、一度に実行したい定義ファイル(辞書ファイル)を実行したい順番に入力してください。以下の例のように記述します。

    例)
    WL_変換_カタカナ全角半角変換.txt
    WL_変換_英数全角半角変換.txt
    WL_JCHK_日本語校正.txt
  3. テキストファイルを保存し、拡張子を「.wprj」に変更します。
    例)日本語チェック.wprj
  4. WildLightにて「定義ファイルの実行」ボタンを押した際、作成したwprjファイルを指定すると、プロジェクトファイルに記述された定義ファイルを順に実行します。

WildLightプロジェクトファイルは、単なるテキストファイルです。拡張子は「wprj」です。
行の先頭が「’」で始まる行は無視されます。(WildLightの定義ファイルと同じ仕様)

ご存じのとおり、WildLightは翻訳チェックを目的とした文字列の色付けが行えますが、そういった用途以外に、翻訳コーディネータが多用する変換/置換作業などにも利用できるよう設計しています。

私の実使用例でいえば、イメージPDFからテキスト原稿の作成作業があります。
翻訳原稿がイメージPDFだった場合、PDFをOCRした後、さまざまなゴミ除去や修正処理を行って、翻訳に使用できるテキスト原稿に仕上げますが、それらの処理、例えば、「不要な改行修正」「誤読文字の修正」「行折れ修正」などを、それぞれ定義ファイルを作成して定義しています。実務では、これらの複数の修正作業を一括処理する必要がありますが、上記のようにプロジェクトファイルへ登録して、一括処理するといった使い方をしていました。

消えない半角スペース

久しぶりにWildLight用辞書ファイルへのワイルドカードの記述方法について問合せをいただきましたので、記事にしたいと思います。

問合せいただいたトラブルは、「改行前の半角スペースを検索し削除しても、消えないスペースがある」というものでした。

この原因は、消えなかったスペースが「改行をしないスペース」だったからです。ワードの「検索と置換」窓を開き、「特殊文字」ボタンを押してプルダウンメニューを表示すると、そこに「改行をしないスペース」があると思います。これが犯人です。

「改行をしないスペース」を選択すると「^s」が「検索する文字列」の欄に入力されるはずですが、この「^s」が検索するための文字列になります。

以下は、問合せいただいた「改行前の半角スペース(と、改行をしないスペース)を検索し、削除する」ためのWildLight用辞書ファイルの記述例です。

WILDCARD:ON
[ ^s]{1,}^13
DeleteH

この記述にある [ ^s] の角括弧の中は、半角スペースと ^s です。
「半角スペース」もしくは「改行をしないスペース」のいずれか、という意味になります。

1/23日WildLight初級オンラインセミナー開催

Twitterで先行して公開いたしましたが、WildLight初級セミナーをオンラインにて開催いたします。

コロナ影響もあり、集合セミナーを開催できずにおりましたが、今後はZoomを使ったオンラインセミナーに切換えて開催していきます。

日時:2021年1月23日(土) 13:00開始 (最長で2時間)
申込み方法: 次のURLにあるPassMarket から申し込んでください。

https://passmarket.yahoo.co.jp/event/show/detail/014ezc11fcm0t.html

参加費:無料。ただし、今回はWildLightの精神に則り、カンパ式セミナーとします。
セミナー後、セミナー内容が有益だった、価値があったと評価していただけるようでしたら、カンパをお願いいたします。(強要するものではございません)

【ご注意】

  • ZOOM接続URLなどは、参加登録された方へ別途ご案内いたします。
  • ZOOMへの接続について、主催者側は一切のサポートを行いません。参加される方は事前に接続方法を確認し、実績のある機器で接続するようにお願いいたします。
  • WildLightのインストール方法をセミナー内でご説明する予定ですが、インストールのサポートはセミナー内で行いませんので、御了承ください。

内容
予定している内容は、次のとおりです。

  1. WildLight開発の背景
  2. WildLightの基本機能
  3. 提供辞書の使い方 (WildLight-Dic-Library)
  4. 簡単な辞書ファイルの作成
  5. 翻訳への応用方法

段落下に訳文入力。原文を一括削除したい。

昨日のWildLight中級セミナーで、表題のような質問をいただきました。

原文の各段落の下に訳文を入力していくスタイルで翻訳をされていて、最後に原文を一気に消したいという要望です。

この解決策として提案したのは、翻訳を開始する前に、WildLightを使って以下の辞書を原稿に適用し、段落に区切りマーク(罫線のペア)を埋め込んでから、翻訳を行う方法です。

WLDIC_一発対訳_(1)原稿の文節末尾にマーカー追加.txt

この辞書を原稿に適用すると、以下のようになります。
そして罫線の間に訳文を入力していきます。

原文第1段落・・・・
└────
訳文を入れる
┌────
原文第2段落・・・・
└────
訳文を入れる
┌────

あとは、区切りマーク(罫線)を手掛かりに、原文を削除する辞書を作ればいいと説明しましたが、でも、そんなWildLight辞書を作るのはハードルが高過ぎますよね。

そこで早速作ってみました。以下のものがそうです。

WLDIC_一発対訳_(2)原文を削除する.txt

役立つようでしたら、ご利用ください。

 

 

億万単位を自動で英語置換

某所でWildLightセミナーを開催したのですが、こんな課題をいただきました。

  1. 〇〇〇億〇〇百万円 ⇒ 〇〇,〇〇〇 million yen
    ex. 158億32百万円 ⇒ 15,832 million yen
  2. 〇〇億〇〇百万円 ⇒ 〇,〇〇〇 million yen
    ex. 11億70百万円 ⇒ 1,170 million yen
  3. 〇億〇〇百万円 ⇒ 〇〇〇 million yen
    ex. 6億47百万円 ⇒ 647 million yen
  4. 〇〇百万 ⇒ 〇〇 million yen
    ex. 6百万円 ⇒ 6 million yen
  5. 〇〇〇億〇百万円 ⇒ 〇〇,〇0〇million yen
    ex. 530億2百万円 ⇒ 53,002 million yen
  6. 〇〇億〇百万円 ⇒ 〇,〇0〇 million yen
    ex. 10億9百万円 ⇒ 1,009 million yen
  7.  〇,〇〇〇,〇〇〇千円 ⇒ 〇,〇〇〇 million yen
    ex. 9,144,781 ⇒ 9,144 million yen (下3桁を削除)

これを実現するためのWildLight辞書を作ってみました。
DEMO_変換_和数字を英語へ.txt」として公開しておきました。

辞書の中身は、以下のような記述になっています。

WILDCARD:ON
Zen2Han,[0-9]
([0-9]{1,2})([0-9])億([0-9]{2})百万 \1,\2\3 million 
([0-9])([0-9])億([0-9]{2})百万 \1,\2\3 million 
([0-9])億([0-9]{2})百万 \1\2 million 
([0-9]{1,2})([0-9])億([0-9])百万 \1,\20\3 million 
([0-9])([0-9])億([0-9])百万 \1,\20\3 million 
([0-9])億([0-9])百万 \10\2 million 
([0-9])億 \100 million 
([0-9]{1,3},[0-9]{3}),[0-9]{3}千 \1 million 
([0-9]{1,3}),[0-9]{3}千 \1 million 
([0-9,]{1,11})百万 \1 million 
百万 million 
円 yen

1行目:ワイルドカードモードに切り替えます。
2行目:全角の数字を Zen2Han コマンドで半角に変換します。
3~5行目:「〇〇〇億〇〇百万」を置換します。
6~8行目:「〇〇〇億〇百万」を置換します。
9行目:「〇億」を置換します。
10行目:「〇〇〇,〇〇〇,〇〇〇千」を置換します。
11行目:「〇〇〇,〇〇〇千」を置換します。
12行目:「〇〇〇,〇〇〇,〇〇〇百万」を置換します。
13行目:「百万」を置換します。
14行目:「円」を置換します。

お役に立つようでしたら、お使いくださいませ。

全角スペースを半角に変換する

先日、某所でWildLight初級セミナーを行いました。そこで「全角スペースを半角へ変換する方法」の質問を受けましたので、WildLight辞書の記述方法を記しておきます。

' ワイルドカードモードにする
WILDCARD:ON
' 全角スペースに蛍光ペンを付ける(変換箇所が分かるように)
[ ]
Zen2Han,[ ]

辞書ファイル「WLDIC_変換_全角スペースを半角へ変換.txt」としてWildLight共有フォルダーに公開しておきましたので、ダウンロードしてご利用ください。

対訳表作成時間

WildLightを使って翻訳チェックする上で、欠かせないのが対訳表作成。

対訳表によるチェックは、問題検出効果が大きいという話を、いままであちこちの講演でしてきました。ところが、対訳表作成に時間が掛かることから、なかなか踏み込めない方が多いようです。

対訳表作成に、どれくらいの時間を見積もっておけばいいのでしょうか?

“対訳表作成時間”の続きを読む

WildLightの対訳表作成機能

WildLightの「対訳表作成機能」について、説明ビデオをYouTubeにアップロードしましたので、お役立てください。

今後、WildLightの機能紹介をYouTubeへ続々とアップロードしていく予定です。(場合によっては、オンラインセミナーの開催も考えています。)

WildLight関連の動画リスト

※アライメントをする前に「数チェック辞書」を適用しておくと、作業がやりやすいです。

WildLight Ver. 2.50 を公開

このゴールデンウィークを使い、以前から盛り込みたかった機能を追加しました。大きな変更点は以下のとおりです。

  1. 複数辞書を指定したプロジェクトを扱えるようにした。
  2. 対訳表作成でソースファイルにエクセルやパワーポイントのファイルを直接指定できるようにした(Fバージョンのみ)

“WildLight Ver. 2.50 を公開”の続きを読む