漢数字の取扱いには、いろいろとルールがあるようですので、ここでは、全角漢数字を検索して蛍光ペンをつける記述を紹介します。〇~九千九百九十九万九千九百九十九までヒットするはずです。
ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。
検索する文字列
[〇一二三四五六七八九十百千万]{1,}
「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。
漢数字の取扱いには、いろいろとルールがあるようですので、ここでは、全角漢数字を検索して蛍光ペンをつける記述を紹介します。〇~九千九百九十九万九千九百九十九までヒットするはずです。
ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。
検索する文字列
[〇一二三四五六七八九十百千万]{1,}
「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。
スタイルガイドで全角算用数字を使用しないことになっている場合、以下の方法でチェックします。
ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。
検索する文字列:
[0-9]
「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。
なお、ワイルドカードのみを使って、全角算用数字を半角へ変換することができません。WildLightには「WLDIC_変換_全角数字を半角へ変換.txt」という辞書が準備されており、この辞書を適用することで変換することができます。
スタイルガイドで半角カタカナを使用しないことになっている場合、以下の方法でチェックします。
ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。
検索する文字列:
[ヲ-゚]
「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。
なお、ワイルドカードのみを使って、半角カタカナを全角へ変換することができません。WildLightには「WLDIC_変換_半角カタカナ全角変換.txt」という辞書が準備されており、この辞書を適用することで、半角カタカナを全角変換することができます。
英訳品を見ていると、「i.e.」や「e.g.」の後のカンマ「,」を忘れているものをよく見掛けます。これを検出するためのワイルドカード表現を以下に示します。
ワードの検索機能で「ワイルドカードを使用する」をONにして、以下のように記述します。
検索する文字列:(i.e.の場合)
i.e.[!,]
検索する文字列:(e.g.の場合)
e.g.[!,]
「検索された項目の強調表示」を選択すると、カンマを忘れているところに蛍光ペンが付きます。
検出された箇所に強制的にカンマを入れたい場合は、置換機能でワイルドカードを使って、以下のように記述します。ここでは i.e. を例にします。
検索する文字列:
(i.e.)([!,])
置換後の文字列:
\1,\2
これで、カンマが挿入されます。
WildLightの辞書へ盛り込む場合は、以下のように記述します。(スペースはTABに置き換えてください)
(i.e.)([!,]) \1,\2 (e.g.)([!,]) \1,\2
文書中に紛れ込んだTABを検索する方法です。
ワードの検索機能を使い、ワイルドカードを使わなくても、検索することができます。
検索する文字列:
^t
「検索された項目の強調表示」を選択すると該当箇所に蛍光ペンが付きます。
ワイルドカードを使って検索する場合は、「ワイルドカードを使用する」をオンにして、以下のように記述して検索します。
検索する文字列:
^9
クライアントから受領する日本語原稿にときどき見られるのですが、カタカナの長音にマイナス記号(-)を使っているものを見掛けます。これを検索して見つけてみましょう。
[ァ-ヾ]-
ワードの検索機能で、「ワイルドカードを使用する」をオンにして実行します。「検索された項目の強調表示」を選択すると該当箇所に蛍光ペンが付きます。
カタカナを表すワイルドカードが[ァ-ヾ]です。カタカナの後にマイナス記号がついているケースを検索する記述になっています。
では、今度は見つけたマイナス記号を、強制的に長音(ー)に置換してみます。ワードの置換機能を使い、以下のように記述します。
検索する文字列:
([ァ-ヾ])-
置換後の文字列
\1ー
これをWildLightの辞書へ記述する場合は、以下のようにします。(間のスペース部はTABです)
([ァ-ヾ])- \1ー
【ワイルドカード】段落番号後のスペース数チェック
特許翻訳では段落番号後の扱いも、顧客によってスタイルがいろいろあるようですが、1つの例として、段落番号後に指定された数だけ半角スペースが入っているかをチェックするためのワイルドカードを記述してみます。
例)【指示内容】段落番号後に半角スペースを4つ入れる(英文)
この指示に合わないケースを検出するために、以下のようなワイルドカードを考えてみました。
\[[0-9]{4}\][ ]{1,3}[! ]
段落番号[nnnn]に該当する部分が¥[[0-9]{4}¥]です。その後に半角スペースが1〜3つあり([ ]{1,3})、その後に半角スペースでないもの([! ])があると、検索にヒットします。
つまり・・・ [0123] The ... (スペース1こ) [0123] The ... (スペース2こ) [0123] The ... (スペース3こ) という組合せがヒットします。
じゃぁ、スペースが5つ以上あるものは?・・・という疑問が湧きますね。このワイルドカードではスペースが1つ〜3つまでのものしかヒットしません。5つ以上あるものをヒットさせるには、以下のような記述をします。
\[[0-9]{4}\][ ]{5,}[! ]
誰か1文で検索する方法をご存じないでしょうか? WildLightであれば、これらの2文を辞書ファイルへ記述しておけば一度に検出可能です。
なお、半角スペースの数がn個あることをチェックしたい場合は、nから1引いた数をm、nに1加えた数をpとして以下の記述にそれぞれ代入してください。
\[[0-9]{4}\][ ]{1,m}[! ] \[[0-9]{4}\][ ]{p,}[! ]
強制的に置換してしまう場合
なお、2度も検索掛けるのは大変だから、スペースの数に関係なく一度の置換作業で一律に規定数のスペースを入れてしまえという荒っぽいやり方もできます。上記の例のように段落番号の後に半角スペースを4つ、強制的にいれてしまうワイルドカードは、以下のようになります。
検索する文字列
(\[[0-9]{4}\])[ ]@([! ])
置換後の文字列(¥1と¥2の間は半角スペース4つです)
\1 \2
日本語の場合
ちなみに日本語の場合は、以下のようになります。全角スペース4つを例として記述します。
スペースが4つ以外のものを検索するには:
【[0-9]{4}】[ ]{1,3}[! ] 【[0-9]{4}】[ ]{5,}[! ]
強制的に置換してしまうなら:
検索する文字列
(【[0-9]{4}】)[ ]@([! ])
置換後の文字列
\1 \2
小技の森ブログに「Office文書から個人情報を削除する」という記事がアップされました。
企業で仕事をされている方は、特に注意を払う必要がありますが、オフィス文書に記録されている個人情報が、意図せずそのまま外部へ流れてしまうことは、情報セキュリティ上、あまり好ましいものではありません。
私の場合、外部の翻訳者さんへ仕事を依頼する時や、お客様へ翻訳物を納品する前に、必ず、ワード文書から個人情報を削除してから送付しています。
そのために以下のような簡単なワードマクロを使っています。
Sub RemoveDocInfo() ActiveDocument.RemoveDocumentInformation (wdRDIDocumentProperties) ActiveDocument.RemoveDocumentInformation (wdRDIRemovePersonalInformation) End Sub
もちろん、先述のブログ記事に従って手作業で削除しても良いですが、業務効率や品質保証の観点で見た場合、細々した作業もマクロ化しておく方が何かと便利で、私は小さなマクロをたくさん作ってストックしてあります。
そのメリットを私は以下のように考えています。
「うっかり忘れた」を無くすために、納品前最終チェックで実行するマクロセットに、このマクロを盛り込んでおけば、確実かつ効率的に実施されて便利です。
ワイルドカードを使った検索を行う上で、いろいろな文字種に対応した記述方法を、決まり事として覚えておくと便利です。記述を単語登録して利用するのも1つの手です。
【全角文字】
[ぁ-ゞ] :ひらがな [ァ-ヾ] :カタカナ [a-zA-Z] :英文字 [0-9] :数字 [¥!-〜] :全角英数字(記号含む) [一-鶴] :すべての漢字 [Α-Ωα-ω] :全角ギリシア文字 [、-鶴] :ひらがな/カタカナ/漢字/記号 [ -鶴] :ひらがな/カタカナ/漢字/記号/全角スペース
【半角文字】
[0-9] :数字 [a-zA-Z] :英文字 [ヲ-゚] :カタカナ [! -~] :半角スペース、英数記号以外 [¥!-~] :半角英数字(記号含)
【その他の特殊文字】
^13 改行 (ハードリターン) ^12 改ページ ^11 ソフトリターン (または、^l:ハットエル) ^9 タブ記号 (または、^t)
ワイルドカードで使用する記号(!, -, (, ), [, ]等)を検索文字として使用したい場合は、その文字の前に ¥ を付与します(これをエスケープ文字と呼びます)。例えば、!を検索文字としたい場合は、 ¥! と記述します。
<b>記述例:</b>
例)全角半角関係なく、数字を検索したい場合
[0-90-9]
例)すべての英字(全角半角すべて)
[a-zA-Za-zA-Z]
例)すべてのカタカナ(全角半角すべて)
[ヲ-゚ァ-ヾ]
半角文字の文字コードは上の図のようになっています。なぜ、数字を検索するワイルドカードが [0-9] なのかは、この文字コードを見ていただくと分かるとおり、数字は0から始まり9で終わるからです(青丸)
例えば、記号も含めてアルファベット文字全部を検索したい場合は、[¥!-~] と記述すれば良いことになります。(ピンク丸)
PDFファイルや他ファイルからコピー&ペーストすると、時々、改行の前に余分なスペースが入り込むことがあります。そういったスペースを削除するには、以下のようなワイルドカードを使用します。
「検索する文字列」には以下の記述をします。
日本語でも英語でも対応できるように、全角スペース、半角スペースを対象として、同時にソフトリターンの前にある余計なスペースも除去するようにしています。
[ ]{1,}([^11^13])
最初の角括弧の中には半角スペース1つと全角スペース1つが入っています。つまり、半角/全角スペースが改行(^13)/ソフトリターン(^11)の前に1つ以上({1,})あると、検索にヒットします。(半角全角の混在でも対応できる)
「置換後の文字列」は以下の通り記述します。(\は半角の円記号です)
改行/ソフトリターンに変更を加えず、そのまま利用するために、このような方法にしています。
\1
もし、ソフトリターンを改行(ハードリターン)に変換しちゃって良いと言うことであれば、以下のような記述になります。
検索する文字列
[ ]{1,}[^11^13]
置換後の文字列
^p