漢数字の取扱いには、いろいろとルールがあるようですので、ここでは、全角漢数字を検索して蛍光ペンをつける記述を紹介します。〇~九千九百九十九万九千九百九十九までヒットするはずです。
ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。
検索する文字列
[〇一二三四五六七八九十百千万]{1,}
「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。
漢数字の取扱いには、いろいろとルールがあるようですので、ここでは、全角漢数字を検索して蛍光ペンをつける記述を紹介します。〇~九千九百九十九万九千九百九十九までヒットするはずです。
ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。
検索する文字列
[〇一二三四五六七八九十百千万]{1,}
「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。
スタイルガイドで全角算用数字を使用しないことになっている場合、以下の方法でチェックします。
ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。
検索する文字列:
[0-9]
「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。
なお、ワイルドカードのみを使って、全角算用数字を半角へ変換することができません。WildLightには「WLDIC_変換_全角数字を半角へ変換.txt」という辞書が準備されており、この辞書を適用することで変換することができます。
スタイルガイドで半角カタカナを使用しないことになっている場合、以下の方法でチェックします。
ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。
検索する文字列:
[ヲ-゚]
「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。
なお、ワイルドカードのみを使って、半角カタカナを全角へ変換することができません。WildLightには「WLDIC_変換_半角カタカナ全角変換.txt」という辞書が準備されており、この辞書を適用することで、半角カタカナを全角変換することができます。
英訳品を見ていると、「i.e.」や「e.g.」の後のカンマ「,」を忘れているものをよく見掛けます。これを検出するためのワイルドカード表現を以下に示します。
ワードの検索機能で「ワイルドカードを使用する」をONにして、以下のように記述します。
検索する文字列:(i.e.の場合)
i.e.[!,]
検索する文字列:(e.g.の場合)
e.g.[!,]
「検索された項目の強調表示」を選択すると、カンマを忘れているところに蛍光ペンが付きます。
検出された箇所に強制的にカンマを入れたい場合は、置換機能でワイルドカードを使って、以下のように記述します。ここでは i.e. を例にします。
検索する文字列:
(i.e.)([!,])
置換後の文字列:
\1,\2
これで、カンマが挿入されます。
WildLightの辞書へ盛り込む場合は、以下のように記述します。(スペースはTABに置き換えてください)
(i.e.)([!,]) \1,\2 (e.g.)([!,]) \1,\2
文書中に紛れ込んだTABを検索する方法です。
ワードの検索機能を使い、ワイルドカードを使わなくても、検索することができます。
検索する文字列:
^t
「検索された項目の強調表示」を選択すると該当箇所に蛍光ペンが付きます。
ワイルドカードを使って検索する場合は、「ワイルドカードを使用する」をオンにして、以下のように記述して検索します。
検索する文字列:
^9
クライアントから受領する日本語原稿にときどき見られるのですが、カタカナの長音にマイナス記号(-)を使っているものを見掛けます。これを検索して見つけてみましょう。
[ァ-ヾ]-
ワードの検索機能で、「ワイルドカードを使用する」をオンにして実行します。「検索された項目の強調表示」を選択すると該当箇所に蛍光ペンが付きます。
カタカナを表すワイルドカードが[ァ-ヾ]です。カタカナの後にマイナス記号がついているケースを検索する記述になっています。
では、今度は見つけたマイナス記号を、強制的に長音(ー)に置換してみます。ワードの置換機能を使い、以下のように記述します。
検索する文字列:
([ァ-ヾ])-
置換後の文字列
\1ー
これをWildLightの辞書へ記述する場合は、以下のようにします。(間のスペース部はTABです)
([ァ-ヾ])- \1ー
4月23日(日)に東京ほんま会主催によるワイルドカードのセミナーがあります。
題して「ワイルドなセイキの対決! ワイルドカードVS正規表現セミナー」です。
詳細は以下のリンクからご覧ください。
東京ほんま会:ワイルドなセイキの対決! ワイルドカードVS正規表現セミナー
WildLightを高度に利用する上で欠かせないワイルドカードを学ぶ絶好のチャンスです。既に席がかなり埋まっているようですので、興味のある方はお急ぎください。
【ワイルドカード】段落番号後のスペース数チェック
特許翻訳では段落番号後の扱いも、顧客によってスタイルがいろいろあるようですが、1つの例として、段落番号後に指定された数だけ半角スペースが入っているかをチェックするためのワイルドカードを記述してみます。
例)【指示内容】段落番号後に半角スペースを4つ入れる(英文)
この指示に合わないケースを検出するために、以下のようなワイルドカードを考えてみました。
\[[0-9]{4}\][ ]{1,3}[! ]
段落番号[nnnn]に該当する部分が¥[[0-9]{4}¥]です。その後に半角スペースが1〜3つあり([ ]{1,3})、その後に半角スペースでないもの([! ])があると、検索にヒットします。
つまり・・・ [0123] The ... (スペース1こ) [0123] The ... (スペース2こ) [0123] The ... (スペース3こ) という組合せがヒットします。
じゃぁ、スペースが5つ以上あるものは?・・・という疑問が湧きますね。このワイルドカードではスペースが1つ〜3つまでのものしかヒットしません。5つ以上あるものをヒットさせるには、以下のような記述をします。
\[[0-9]{4}\][ ]{5,}[! ]
誰か1文で検索する方法をご存じないでしょうか? WildLightであれば、これらの2文を辞書ファイルへ記述しておけば一度に検出可能です。
なお、半角スペースの数がn個あることをチェックしたい場合は、nから1引いた数をm、nに1加えた数をpとして以下の記述にそれぞれ代入してください。
\[[0-9]{4}\][ ]{1,m}[! ]
\[[0-9]{4}\][ ]{p,}[! ]
強制的に置換してしまう場合
なお、2度も検索掛けるのは大変だから、スペースの数に関係なく一度の置換作業で一律に規定数のスペースを入れてしまえという荒っぽいやり方もできます。上記の例のように段落番号の後に半角スペースを4つ、強制的にいれてしまうワイルドカードは、以下のようになります。
検索する文字列
(\[[0-9]{4}\])[ ]@([! ])
置換後の文字列(¥1と¥2の間は半角スペース4つです)
\1 \2
日本語の場合
ちなみに日本語の場合は、以下のようになります。全角スペース4つを例として記述します。
スペースが4つ以外のものを検索するには:
【[0-9]{4}】[ ]{1,3}[! ]
【[0-9]{4}】[ ]{5,}[! ]
強制的に置換してしまうなら:
検索する文字列
(【[0-9]{4}】)[ ]@([! ])
置換後の文字列
\1 \2
PDFファイルや他ファイルからコピー&ペーストすると、時々、改行の前に余分なスペースが入り込むことがあります。そういったスペースを削除するには、以下のようなワイルドカードを使用します。
「検索する文字列」には以下の記述をします。
日本語でも英語でも対応できるように、全角スペース、半角スペースを対象として、同時にソフトリターンの前にある余計なスペースも除去するようにしています。
[ ]{1,}([^11^13])
最初の角括弧の中には半角スペース1つと全角スペース1つが入っています。つまり、半角/全角スペースが改行(^13)/ソフトリターン(^11)の前に1つ以上({1,})あると、検索にヒットします。(半角全角の混在でも対応できる)
「置換後の文字列」は以下の通り記述します。(\は半角の円記号です)
改行/ソフトリターンに変更を加えず、そのまま利用するために、このような方法にしています。
\1
もし、ソフトリターンを改行(ハードリターン)に変換しちゃって良いと言うことであれば、以下のような記述になります。
検索する文字列
[ ]{1,}[^11^13]
置換後の文字列
^p
「【ワイルドカード】余分な改行を削除する」の応用編です。
節の間の改行数に関係なく、一律で1行間隔にします(空白行を1行入れる)。
「検索する文字列」は以下のように記述します。改行が1つ以上連続するものを固まりとして検索します。
^13{1,}
「置換後の文字列」には以下の記述をします。上記でヒットした改行の固まりを改行2つで置換します。
^p^p
これで、すべてが1行間隔に置き換わります。もし、2行間隔にしたい(空白行を2つ差し込む)時は、「置換後の文字列」を ^p^p^p と3つ並べれば良いことになります。