【ワイルドカード】【英文】全角文字の混入チェック

英訳物に混入した全角文字がクレームに繋がることが良くあります。そこで、2バイト文字を検索して蛍光ペンを付けるワイルドカードの記述を以下に示します。

ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。

検索する文字列:

[!\!-~ ]

「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。

この記述は、半角英数字(記号を含む)以外を検索しています。ワード上で使用される記号やギリシア文字なども検索にヒットしますので注意してください。

チェックに使用する目的から考えると、疑わしいものをすべて検出して人間が是非を判断する方が良いため、こういうアプローチを取っています。

 

【ワイルドカード】【日本文】全角漢数字チェック

漢数字の取扱いには、いろいろとルールがあるようですので、ここでは、全角漢数字を検索して蛍光ペンをつける記述を紹介します。〇~九千九百九十九万九千九百九十九までヒットするはずです。

ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。

検索する文字列

[〇一二三四五六七八九十百千万]{1,}

「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。

【ワイルドカード】【日本文】全角算用数字チェック

スタイルガイドで全角算用数字を使用しないことになっている場合、以下の方法でチェックします。

ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。

検索する文字列:

[0-9]

「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。

なお、ワイルドカードのみを使って、全角算用数字を半角へ変換することができません。WildLightには「WLDIC_変換_全角数字を半角へ変換.txt」という辞書が準備されており、この辞書を適用することで変換することができます。

【ワイルドカード】【日本文】半角カタカナチェック

スタイルガイドで半角カタカナを使用しないことになっている場合、以下の方法でチェックします。

ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。

検索する文字列:

[ヲ-゚]

「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。

なお、ワイルドカードのみを使って、半角カタカナを全角へ変換することができません。WildLightには「WLDIC_変換_半角カタカナ全角変換.txt」という辞書が準備されており、この辞書を適用することで、半角カタカナを全角変換することができます。

【ワイルドカード】【英文】「i.e.」や「e.g.」の後の「,」カンマ忘れチェック

英訳品を見ていると、「i.e.」や「e.g.」の後のカンマ「,」を忘れているものをよく見掛けます。これを検出するためのワイルドカード表現を以下に示します。

ワードの検索機能で「ワイルドカードを使用する」をONにして、以下のように記述します。

検索する文字列:(i.e.の場合)

i.e.[!,]

検索する文字列:(e.g.の場合)

e.g.[!,]

「検索された項目の強調表示」を選択すると、カンマを忘れているところに蛍光ペンが付きます。

検出された箇所に強制的にカンマを入れたい場合は、置換機能でワイルドカードを使って、以下のように記述します。ここでは i.e. を例にします。

検索する文字列:

(i.e.)([!,])

置換後の文字列:

\1,\2

これで、カンマが挿入されます。

WildLightの辞書へ盛り込む場合は、以下のように記述します。(スペースはTABに置き換えてください)

(i.e.)([!,])     \1,\2
(e.g.)([!,])     \1,\2

 

TABコードの混入チェック

文書中に紛れ込んだTABを検索する方法です。

ワードの検索機能を使い、ワイルドカードを使わなくても、検索することができます。

検索する文字列:

^t

「検索された項目の強調表示」を選択すると該当箇所に蛍光ペンが付きます。

ワイルドカードを使って検索する場合は、「ワイルドカードを使用する」をオンにして、以下のように記述して検索します。

検索する文字列:

^9

 

【ワイルドカード】カタカナの長音にマイナス記号の誤使用チェック

クライアントから受領する日本語原稿にときどき見られるのですが、カタカナの長音にマイナス記号(-)を使っているものを見掛けます。これを検索して見つけてみましょう。

[ァ-ヾ]-

ワードの検索機能で、「ワイルドカードを使用する」をオンにして実行します。「検索された項目の強調表示」を選択すると該当箇所に蛍光ペンが付きます。

カタカナを表すワイルドカードが[ァ-ヾ]です。カタカナの後にマイナス記号がついているケースを検索する記述になっています。

では、今度は見つけたマイナス記号を、強制的に長音(ー)に置換してみます。ワードの置換機能を使い、以下のように記述します。

検索する文字列:

([ァ-ヾ])-

置換後の文字列

\1ー

これをWildLightの辞書へ記述する場合は、以下のようにします。(間のスペース部はTABです)

([ァ-ヾ])-     \1ー

ワイルドカードのセミナー(4/23日)

4月23日(日)に東京ほんま会主催によるワイルドカードのセミナーがあります。
題して「ワイルドなセイキの対決! ワイルドカードVS正規表現セミナー」です。
詳細は以下のリンクからご覧ください。

東京ほんま会ワイルドなセイキの対決! ワイルドカードVS正規表現セミナー

WildLightを高度に利用する上で欠かせないワイルドカードを学ぶ絶好のチャンスです。既に席がかなり埋まっているようですので、興味のある方はお急ぎください。

 

【ワイルドカード】段落番号後のスペース数チェック

【ワイルドカード】段落番号後のスペース数チェック

特許翻訳では段落番号後の扱いも、顧客によってスタイルがいろいろあるようですが、1つの例として、段落番号後に指定された数だけ半角スペースが入っているかをチェックするためのワイルドカードを記述してみます。

例)【指示内容】段落番号後に半角スペースを4つ入れる(英文)

この指示に合わないケースを検出するために、以下のようなワイルドカードを考えてみました。

\[[0-9]{4}\][ ]{1,3}[! ]

段落番号[nnnn]に該当する部分が¥[[0-9]{4}¥]です。その後に半角スペースが1〜3つあり([ ]{1,3})、その後に半角スペースでないもの([! ])があると、検索にヒットします。

つまり・・・
 [0123] The ... (スペース1こ)
 [0123]  The ... (スペース2こ)
 [0123]   The ... (スペース3こ)
 という組合せがヒットします。

じゃぁ、スペースが5つ以上あるものは?・・・という疑問が湧きますね。このワイルドカードではスペースが1つ〜3つまでのものしかヒットしません。5つ以上あるものをヒットさせるには、以下のような記述をします。

\[[0-9]{4}\][ ]{5,}[! ]

誰か1文で検索する方法をご存じないでしょうか? WildLightであれば、これらの2文を辞書ファイルへ記述しておけば一度に検出可能です。

なお、半角スペースの数がn個あることをチェックしたい場合は、nから1引いた数をm、nに1加えた数をpとして以下の記述にそれぞれ代入してください。

\[[0-9]{4}\][ ]{1,m}[! ]
\[[0-9]{4}\][ ]{p,}[! ]

強制的に置換してしまう場合

なお、2度も検索掛けるのは大変だから、スペースの数に関係なく一度の置換作業で一律に規定数のスペースを入れてしまえという荒っぽいやり方もできます。上記の例のように段落番号の後に半角スペースを4つ、強制的にいれてしまうワイルドカードは、以下のようになります。

検索する文字列

(\[[0-9]{4}\])[ ]@([! ])

置換後の文字列(¥1と¥2の間は半角スペース4つです)

\1 \2

日本語の場合

ちなみに日本語の場合は、以下のようになります。全角スペース4つを例として記述します。
スペースが4つ以外のものを検索するには:

【[0-9]{4}】[ ]{1,3}[! ]
【[0-9]{4}】[ ]{5,}[! ]

強制的に置換してしまうなら:

検索する文字列

(【[0-9]{4}】)[ ]@([! ])

置換後の文字列

\1    \2

 

【ワイルドカード】各文字種の検索方法 (基本)

ワイルドカードを使った検索を行う上で、いろいろな文字種に対応した記述方法を、決まり事として覚えておくと便利です。記述を単語登録して利用するのも1つの手です。

【全角文字】

[ぁ-ゞ] :ひらがな
[ァ-ヾ] :カタカナ
[a-zA-Z] :英文字
[0-9] :数字
[¥!-〜] :全角英数字(記号含む)
[一-鶴] :すべての漢字
[Α-Ωα-ω] :全角ギリシア文字
[、-鶴] :ひらがな/カタカナ/漢字/記号
[ -鶴] :ひらがな/カタカナ/漢字/記号/全角スペース

【半角文字】

[0-9] :数字
[a-zA-Z] :英文字
[ヲ-゚] :カタカナ
[! -~] :半角スペース、英数記号以外
[¥!-~] :半角英数字(記号含)

【その他の特殊文字】

^13 改行 (ハードリターン)
^12 改ページ
^11 ソフトリターン (または、^l:ハットエル)
^9 タブ記号 (または、^t)

ワイルドカードで使用する記号(!, -, (, ), [, ]等)を検索文字として使用したい場合は、その文字の前に ¥ を付与します(これをエスケープ文字と呼びます)。例えば、!を検索文字としたい場合は、 ¥! と記述します。

<b>記述例:</b>

例)全角半角関係なく、数字を検索したい場合

[0-90-9]

例)すべての英字(全角半角すべて)

[a-zA-Za-zA-Z]

例)すべてのカタカナ(全角半角すべて)

[ヲ-゚ァ-ヾ]

【半角文字の範囲指定の考え方】
%e5%8d%8a%e8%a7%92%e6%96%87%e5%ad%97%e3%83%af%e3%82%a4%e3%83%ab%e3%83%88%e3%82%99%e3%82%ab%e3%83%bc%e3%83%88%e3%82%99

半角文字の文字コードは上の図のようになっています。なぜ、数字を検索するワイルドカードが [0-9] なのかは、この文字コードを見ていただくと分かるとおり、数字は0から始まり9で終わるからです(青丸)

例えば、記号も含めてアルファベット文字全部を検索したい場合は、[¥!-~] と記述すれば良いことになります。(ピンク丸)