【ワイルドカード】【日本文】半角カタカナチェック

スタイルガイドで半角カタカナを使用しないことになっている場合、以下の方法でチェックします。

ワードの検索機能を使い、「ワイルドカードを使用する」をONにして、以下の記述を行います。

検索する文字列:

[ヲ-゚]

「検索された項目の強調表示」を選択すると、該当箇所に蛍光ペンが付きます。

なお、ワイルドカードのみを使って、半角カタカナを全角へ変換することができません。WildLightには「WLDIC_変換_半角カタカナ全角変換.txt」という辞書が準備されており、この辞書を適用することで、半角カタカナを全角変換することができます。

広告

【ワイルドカード】【英文】「i.e.」や「e.g.」の後の「,」カンマ忘れチェック

英訳品を見ていると、「i.e.」や「e.g.」の後のカンマ「,」を忘れているものをよく見掛けます。これを検出するためのワイルドカード表現を以下に示します。

ワードの検索機能で「ワイルドカードを使用する」をONにして、以下のように記述します。

検索する文字列:(i.e.の場合)

i.e.[!,]

検索する文字列:(e.g.の場合)

e.g.[!,]

「検索された項目の強調表示」を選択すると、カンマを忘れているところに蛍光ペンが付きます。

検出された箇所に強制的にカンマを入れたい場合は、置換機能でワイルドカードを使って、以下のように記述します。ここでは i.e. を例にします。

検索する文字列:

(i.e.)([!,])

置換後の文字列:

\1,\2

これで、カンマが挿入されます。

WildLightの辞書へ盛り込む場合は、以下のように記述します。(スペースはTABに置き換えてください)

(i.e.)([!,])     \1,\2
(e.g.)([!,])     \1,\2

 

TABコードの混入チェック

文書中に紛れ込んだTABを検索する方法です。

ワードの検索機能を使い、ワイルドカードを使わなくても、検索することができます。

検索する文字列:

^t

「検索された項目の強調表示」を選択すると該当箇所に蛍光ペンが付きます。

ワイルドカードを使って検索する場合は、「ワイルドカードを使用する」をオンにして、以下のように記述して検索します。

検索する文字列:

^9

 

【ワイルドカード】カタカナの長音にマイナス記号の誤使用チェック

クライアントから受領する日本語原稿にときどき見られるのですが、カタカナの長音にマイナス記号(-)を使っているものを見掛けます。これを検索して見つけてみましょう。

[ァ-ヾ]-

ワードの検索機能で、「ワイルドカードを使用する」をオンにして実行します。「検索された項目の強調表示」を選択すると該当箇所に蛍光ペンが付きます。

カタカナを表すワイルドカードが[ァ-ヾ]です。カタカナの後にマイナス記号がついているケースを検索する記述になっています。

では、今度は見つけたマイナス記号を、強制的に長音(ー)に置換してみます。ワードの置換機能を使い、以下のように記述します。

検索する文字列:

([ァ-ヾ])-

置換後の文字列

\1ー

これをWildLightの辞書へ記述する場合は、以下のようにします。(間のスペース部はTABです)

([ァ-ヾ])-     \1ー

ワイルドカードのセミナー(4/23日)

4月23日(日)に東京ほんま会主催によるワイルドカードのセミナーがあります。
題して「ワイルドなセイキの対決! ワイルドカードVS正規表現セミナー」です。
詳細は以下のリンクからご覧ください。

東京ほんま会ワイルドなセイキの対決! ワイルドカードVS正規表現セミナー

WildLightを高度に利用する上で欠かせないワイルドカードを学ぶ絶好のチャンスです。既に席がかなり埋まっているようですので、興味のある方はお急ぎください。

 

【ワイルドカード】段落番号後のスペース数チェック

【ワイルドカード】段落番号後のスペース数チェック

特許翻訳では段落番号後の扱いも、顧客によってスタイルがいろいろあるようですが、1つの例として、段落番号後に指定された数だけ半角スペースが入っているかをチェックするためのワイルドカードを記述してみます。

例)【指示内容】段落番号後に半角スペースを4つ入れる(英文)

この指示に合わないケースを検出するために、以下のようなワイルドカードを考えてみました。

\[[0-9]{4}\][ ]{1,3}[! ]

段落番号[nnnn]に該当する部分が¥[[0-9]{4}¥]です。その後に半角スペースが1〜3つあり([ ]{1,3})、その後に半角スペースでないもの([! ])があると、検索にヒットします。

つまり・・・
 [0123] The ... (スペース1こ)
 [0123]  The ... (スペース2こ)
 [0123]   The ... (スペース3こ)
 という組合せがヒットします。

じゃぁ、スペースが5つ以上あるものは?・・・という疑問が湧きますね。このワイルドカードではスペースが1つ〜3つまでのものしかヒットしません。5つ以上あるものをヒットさせるには、以下のような記述をします。

\[[0-9]{4}\][ ]{5,}[! ]

誰か1文で検索する方法をご存じないでしょうか? WildLightであれば、これらの2文を辞書ファイルへ記述しておけば一度に検出可能です。

なお、半角スペースの数がn個あることをチェックしたい場合は、nから1引いた数をm、nに1加えた数をpとして以下の記述にそれぞれ代入してください。

\[[0-9]{4}\][ ]{1,m}[! ]
\[[0-9]{4}\][ ]{p,}[! ]

強制的に置換してしまう場合

なお、2度も検索掛けるのは大変だから、スペースの数に関係なく一度の置換作業で一律に規定数のスペースを入れてしまえという荒っぽいやり方もできます。上記の例のように段落番号の後に半角スペースを4つ、強制的にいれてしまうワイルドカードは、以下のようになります。

検索する文字列

(\[[0-9]{4}\])[ ]@([! ])

置換後の文字列(¥1と¥2の間は半角スペース4つです)

\1 \2

日本語の場合

ちなみに日本語の場合は、以下のようになります。全角スペース4つを例として記述します。
スペースが4つ以外のものを検索するには:

【[0-9]{4}】[ ]{1,3}[! ]
【[0-9]{4}】[ ]{5,}[! ]

強制的に置換してしまうなら:

検索する文字列

(【[0-9]{4}】)[ ]@([! ])

置換後の文字列

\1    \2

 

【ワイルドカード】改行前の余分なスペースを除去する

PDFファイルや他ファイルからコピー&ペーストすると、時々、改行の前に余分なスペースが入り込むことがあります。そういったスペースを削除するには、以下のようなワイルドカードを使用します。

「検索する文字列」には以下の記述をします。
日本語でも英語でも対応できるように、全角スペース、半角スペースを対象として、同時にソフトリターンの前にある余計なスペースも除去するようにしています。

[  ]{1,}([^11^13])

最初の角括弧の中には半角スペース1つと全角スペース1つが入っています。つまり、半角/全角スペースが改行(^13)/ソフトリターン(^11)の前に1つ以上({1,})あると、検索にヒットします。(半角全角の混在でも対応できる)

「置換後の文字列」は以下の通り記述します。(\は半角の円記号です)
改行/ソフトリターンに変更を加えず、そのまま利用するために、このような方法にしています。

\1

もし、ソフトリターンを改行(ハードリターン)に変換しちゃって良いと言うことであれば、以下のような記述になります。

検索する文字列

[  ]{1,}[^11^13]

置換後の文字列

^p

 

【ワイルドカード】強制的に1行間隔にする

【ワイルドカード】余分な改行を削除する」の応用編です。

節の間の改行数に関係なく、一律で1行間隔にします(空白行を1行入れる)。

「検索する文字列」は以下のように記述します。改行が1つ以上連続するものを固まりとして検索します。

^13{1,}

「置換後の文字列」には以下の記述をします。上記でヒットした改行の固まりを改行2つで置換します。

^p^p

これで、すべてが1行間隔に置き換わります。もし、2行間隔にしたい(空白行を2つ差し込む)時は、「置換後の文字列」を ^p^p^p と3つ並べれば良いことになります。

【ワイルドカード】余分な改行を削除する

原稿ファイルの処理において、時々、余分な改行を削除したいことがあります。そんなときは以下のワイルドカードを使用します。

まず、「検索する文字列」に以下の文字列を入れます。
改行(^13)が2つ以上連続({2,})するものを検索します。

^13{2,}

そして、「置換後の文字列」に以下の文字列を入れます。
上記でヒットした改行(の固まり)を、1つの改行(^p)へ置き換えてやります。

^p

もし、ソフトリターン(^11)も同時に削除対象にしたい場合は、「検索する文字列」を以下のように記述するといいです。

[^11^13]{2,}

ちなみに、PDFファイルからコピペしたり変換した場合、ソフトリターンや改行、時に半角スペースや全角スペースが混在していることがあります。その場合は、「【ワイルドカード】改行前の余分なスペースを除去する」を事前に実行してから、上記のワイルドカードを実行すれば良いです。

また、この記述方法を変化させれば、例えば、1行間隔に空白1行を差し込むと言うこともできます。
その方法は、「【ワイルドカード】強制的に1行間隔にする」に書いてありますので、参考にしてください。

【ワイルドカード】同じ単語の連続を検出する

中級セミナーで受講者の方から出た質問です。

間違って同じ単語が連続して入力されたものを検出するには、辞書にどういう記述をすればいいですか?

これを実現するには、以下のようなワイルドカードを記述します。

(<[a-zA-Z]{1,}>)[ .]\1

ワードの検索機能で、ワイルドカードをオンにして実行すれば、検出できます。

また、WildLight辞書へは、このまま記述すればOKです。