大阪で中級セミナー(8月)

大阪のほんまかいブログに、それとなく告知されましたので、こちらでも告知しておきます。

まだまだ先の話になりますが、8月に大阪のほんまかい主催で「WildLight中級セミナー」を行います。詳細は、ほんまかいブログにて発表になると思いますので、そちらを定期的にご確認ください。

もちろん「中級」ですので、WildLightのインストールが終わり、それなりに使っておられる方が対象となります。ほんまかいでは、事前のワイルドカード勉強会を開催されて、中級セミナーに臨んて下さっているので心強い限りです。きっと、通常の中級セミナーより上級へ踏み込んだセミナーになりそうで、今から楽しみです。

広告

ワイルドカードのセミナー(4/23日)

4月23日(日)に東京ほんま会主催によるワイルドカードのセミナーがあります。
題して「ワイルドなセイキの対決! ワイルドカードVS正規表現セミナー」です。
詳細は以下のリンクからご覧ください。

東京ほんま会ワイルドなセイキの対決! ワイルドカードVS正規表現セミナー

WildLightを高度に利用する上で欠かせないワイルドカードを学ぶ絶好のチャンスです。既に席がかなり埋まっているようですので、興味のある方はお急ぎください。

 

オープンスクール2017春

3月4日(土)にサン・フレアアカデミーで開催されるオープンスクールで、「WildLightの翻訳活用術」をお話しします。

サン・フレアアカデミーさんのオープンスクールを担当させていただくのは、今回で3回目です。過去2回はWildLightを軸に、どちらかというと翻訳チェックに重点を置いた話をさせていただいたのですが、今回は、WildLightを純粋にツールとして使用する上でのノウハウをお話しする予定です。

翻訳という仕事は、IT技術の進歩にともなって扱う原稿の形式がいろいろと増え、翻訳者と言えどもそれらの原稿を自分が翻訳しやすい形式に変えたり、翻訳完成物のチェックをしやすい形に変えたりと、ITスキルが要求されるようになりました。WildLightは、私が自分の仕事(翻訳コーディネータ/社内翻訳)を効率化することをひとつの目的として開発してきた経緯があり、翻訳に関わる周辺作業へ利用してきています。

今回のオープンスクールでは、その実例をご紹介する予定です。また、事前アンケートを採り、参加者の皆様が抱える周辺作業の「困ったこと」のうち、WildLightで解決できるものについて、解決策を紹介しようと考えています。

サン・フレアアカデミーオープンスクール2017春

数字の3桁位取りを自動化する

先日行ったWildLight中級セミナーで、受講していただいた方から以下のようなお題をいただきました。もちろん、セミナーではこれを題材にワイルドカードとWildLight特殊コマンドの実習を行いました。うまく解決できたお題ですので、当ブログでシェアいたします。

4桁以上の数字を自動的にカンマで位取りしたい

まず考えたいのは、対象となる数字の桁数です。4桁以上は確かですが、最大何桁までを対象と考えるかです。

X,XXX 〜 XXX,XXX,XXX,XXX

まぁ「兆」くらいをカバーしておけば実用的でしょうか?(笑) すると対応しなくてはならない組合せは以下の3通りということになります。

XXX,XXX
XXX,XXX,XXX
XXX,XXX,XXX,XXX

ワイルドカードで実現する上で、数字の桁数によって処理を変えるというのは、記述が難しそうですので、まずは、末尾三桁(下の例だと012)とそれ以前(123456789)を分けてヒットさせる方法を考えました。

123456789012

[0-9]@[0-9]{3}>

このワイルドカードの記述により、末尾三桁を[0-9]{3}> でヒットさせ、それ以前を [0-9]@ でヒットさせられます。それぞれを置換時に利用するために ( ) で括り、そして、それらの間に位取りのカンマ「,」を挿入するために、置換語に「¥1,¥2」と記述すれば良いことになります。WildLight辞書へは以下のように記述します。(※(TAB)は実際にタブキーを押して入力してください)

WILDCARD:ON
([0-9]@)([0-9]{3})>(TAB)¥1,¥2

この辞書を実行すると、4桁以上の数字は、以下のようになるはずです。

123,456
123456,789
123456789,012

さて、さらに上位の桁の位取りはどうしたらいいでしょう?
そうです。このワイルドカードを繰り返して実行すればいいのです。

ただし、ここで注意しなければならないのは、WildLightに以下の基本機能があることです。

  1. 検索した結果には、必ず蛍光ペンが付く。
  2. 蛍光ペンのない箇所が検索対象となる。

上記のワイルドカードを実行したことにより、数字にはすべて蛍光ペンがついている状態になっています。つまり、そのまま続けて実行したのでは、それらの数字は検索対象から除外されてしまい、位取りがされません。そこで利用するのが、検索時の蛍光ペンの有無を無視するコマンド「IgnoreH」です。

IgnoreH:ON で、検索時に蛍光ペンの有無を無視します(すべてを検索対象として検索する)。ちなみに IgnoreH:OFF でデフォルト値に戻り、基本機能通り、蛍光ペン箇所は検索対象から除外されます。では、これを使って辞書を記述してみると以下の通りになります。

WILDCARD:ON
([0-9]@)([0-9]{3})>(TAB)¥1,¥2
IgnoreH:ON
([0-9]@)([0-9]{3})>(TAB)¥1,¥2
([0-9]@)([0-9]{3})>(TAB)¥1,¥2

これで、兆までの数字に対して3桁位取りが自動で行われ、蛍光ペンがつきます。

この辞書は、ライブラリーに「WLDIC_変換_4桁以上の数値をカンマで自動的に位取り.txt」という名前で登録してありますので、ダウンロードしてご利用ください。

WildLightは、ワイルドカードの1文では表現しきれない処理も、辞書に記述を並べることで処理を可能にできるところが、大きな特長です。

【報告】WildLight中級セミナー

翻訳横丁の裏路地

2016年8月21日に東京ほんま会主催で「WildLight中級セミナー」を開催しました。

自分の翻訳周辺業務を効率化するために2012年に開発に着手したWildLight。2013年末に翻訳勉強会「十人十色」のワイルドカードセミナーで初めて人前でデモし、参加された方数名の「使ってみたい」という声に後押しされてフリーウェアとして公開して以来、既に3年も経ちました。自己開催でセミナーも始めて試行錯誤してきましたが、やっと「WildLightセミナーカリキュラム」が形として整ってきました。

WildLightセミナーカリキュラム

今回は中級セミナーということで、参加者全員で、簡単な課題を解決するためのワイルドカード実習をし、そして受講者から寄せられた課題をワイルドカードとWildLight特殊コマンドを使った辞書を作成して解決する実習を行いました。流石に脳を酷使したのか、セミナー後に「頭が疲れた」と仰る方もおり、翌日に知恵熱で寝込まなければいいがと心配しました(笑)

今回のセミナーでつくづく感じたのは、やはり、自分がどう課題解決するかの戦略を立て、ワイルドカードや特殊コマンドを記述して、トライアル&エラーを繰り返しながら辞書をつくる実習をすることは、本当にWildLightを使えるようになるためには必要不可欠だなという事です。事前に提示された課題も、完璧にWildLightでカバーできたものもあり、そのアプローチと考え方は、きっと受講者の方が今後WildLightを使う上で役に立つだろうと信じています。

ある程度、使いこなせる方が現れ、要望があれば、上級セミナーを少人数で実施することを考えています。

元の投稿を表示

中級セミナーをやります

今年最後の(笑)「WildLight中級セミナー」を東京ほんま会の主催で行います。

日時:8月21日(日) 13:00〜16:30
場所:株式会社翻訳センター会議室
受講料:3,500円

申込詳細は、以下URLの東京ほんま会ブログを参照してください。
https://tokyohomma.wordpress.com/

今回の中級セミナーは、最初にワイルドカードの使い方を学習し、それに続いて受講者からのアンケートに基づいて、ワイルドカードを使ったWildLight辞書の作成を学習します。
以下のような悩みや質問がある方は、是非参加を検討いただき、どんどんアンケートに「やりたいこと」を回答ください。セミナーの中で対応策を一緒に考えていきます。
(※WildLightの機能で実現できる範囲の対処策となりますので、予めご了承ください)

  • チェック辞書を作りたいけど、ワイルドカードでどう書けばいいの?
  • カタカナとカタカナの間にある半角は黄色、数字と単位の間にある半角は緑というような処理をしたいのだけど、どういう風に辞書に書けばいいの?
  • 文書スタイルを整えるための辞書は、どう書けばいいの?
  • 半角と全角の間にスペースが入っているのを検出するには、ワイルドカードでどう書けばいいの?

    などなど

実際にお仕事をしていて、困ったことを何とかできないか?という発想で、具体的な「困った例」をアンケートにお答えいただけると実のあるセミナーになるでしょう。

では、参加をお待ちしております。

 

 

 

大阪でWildLightセミナーをします。

大阪のほんまかい主催で、WildLightセミナーを行うことになりました。

  • 日時:5月14日 13:00〜17:00
  • 場所:大阪 神戸大学学友会大阪クラブ@大阪梅田駅前第1ビル 11階

詳細は、ほんまかいホームページか、通訳翻訳Webにイベント記事が掲載されていますので、そちらをご覧下さい。

SFA OSで発生した問題

2月27日にサン・フレアアカデミーで開催されたオープンスクールで「WildLight初級セミナー」を行いました。ご出席いただいた皆様、ありがとうございました。

クラス前日まで辞書ファイルをいじっていたため、「数チェック」辞書では想定の動きをお見せできずご迷惑をお掛けしました。日曜日に再見直しを掛けましたので、現在は修正された最新版が登録されています。

また、コメント一覧にてエラーが発生しましたが、暫定対策を施したVer. 2.18を公開しました。オープンスクールでたまたま使用したサンプル文書が、デバッグで想定していないスタイルだったようで、良いバグ出しになりました。

このセミナーを受け、新たに使用を開始される方もおられると思いますが、何かトラブルを発見しましたら、お気軽にご連絡ください。

WildLightは皆さんとともに育てていくツールです。

WildLight中級セミナー 1/31

[Blog更新] WildLight中級セミナー(1月31日)

初の中級セミナー。ワイルドカードとWildLight特殊コマンドで、いろいろな翻訳周辺作業を簡素化しましょう。

この度、東京ほんま会主催による「WildLight中級セミナー」を、1月31日(日)に開催します。

今まで、初級セミナーは何度となく開催してきましたが、中級は初めてとなります。さて、一体、何が「中級」なのか?(笑)

具体的には、WildLightを活用するための辞書作成を、ワークショップを通じて学ぶスタイルになります。そう、自分で辞書を書きます。やはり、自分で書かないと自分のものになりませんものね!

セミナー最初は初級セミナーのおさらいをします。基本的な動作とメニューにある機能を、デモをご覧に入れながら説明いたします。その後に、参加者の皆さんに答えいただいたアンケート結果を課題として、それらを解決するためのWildLight辞書作りを行っていきます。もちろん、ワイルドカードの学習とWildLight特殊コマンドの学習をあわせて行っていきます。

途中、既存の辞書の中身をみんなで読み解いて、何をしているのかを理解するセッションも設けるつもりです。辞書はあるけど、何やってるの?・・・って知らない人が多いので、その考え方を学ぶことで、自分専用の辞書へ作りかえる力を身につけます。

中級セミナーは、今後の開催は未定ですので、WildLightを使いこなしたいと考えておられる方は、この機会に参加されることをお勧めいたします。

詳細は、以下のリンクをご覧ください。

東京ほんま会「WildLight中級セミナー」

 

SFAオープンスクールの質問から

昨日、2月28日(土)はサン・フレアアカデミーのオープンスクールでした。

クラスの中でWildLightの使い方に関する質問がありました。これは他の皆さんも利用できる情報ですので、ここにシェアしておきます。

1. 蛍光ペンのついた文字列をワードやエクセルへ抜き出せるか?

WildLight特殊コマンドの「ExtractH2Word」もしくは「ExtractH2Excel」を使います。

例)
ExtractH2Excel

いずれかのコマンドを1行記述した辞書ファイルを準備し、蛍光ペンされたテキストを抜き出したいワード文書へ適用すれば、抜き出せます。

この例を記述した辞書を「WLDIC_抽出_蛍光ペン部をExcelへ抜く.txt」として作成しておきました。ライブラリーからダウンロードしてご利用下さい。

2. PDFファイルからワードにしたものを整形するには、どうしたらいいか?

 この質問については明確な回答ができませんでした。PDFからワードファイルを起こした場合、使用したアプリケーションや原稿PDFの中身によって、出る症状が違うからです。

  • 私の経験した症状として、以下のようなものがあります。
    1. 全角文字間に全半角スペースが紛れ込んでいる。
    2. 全半角数字の後ろに複数の半角スペースが入っている。
    3. 半角英数字間のスペースに全角スペースが入っている。
    4. 文頭に不要なスペースが入っている。

これらへの対処として、以下のような処理を行っています。

' 全角英文字カタカナ漢字の間に挟まった全半角スペースを除去する
 
 ([a-zA-Zァ-ヾ一-鶴ぁ-ゞ])[  ]{1,}([a-zA-Zァ-ヾ一-鶴ぁ-ゞ])     \1\2
' 全半角数字の後のスペースを半角スペース1つにする

 ([0-90-9])[  ]{2,}     \1
' 半角英数字間のスペースを半角スペース1つにする

 ([\!-~])[  ]{1,}([\!-~])     \1 \2
' 文頭の不要なスペースを削除する

 ^13[  ]{1,}     ^p

上記4例とも、[ ]の中は全角スペース1つと半角スペース1つが入っています。
また、セパレーターはTABです。
これらが記述された辞書は、「WLDIC_編集_日本語:PDF抽出文書の成形.txt」として提供しています。

3. エクセルやパワーポイントファイルからテキスト抽出するには、どうしたらいいか?

Microsoft Office Personal以外(Excel, PowerPointが入っているもの)をお使いの方は、WildLight Users Group でのみ配布されている Full バージョンを使えば、エクセルやパワーポイントからテキスト抽出する機能を利用できます。

4. 全角文字の間にまぎれた半角スペースを除去する方法は?

全角文字の間に半角スペースが入っているケースは、PDFファイルからワードへ変換した時に良く見かけるので、質問2への対処の1つとしても有効だと思います。

全角文字をワイルドカードで表現すると以下のようになります。

 、-鶴

そして、全角文字に挟まれる半角スペースを検出して削除するには、辞書に次のように記述します。

 ([、-鶴])[ ]([、-鶴])                  \1\2

[ ]の間には半角スペースを入れます。
([、-鶴]) ([、-鶴])と\1\2の間はセパレーターのTABです。

この辞書を「WLDIC_変換_全角文字間の半角スペースを除去.txt」として作成しておきました。ライブラリーからダウンロードしてご利用下さい。