正規表現はとても重宝しています

テキスト編集課のGです。

初稿組をするまでの工程を書きます。

 (1)クライアントからいただいたデータはテキスト形式に変換します。
 (2)テキストデータの全角文字、半角文字、スペース等を統一します。
 (3)赤字修正、独自に作成した外字を用いて見出しのタグ等を入れる。
 (4)組版ソフト用の置換をかける。(3)で入れた見出しのタグはすべての組版ソフトで共通なので、それぞれ組版ソフト用のタグに置換します。
 (5)雑誌や書籍で細かいルールがあるのでルールに沿った専用置換をかける。

上記の工程後に組版をします。
 (1)~(5)すべての工程で置換が使われており、主にPerl、テキストエディタで置換をしていますが、置換テーブルを作る際に重宝しているのが正規表現です。
 正規表現とは文章を検索するときのオプションみたいなもので、“メタ文字”という特殊文字を使うことでかなり複雑な検索が可能となり、決まったパターンの文字列を少ない回数で検索や置換が出来るので作業の効率化になります。

 

少し正規表現の例を書いてみます。

1◆あいうえお
2◆アイウエオ
3◆12345

上に書いた文字列のパターンは、「半角数字◆○○○○○(規則性のない任意の文字列)」です。★半角数字●○○○○○★のように前後を★~★で挟み◆を●に置換します。
考え方としては、「行頭の半角数字の後ろは黒菱形でその次は規則性のない任意の文字列(行末まで)」となります。正規表現を使って書いてみます。

検索文字列 ^([0-9])◆(.*)$
置換文字列 ★\1●\2★

今回は^()[].*$のメタ文字を使いました。まるで暗号文ですがそれぞれ意味があるので説明します。
^は行頭、$は行末(改行の直前)になります。
[ ]は括弧内のどれか1文字。今回は[ ]のなかに0-9を入れたので0、1、2、3、4、5、6、7、8、9のうちどれか1文字。
.は改行以外の1文字。
*は直前のパターンが0個以上。今回は直前のパターンが.なので改行以外の文字が0個以上になるので◆の後ろすべての文字。
( )は括弧内のパターンを置換文字列\1、\2(\9まで)を使って呼び出すことが出来る。

 

 正規表現もかれこれ十数年使用しておりますが、始めた頃に作った置換テーブルを見るともっと正規表現を使えばすっきりするのにとか、何でこんな置換を書いたのかと思うことがしばしばあります。置換テーブルを作る際に注意をしなければいけないことは、意図しないパターンにマッチして気付かずに置換をしてしまい、思いもよらぬ結果になることがあるので、必ず1つずつ確認あり置換で試すことを心掛けています。

 正規表現が使える場面は多く、プログラミング言語、テキストエディタ、今ではInDesignでも使えるようになっています。アプリケーションによって少々書き方が違いますが基本は同じなので覚えていても損はないと思います。


大量生産できるわけ

DS課のAです。

那須工場の大きな特長を知ってもらいたいのです。それは、

 『大量生産が得意だ!』

ということです。

 那須工場は1990(平成2)年6月に設立されて26年目に入りますが、現在では組版専門のオペレータが13名、テキスト加工で40名の人材を擁しています。

 組版オペレータのほとんどは電算写植を経験しているベテランばかりで、テキスト加工のメンバーでもオペレータ経験者が多数います。

 わが社の主力アプリケーションは、AdobeのInDesignとモリサワのMC-B2です(一部EDICOLOR & QuarkXPress & 写研もあります)が、那須工場のほとんどのオペレータが複数のアプリケーションを使いこなし、仕事の状況でアプリケーションを使い分けています。これだけの人材をそろえている印刷会社はそうは無いと思います。

 僕自身は写研組版とPageCompは経験していませんが、写研ファンクション・文字入力を教わった後は、QuarkXPress、EDICOLORとMac畑で育ててもらい、その後MC-B2、今はInDesignをメインに仕事をしています。

 「テキストデータの変換・加工・修正」、「図表の作成」、「画像の加工」、「組版」までの全作業工程を一人で行っている印刷会社は多いのですが、那須工場ではすべての作業工程が分担され、各部署が効率のよい仕事を行い、スピーディーに組版オペレータに文字データや図表の素材が渡せるように、独自の仕組みを作っています。

 その日の仕事量や納期、また仕事の難易度や性質によって、どの工程にウェイトを置くかを考えながら、大量の原稿が入稿した場合でも、柔軟な対応が可能な状態になっています。

 部署や工程が多くなることで「情報の共有や意思の疎通が難しくなるのでは?」と思われるかもしれませんが、みんなとてもフランクで、職責の上下はもちろんありますが、相談や情報の伝達はスムーズにおこなえる環境です。そしてなによりみんな若い(平均年齢34.5歳)です。那須工場の中では、僕は年配組に属しています(僕38歳)。

 また、今後詳しく書きますが、InDesignではScriptを使った自動組版、MC-B2は大量ページの一括処理や数式に強いので、それぞれの特性を最大限に生かす工夫もしています。

 僕が年配組だというのはさておき、そういった理由で、那須工場では大量生産ができるのです。


新しい記事 →