索引電話帳順とは?

三協美術印刷のTです。

 同業他社の方からも、「索引で電話帳順に並びかえがしたいが、どうすればよいですか?」と質問されることがあります。
 電話帳順とは、
 ① 片かな
 ② 平がな
 ③ 漢字の読みがな
   (第1文字で五十音順に配列し、頭字の同じものは読みがなの第2文字目以降の五十音順に従う)
 ④ 漢字の画数(部首)
 の順番に並べることですが、例えば初めの一頁だけ並びかえの見本組コピーだけをもらって判断しなければならない場合など、表面上その順序規則が見えにくく一見したところでは何の順番だかわからないことが多いです。
 下図のテキストを、全体を五十音順に配列と電話帳順に配列の二通りにソートして見比べてみましょう。

undefined


ソート結果
 (全体を五十音順に配列)   (電話帳順に配列)
  アイザック          アイザック
  あおたよういち        アラン
  安倍幸喜           あおたよういち
  阿部真一           安倍幸喜
  安倍雄一郎          安倍雄一郎
  アラン            阿部真一
  安藤宗治           安藤宗治


 上図のように、電話帳配列は片かなと平がな、とくに漢字の画数(部首)でまとめるので名前を見つけやすいという特徴があります。
 従って、索引作成をするにあたって以下のように漢字の画数情報がなければソートはできません。

undefined

 以前エクセルなどで入稿されたデータを電話帳順にソートしてほしいと依頼されたことがありましたが、以下のようなデータでは不可能になります。

undefined


 前から1文字毎に読み、画数(部首)を判断していくため、句切れ目のない読みでは判定不可能だからです。このようなデータが入稿してしまった場合、応急処置として始めの1文字だけ目視で切り離して無理やりソートするやり方がありますが、それは必ず失敗します。初校戻りで行移動の赤字だらけで戻ってきます。何故なら件数が千件位ならごまかしが効くかもかもしれませんが、1 万件を越す件数があるとさすがに最後まで判定しないと似たような索引語がたくさん出てきてしまうからです。
 下図のようにスクリプトを駆使して一括で区分けをすることもできますが、特殊な読みはヒットせず件数が多いと修正に時間がかかります。

undefined


 従って、索引を作成する時は入稿前に先方担当者様との緻密な打ち合わせが不可欠です。