検証! GoogleChromeのOCR機能

DTP 3部のMです。

2023年になり、個人的に久々のブログになります。前回担当してから3年の月日が過ぎていました。年をとると時間の流れが早く感じられます。

さて、今回のブログは最新のOCR(オーシーアール)はどこまで便利になったかを検証していきたいと思います。
 
その前に、OCR(オーシーアール)とは何かわからない人もいるかと思いますので簡単に説明です。

OCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)とは、手書きや印刷された文字を、イメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術です。

自分が入社した当初のOCR機能はかなり精度が弱く、スキャンで抽出したときに6~7割合っていれば良い方でした。ましてや手書き文字のあった場合、確認(検版)する時間を考えると入力した方が早いレベルでした。

それでは、実践です。
今回はGoogle様のGoogleChromeを使ってOCRしてみましょう。
まずは、抽出方法です。

 

 undefined

 

undefined

 

三報社印刷株式会社は、 東京都江東区亀戸を拠点とし、 東京都江戸川 区松江 東京都品川区西五反田 東京都港区東麻布・栃木県那須塩原 市上郷屋に営業所をもち、 医学書 学術書 学会誌などの学術出版物 や写真集などの美術書を主にご提供している創業100年の総合印刷会 社です。

編集デザインから医療画像の繊細な表現、高品質印刷まで全てお任 せください。 総勢250名のDTPオペレータと24台86胴の印刷機でお客
様をサポートいたします。

検証結果
アキ(スペース)や句読点、行の折り返し後のアキは出てしまう。
ナカグロ(・)はうまく取り出せない。
194文字中文字違いは0個!

さすがにこの状態のデータならアキ・ナカグロ以外は抽出できます。

次に手書き文字はどうでしょう。

undefined

 

三報社印刷株式会社は、東京都江東区亀戸 を拠点とし、東京都江戸川区松江・東京都品川区 西五反田・東京都港区東麻布・栃木県那須 塩原市上郷屋に営業所をもち、医学書・学術書・ 学会誌などの学術出版物や写真集などの 美術書を主にご提供している創業100年の 総合印刷会社です。 編集・デザインから医療画像の繊細な表現、 高品質印刷まで全てお任せください。総勢250名の DTPオペレータを2486胴の印刷機でお客様 をサポートいたします。

検証結果
行の折り返し後のアキは出てしまう。
アキ(スペース)や句読点は手書きの抽出の方は正確にとれている。
ナカグロ(・)も正確にとれている。
197文字中文字違いは2個!(赤部分「と」が「を」)(「24台86」が「2486」)

間違っていた文字の所の「を」は手書き時にすこし意地悪していたので予想どおりでした。
「2486」は抽出漏れですね。


総合評価
PDFデータそのままであると特に問題無く抽出可能。文字情報があるからなのかも。
また、条件にもよりますが、手書き文字の精度が相当高いと感じます。
手書き文字を入力するならスキャンした方が効率が良い場合があると思いました。