デジタルカメラで撮影するのは、人物や風景ばかりとは限りません。ちょっとしたメモ代わりに、雑誌の記事やレシピなどを記録している人も多いでしょう。今回は、そうしたメモやテキストをOCRソフトでどこまでテキストデータにできるかをトライしてみました。

※画像をクリックすると拡大画像を表示します。

 撮影した画像。A4サイズです

 OCRソフトというと、イメージスキャナー専用というイメージが強くあるのではないでしょうか。スキャナーで取り込んだ画像なら原稿の歪みも少ないし、スキャナーが文字原稿用の白黒のモードを備えていたりします。一方、デジタルカメラで原稿を撮影すると、歪んでしまったり、正しい読み取りが行いにくいのです。

 でも、いまどきのソフトはスゴイのです。結果をいえば、今回使った松下電器産業の「読取革命Ver.7」(希望小売価格1万9800円)だと、200万画素デジタルカメラで読み込んだデータを驚くほどテキストデータに落としてくれました。

 撮影のポイントは、フラッシュを発光禁止にして、なるべくまっすぐ撮影すること。それに尽きます。部屋の中で撮るときは、卓上の蛍光灯などを総動員して少しでも明るくしましょう。ズームは手ブレを抑えるためにワイド端にします。色は気にしなくても大丈夫です。

 入門ウィザードにしたがって操作していきます。まず、ファイルを読み込みます  画像を回転するときは、回転の指示を出しておきます。自動判定が使えるのかどうか、試してみました

 日本語原稿なので、日本語をクリック  保存するファイル形式をいくつかから選んで、認識実行をクリック

 認識実行をクリックすると、自動的に回転や画像の補正が行われます。認識結果は、画面左にオリジナルの画像、右側にテキストデータ化したレイアウトで表示されます。あわせて、保存するファイル形式に対応したアプリケーションが起動され、ファイルが表示されます

 01のイメージ原稿を読み取った結果がコレ。思っていた以上にすばらしい精度だと筆者は思いました

 このソフトの場合、かなり複雑なレイアウトも、きちんと認識しそうなので、年賀状の住所欄や名刺を寄せ集めて、一挙にデータベース化してしまうこともできそうです。

 今回は、OCRソフトの凄さに驚いたリポートになってしまいましたが、もう少し雑に撮影するとどうなるかもやってみました。結果は、やはりそれなりに精度は悪くなりました。キーボードから文字入力する手間に比べたら、きちんと写真を撮る手間は、ほんとに微々たるものです。きちんと撮って、あとの仕事をラクにしたいものです。