2017年4月27日

フリーのOCRソフトを探す


OCR(光学的文字認識)機能を使いたかったので、フリーソフトを探しました。そうしたらGoogleドキュメントにOCR機能があることを知りました。



メニューに「OCR」と明示されているわけではないので、誰かに教えてもらうか偶然発見するしかないでしょう。手順を以下に記します。

①OCRにかけたい画像ファイルを「Googleドライブ」にアップロードします。

②アップロードしたファイルを右クリックして「アプリを開く」→「Googleドキュメント」を指示します。

③ちょっとした待ち時間の後、Googleドキュメントでファイルが開きます。このドキュメントには画像とテキストが含まれています。

文字認識の機能はなかなか優秀です。個人的には期待以上でした。縦書きの段組みという難しい文書だったのですが、行単位ではきちんと認識しました。識字率は9割を超えると思います。

ただし一部旧字体になってしまう文字がありました。たとえば「静」が「靜」になりました。「発」が「癸」になるのは仕方が無いかもしれませんが、一般的な文字にしてくれるとうれしいところです。何となく中国語がメインなのかな?と穿ってみてしまいます。

段組みに関しては行末まで行くと同じ段の続きがあるのに下の段に移ってしまったり、飛び飛びになる部分がありました。でもその程度であればコピペで修正できるので大した問題ではないと感じました。

私は量や精度を必要としているわけではないので、無料で(と言って良いのか異論はありますが)ここまでできれば十分以上だと感じました。





0 件のコメント:

コメントを投稿