大量のデータをOCRさせるソフト
GoogleドライブからのOCRは時間がかかりすぎるため別の方法を探していましたが見つかりました。
office lensというマイクロソフトから出てるアプリを使うことでまあまあの解決ができました。
まず初めにこれまでの問題はなんだったかというと
Googleドライブに保存した PDFをOCRさせるにはそのPDFファイルの容量が2MB以内であることが条件でした。
けれどわたしの作ったデータは133MB、180ページ分でしたので、OCRできるわけがなかったのです。
これを細かく分割してる時間はめんどくさいのでやりたくない。
OCRの精度も高くなくてはいけない。
色々探した結果、office lensが最適なんじゃないかという結論になりました。
使い方
office lens をアプリストアからダウンロード
ワード、one driveもダウンロードしておくことをお勧めします。
office lensを起動する
スキャンしたいものを撮るのだが
ここではすでに撮影してるのがあるので
青く丸で囲んでるところをタップ
写真を選ぶ。
30枚までしか選択できないが、まあ、許す。
選んだら右下の赤いまるをタップ
完了をタップ
どの形式でエクスポートするのかを選ぶ
ワードを選択しよう
すると
転送してますとメッセージがでて
グルグルOCR処理してる
完了したファイルをタップすれば
ワード形式で編集することができます。
精度は?
先程一つスキャンしたやつをみると
この画像データが
このようになります
数式のところは全くダメです。
でも仕方ないですね。
基本的に文字だけですから
もっと検証してみた方がいいですね。
当面これで行きます。