やりたいことをやるだけさ

育児、コーチング、自己啓発、アドセンス、やりたいことをやるだけさ

office lens を使ったOCRでやりくりする

大量のデータをOCRさせるソフト

GoogleドライブからのOCRは時間がかかりすぎるため別の方法を探していましたが見つかりました。

office lensというマイクロソフトから出てるアプリを使うことでまあまあの解決ができました。

 

まず初めにこれまでの問題はなんだったかというと

 

Googleドライブに保存した PDFをOCRさせるにはそのPDFファイルの容量が2MB以内であることが条件でした。

 

けれどわたしの作ったデータは133MB、180ページ分でしたので、OCRできるわけがなかったのです。

 

これを細かく分割してる時間はめんどくさいのでやりたくない。

 

OCRの精度も高くなくてはいけない。

 

色々探した結果、office lensが最適なんじゃないかという結論になりました。

 

使い方

office lens をアプリストアからダウンロード

ワード、one driveもダウンロードしておくことをお勧めします。

f:id:naruzawan:20210107140851j:image

 

office lensを起動する

スキャンしたいものを撮るのだが

ここではすでに撮影してるのがあるので

青く丸で囲んでるところをタップ

f:id:naruzawan:20210107140942j:image

写真を選ぶ。

30枚までしか選択できないが、まあ、許す。

f:id:naruzawan:20210107141046p:image

選んだら右下の赤いまるをタップ

f:id:naruzawan:20210107141144p:image

完了をタップ

f:id:naruzawan:20210107141340j:image

どの形式でエクスポートするのかを選ぶ

ワードを選択しよう

f:id:naruzawan:20210107141228j:image

すると

転送してますとメッセージがでて

グルグルOCR処理してる

f:id:naruzawan:20210107141453j:image

完了したファイルをタップすれば

ワード形式で編集することができます。

精度は?

先程一つスキャンしたやつをみると

この画像データが

f:id:naruzawan:20210107143349j:image

このようになります

f:id:naruzawan:20210107143424j:image

数式のところは全くダメです。

でも仕方ないですね。

 

基本的に文字だけですから

もっと検証してみた方がいいですね。

 

当面これで行きます。