OCRでスキャンして
臨床心理学の本を黙々と読んでやろうと企んで
とりあえずこの本を全部iPhoneで写真に撮って
Googleドライブにアップロードしてみたんです
メリット OCRが無料で正確
とても精度良くテキストに変換してくれます
今後、Googleフォトもドライブも15GB以上保存するなら有料になりますが、今のところは無料。
2、3ページを単発でスキャンしたい人は最高ですね。
デメリット 一枚一枚変換しないといけない
ただね、めんどくさかった。
チマチマ一つ一つのjpegをGoogleドキュメントで開いて変換しなくてはならない。
わたしみたいに本を丸ごと一冊写真に撮ったやつを丸ごと変換することはできない。
デメリットへの対策 PDF変換からの結合
そこで対策。
写真の形式はjpegなので
これを全てPDFに変換する
そしてそれを結合する。
jpegを直接結合することも考えたが
その方法だと
2つのjpegを1つに繋げるとか
最大でも4つのjpegを1つにまとめるとか
そのくらいしかできない。
180枚のjpeg画像を一枚に結合することはできません。
なので一度jpegをPDFに変換した後に
PDFファイルを一つにまとめ
そのまとめたファイルを丸ごとOCRにかける
という方法でやってみることにする。
JUST PDFというソフトがあるので
それに180枚のjpegを入れて
PDFに変換して同時に結合させる。
うまくいかない
無事に結合した PDFファイル。
しかし容量が133MBもある。
とりあえず
これをGoogleドライブにアップロードしてみる。
そして、アップロードしたファイルを
Googleドキュメントで開こうとすると
できない…
ずーっと処理中のグルグルがグルグルしてるだけ。
きっとデータがでかすぎるのでしょうね。
30MBくらいに三分割くらいしてみる。
すると…
やっぱりできない…
容量無制限でOCRしてくれるソフトをさがさないといけませんね。わかったらまたご報告します。