やりたいことをやるだけさ

育児、コーチング、自己啓発、アドセンス、やりたいことをやるだけさ

Googleを使いjpegをテキストデータ化したいけど…

OCRでスキャンして

臨床心理学の本を黙々と読んでやろうと企んで

とりあえずこの本を全部iPhoneで写真に撮って

f:id:naruzawan:20210106064503j:image

Googleドライブにアップロードしてみたんです

 

メリット OCRが無料で正確

とても精度良くテキストに変換してくれます

f:id:naruzawan:20210106064737j:image

今後、Googleフォトもドライブも15GB以上保存するなら有料になりますが、今のところは無料。

2、3ページを単発でスキャンしたい人は最高ですね。

 

デメリット 一枚一枚変換しないといけない

ただね、めんどくさかった。

 

チマチマ一つ一つのjpegをGoogleドキュメントで開いて変換しなくてはならない。

 

わたしみたいに本を丸ごと一冊写真に撮ったやつを丸ごと変換することはできない。

 

 

デメリットへの対策 PDF変換からの結合

そこで対策。

写真の形式はjpegなので

これを全てPDFに変換する

そしてそれを結合する。

 

jpegを直接結合することも考えたが

その方法だと

2つのjpegを1つに繋げるとか

最大でも4つのjpegを1つにまとめるとか

そのくらいしかできない。

 

180枚のjpeg画像を一枚に結合することはできません。

 

なので一度jpegをPDFに変換した後に

PDFファイルを一つにまとめ

 

そのまとめたファイルを丸ごとOCRにかける

という方法でやってみることにする。

 

JUST PDFというソフトがあるので

それに180枚のjpegを入れて

PDFに変換して同時に結合させる。

 

うまくいかない

無事に結合した PDFファイル。

しかし容量が133MBもある。

 

とりあえず

これをGoogleドライブにアップロードしてみる。

 

そして、アップロードしたファイルを

Googleドキュメントで開こうとすると

 

できない…

 

ずーっと処理中のグルグルがグルグルしてるだけ。

 

きっとデータがでかすぎるのでしょうね。

 

30MBくらいに三分割くらいしてみる。

 

すると…

 

 

 

やっぱりできない…

 

容量無制限でOCRしてくれるソフトをさがさないといけませんね。わかったらまたご報告します。