ScanSnapはpdfかjpgか?それでも迷う人への一つの提案

scansnap_pdfjpg3

別の記事では、ScanSnapでの保存はpdfかjpgか、OCRの精度から考えてみました。

自炊(本の電子化)するときに、pdfとjpgどちらで保存すればいいのか迷うことがありました。 それは、 ScanSnapで読...
ScanSnapで読み込んだ後、 「初めからpdfで保存したもの」と「jpgで保存したものをpdfにしたもの」 OCRの精度...

それでも、やっぱりどっちがいいか悩むと言う人。

今回は、そんな人へのひとつの提案です。

●ひとつの提案

ScanSnapで本を読み込む時の保存。pdfかjpgか、ここで毎回迷っていては、自炊はなかなか進みませんよね。

そんな方に、こんな提案です。

「スキャン時のファイルは、そのまま別に保存しておく」

というのはどうでしょうか。

迷うのは、今やっているやり方よりも、もっといい方法があるかもしれないと思うから。
オリジナルを取っておけば、後からもっといい方法が出てきたときに再加工が可能です。

あとからなんとかできる方法があると思えば、安心感で迷いは少なくなります。

●スキャン時のオリジナルは、そのとき最善のデジタル化のファイル

スキャンするときの設定は、その人にとって「現時点で最善だと思った設定」のはずです。

よりきれいに保存しておきたい人なら、
画質の選択はスーパーファインでなく「エクセレント」でしょうし、圧縮率も「弱く」しているでしょう。
多くの人が、「スーパーファイン」、「圧縮率3」にしているのは、スキャン速度やファイルサイズなど、トータル的に考えてこれがいいと思っているから。

このときの保存ファイルは、いま持っている「道具の性能」やその時の「自分の考え方」から導き出された、紙の本がデジタル化される時点での最も良い状態と言えます。

このことは、スキャンした時の画質がきれいかどうかという話ではありません。
見た目の画質がきれでなくても、今できる最高のスキャン状態です。

今やっている”画質補正の方法”は最善とは確信はできなくても、”読み込んだ時の状態”は最善のはずです。

手間と時間をかけられるなら、見た目もOCR精度も、後から良くすることは可能です。

●技術は進歩するので、その時の最善で考えるしかない

スキャナーの性能、OCRの精度など、これからもどんどん良くなっていくでしょう。
でも、自分が持っている道具の性能が、今生み出せる最高の品質です。

最高画質の設定で保存していなくても、自分がトータル的に判断した最善のファイルです。

そもそも、OCRの精度に完璧を求めてはいけません。
昔よりかなり精度は高くなって検索に役立つレベルですが、まだまだ誤認識は多いです。
これからもOCR精度は高くなっていくでしょうから、もっと良くなってから、その気になればまたやり直せばいい。

技術はどんどん進歩するので、その時の最善で考えるしかないのです。

●スキャン時のファイルを、そのまま別に保存しておく

スキャンした時のオリジナルファイルは、その時最高のスキャン状態。
このファイルからスタートできるようにしておけば後からいろいろな画質補正やファイル変換ができます。

あなたの決めた最善の状態で保存したファイルを、
スキャンした時のまま別に保存しておく

画質補正する前の状態のまま、とっておくのです。

これを読書用に加工したものとは別に、
オリジナル用のフォルダ」をつくって別保存しておく。

そうすれば、OCR精度がもっと良くなったときに加工し直せますし、今後、画質補正のもっといい方法が見つかれば最初からやり直しができます。

●まとめ

ScanSnap保存の基本としては、
●マンガ(OCR処理の必要がないもの)
・・・とりあえず、jpgで保存(1ページ=1ファイル)
●小説など、文字中心の本(OCR処理があったほうがいいもの)
・・・とりあえず、pdfで保存(全ページ=1ファイル)
これに統一して保存すると決める
このオリジナルは、専用フォルダをつくって別に保存しておく(加工しないファイル)
読書用には、加工(画質補正やファイル変換)したものを使う
いつかもっといい方法が見つかったら、オリジナルを加工し直す

こんな考えもできますが、いかがでしょうか。

そもそも自炊の目的はより快適な読書のためだったはず。
いつかのためにオリジナルを別保存しておいて、「読書を楽しむこと」に戻りましょうか。