dpiとOCR設定時のファイルサイズの違い
スキャンする際の設定にdpiの設定とOCRの設定があります。
dpiは、より大きな数字であれば、より綺麗にスキャンすることができる設定となっています。
ただし、大きければ大きいほど、ファイルサイズも大きくなり、日頃画像を閲覧するときに時間がかかってしまいます。
OCRはPDFファイルのときのみの設定ですが、スキャンする際に文字の情報を読み取り、検索で引っかかるようにすることができる機能です。
これらの設定をした時としない時とでのファイルサイズの違いを紹介します。
どれくらいのdpiが適しているのか
dpiの設定ですが、先に説明したように、綺麗になればなるほどファイルサイズが大きくなり、扱いにくくなります。
ですが、ファイルサイズを小さくするために設定を落としていくと、今度は文字が読みにくくなるなどの問題も発生します。
基本的な考えとしては、漫画の場合は600dpiを、カラーの場合は400dpi辺りを一つの目安とします。これは、漫画を電子ファイルで入稿し、印刷してもらう時に、このような設定で作るという話から来ています。
漫画の場合はスクリーントーンという細かい点々がありますが、これを綺麗にスキャンするには600dpi必要というわけです。逆にカラーの場合は若干落としても問題ありません。
文字情報中心の本の場合は300dpiや240dpiなどでも十分です。これより下の数字になると、やはり読みにくさが出てきますので、一つの目安として300dpiを基準にするとよいでしょう。
以上のことから、カラーも含む漫画なら600dpi、文書系であれば300dpiとしてスキャン設定をしておくと、複雑にならずにスキャンを進めやすいと思われます。
dpiの違いによるファイルサイズの差
dpiの違いによるファイルサイズは下記のように差がでます。
スキャンに使用したものは、イラストが描かれていた文庫サイズの本の1ページ分となります。jpgファイルにて検証しました。
jpgファイルの場合は「24ビットカラー」か「256階調グレー」しか選べないため、この2種での検証となります。
設定の変更場所は「モード」の項目となります。
24ビットカラー
- 600dpi:2380kb
- 400dpi:1191kb
- 300dpi:698dpi
256階調グレー
- 600dpi:2263kb
- 400dpi:1094kb
- 300dpi:654dpi
以上のように、dpiの変更によってファイルサイズが大幅に変わることが分かると思います。また、「24ビットカラー」より「256階調グレー」の方がファイルサイズが小さいこともわかります。
このあたりは、本によって設定が異なるかと思いますので、どちらが適しているかは一概には言えません。ファイルサイズを気にすることなくスキャンしたい人は、基本「24ビットカラー」でスキャンしましょう。
OCRの有無によるファイルサイズの違い
PDFファイルでは、スキャンするときに文字を読み取り、後ほど文字検索ができるように設定することも可能です。これをOCR情報といいます。
これを設定するかしないかでのファイルサイズの違いを取り上げます。
条件は300dpiでpdfファイルとして出力しています。
- OCR情報有り:276kb
- OCR情報無し:253kb
以上のようにファイルサイズに違いが発生します。
漫画など、文字情報を検索することがなさそうな物の場合はOCR情報を無しに、一方、参考文献など、もっ情報を検索して目的のページを見つけたい場合はOCR情報を有りに設定するとよいでしょう。
なお、OCR情報を正確に付けるためには、スキャンする方向を正しい方向にしてスキャンする必要があります。
文字情報はスキャンするときに読み取られるため、このページを差し込む方向が間違っていると、正確に読み取ってはくれません。この点を注意する必要があります。