書籍のデジタル化

本がとにかく多い!今年2月の引っ越しで思い知りました。本は実物を持っておくのが好きなのであまり気が進みませんでしたが、一部の本だけデジタル化することには管理コストの面でメリットを感じ、トライしてみることにしました。はじめはキンコーズでちょこちょこやっていましたが、自宅にも環境を作りたかったのでスキャナを購入。ここに備忘録を残そうと思います。

スキャナー

ベストセラー、PFU製のScanSnap iX500を購入。安くはないですが、噂通り性能・品質はいいです。特に重送検知は検出率が100%で、本を処分してから抜けに気付くなどといったことがありません。超音波センサーが表裏2個付いているというオーバースペックっぷりも納得。

富士通 ScanSnap iX500 (A4/両面)
富士通 (2015-02-06)
売り上げランキング: 516

読み取り設定はそれぞれ以下。

  • 圧縮率は「3」。
  • 「検索可能なPDF」は使用しない。付属で付いてくるNuance製Power PDF Standardという有料ソフトの方が日本語OCRの検出精度が高いため、読み取り後にOCRをかけます。
  • 「裏写り軽減」は使用しない。薄い紙をスキャンする時に裏地が透けるのを防げるが、カラーやグレーで本来見える色が消えるという症状が発生するため。
  • ファイル形式はPDF。後でjpegにも変換できるため。

小説(白黒部)

カラー書籍

画像ありモノクロ書籍(漫画含)

ファイル形式は全て共通して以下の設定。

解像度の違いでどのくらい絵が変わるのかについてはScanSnap iX500で自炊!小説スキャンで画質・速度・サイズを比較で紹介されていました。また、圧縮率や裏写り軽減の有無でどのくらい絵が変わるのかについては漫画自炊時のScanSnap iX500の設定と効果確認紹介されていました。

読み取る画像の色合いを濃くする方法

白黒読み取り設定では「白黒読み取りの濃度」スライドバーで11段階の調整が可能。カラー/グレースケール読み取り設定では「文字をくっきりします」にチェックを付けて読み取る。これ、やってみましたが色味に違和感が出るので読み取った画像にガンマ補正かけた方が良いと思います。

スキャン手順
  1. 全ての書籍の中身をスキャンする。
    →表示と中身の読み取り設定が異なる場合、また一部カラー書籍などは複数回に分けて実施。
  2. 読み取り設定を分けて実施した場合はマージする。
  3. スキャンしたPDFに名前を付ける。
  4. 全ての書籍のカバーを「設定:カラー書籍」で読み取る。
  5. カバーを回転する(Power PDF:タブバーの上のメニューアイコンからファイルを開くと早い)。
  6. 名前を付けたPDFにカバーをマージする(Power PDF:場所>前、ページ>最初のページ)。
  7. 全てのPDFにPower PDFでOCRをかける(Power PDF:処理>検索可能なPDFの作成)。

尚、カラーページ込みの小説や書籍を読み取る場合、カラーページをカラー設定・それ以外を白黒設定で読み取っています。自動判別にすると日に焼けた白黒ページがカラーと判別され、色味が変わってしまうためです。

OCR設定

Power PDFの設定は以下です。OCRの検出精度についてはMacでScanSnap:今更ながらに自炊してみたで紹介されていました(Win版も同じかなと思います)。安価なソフトではOCR時に多少の画質劣化があるようですが、Power PDFでは設定の「元のイメージを保持」を有効にすることでソース画像がそのまま保持されます。この機能、かなり重要なのでOCRソフトを選ぶ際には気を付けたいところ。Power PDFでは圧縮 or 非圧縮(イメージの保持)の2通りだけですが、例えばAdobe Acrobatのスキャンした文書内のテキストの認識を読むと、圧縮非圧縮に加えて低解像度のフォントの合成などでファイルサイズを落とすといったことができるようです。場合によってはメリットがあるでしょうが、自分は書籍そのものの状態をデジタル化したいので、無料ソフトなどでこういったことが勝手にやられていたら困ります。尚、OCR処理はホーム>検索可能なPDFの作成から実行できます。

ScanSnap iX500 お手入れ情報に手入れ方法と消耗品交換方法の詳細が記載されていました。以下に簡単にメモ。清掃には無水アルコールとキムワイプ、綿棒を使用しています。

  • 使用後は毎回コンタクトガラスを清掃。特に断裁した紙をスキャンする場合は紙粉が大量に付着するため要手入れ。
  • 読み取り枚数1,000枚を目安としてブレーキローラー、ピックローラー、超音波センサー、プラスチックローラー、フィードローラー/排出ローラー、ガラスの順番で清掃。

消耗品はピックローラーとブレーキローラー(型番:FI-CX50R)。それぞれ20万枚通紙するとすり減るらしいので、長く使うなら予備を持っておくと良いかもしれません。読み取り枚数はSアイコンを右クリック>消耗品の管理から確認可能。

FUJITSU ローラーセット(iX500用) FI-CX50R
富士通 (2012-11-30)
売り上げランキング: 14,539

断裁機

断裁はキンコーズでやっていましたが、1cmあたり100円とそこそこ値が張るのでレンタルして自宅で断裁することにしました(自宅に置いておくのは少し抵抗があります)。レンタル業者と断裁機は2017′ 自炊用裁断機・スキャナの格安レンタル会社の比較を参考に、DMM.いろいろレンタルでPK-513Lを借りることにしました。

レンタル手続き

DMM.いろいろレンタルのプラス 裁断機 裁断幅A4 PK-513Lのページから使用したい日時を選択。

バスケットへ登録。

住所情報等の記入となった。レンタル期間は2日間としたが、これは「裁断機の到着日」と「裁断機を返す日」も含めてカウントする点に注意。つまり「裁断機を返す日」は17時までに配送業者に渡さないといけない。返却時の発送方法はいろいろレンタル商品はどのように返却すればよいですか?によると佐川急便への電話依頼でいいようだ。日曜日は集荷受付の終了時間が早いため、午前中が前日には連絡しておきたいところ。

断裁

断裁方法は電子書籍化しまくって辿り着いた、効率の良い自炊方法まとめ。Scansnap ix500を手に入れてから1年間自炊を続けて得たKnow-howを参考にしました。レンタル品は相当年季が入ってそうでしたが、切れ味は抜群で驚き。ただ挿入口の厚みに制限があるため、以下のような分厚い書籍はカッターで分解してから断裁します。

こんな感じ。

結局、30分ほどで70冊断裁できました。

ちなみに文庫本断裁時の上下目盛りはこちら。