2010年6月19日土曜日

好きな本を電子化してiPadで読みたい(2) BOOKSCANのレビュー

先日BOOKSCANに送った本が無事スキャンを終了し、ダウンロード可能になりました。ということでBOOKSCANサービスをレビューしてみます。

BOOKSCANへの発送からダウンロードまで

今回BOOKSCANのプレミアム会員サービスを利用しています。プレミアム会員は書籍到着から少なくとも1週間以内にスキャンを終えることをうたっていますので、発送からスキャン完了までの経緯を追跡してみました。

まず宅急便を使って3冊の本を発送したのが6月12日、翌日ヤマト運輸からBOOKSCANへの配達完了メールが届いています。

クロネコヤマトより、
ブックスキャンセンターNo.3239   様宛の
お荷物の配達を完了いたしました。

■お届け完了日時
06/13 (日) 14時24分
■伝票番号
XXXXXXXXXXXXXXX
13日は日曜日のため、少なくとも月曜日から着手になると思われますが、実際に着手したのは16日のようです。ただし着手すると集中してやるようで、16日のうちにPDF化完了のメールが届いています。

BOOKSCAN(ブックスキャン)です。

ご依頼頂きました、書籍のPDF化が完了致しました。
下記のページから、PDFファイルのダウンロードを行うことが出来ます。

http://system.bookscan.co.jp/history.php

BOOKSCANは作業の内容をメンバ向けにリアルタイムに公開しており、参考のためその内容もアップしておきます。着手から約2時間40分で完了しています。


BOOKSCANの作業履歴

PDF化後、BOOKSCANのマイページ→「依頼したもの一覧」ページ→書籍に移ると以下のようにスキャンしたPDFをダウンロードできます。

BOOKSCANの書籍一覧画面

PDFのサイズ

今回お願いした3冊のPDFサイズ(OCR処理済)は
  • 7つの習慣 25.2MB/535ページ = 47KB/ページ
  • なぜか日本人が知らなかった新しい株の本 16.9MB/202ページ = 84KB/ページ
  • ヤバい経済学 23.5MB/337ページ = 70KB/ページ
になりました。本によって、ページあたりのサイズがばらばらなのが面白いですね。仮に「なぜか~」と同じぐらいのサイズ/ページで、ページ数が500ページクラスの本があれば、PDFのサイズが40MBを超えてきます。ただ、サイズとしてはたった40MBなので、iPadのディスクが無くなる心配はないかもしれません。

PDFの品質

以下いくつかの点についてレビューしてみます。一般的に、書き込みや汚れがないページは(おそらくスキャン後の画像処理で)かなり綺麗にスキャンされています。ほとんどのページは綺麗にスキャンされているようです。

ただ、ページのカラーを自動判別するモードを利用しているようで、書き込みや汚れによって二色以上と自動判別されると本来白黒のページでもカラーモードでスキャンされてしまいます。これにより例えば以下のようなスキャン品質の違いが現れます。



左がカラーモード、右が白黒モードでスキャンされたと思われる

また、スキャンの後処理で「文書の向きの自動補正」をしているようですが、これによりまれに文書の向きが間違ってしまうことがあるようです。まれにといいましたが、「なぜか~」には全文にわたってこの斜めのヘッダが入っており、かなりの確率で文書の向きを間違ってしまっています(涙



ヘッダの向きに引きずられて文書方向を誤った例



プレミアム会員のスキャンでは、デフォルトでOCR処理がされます。ちゃんとOCR処理されているか、確認してみます。では先程の斜めになってしまったページに含まれる「ギャンブル」という語を検索してみます。



斜めのページの「ギャンブル」は左下以外は全滅

斜めになったからといってOCRが全滅することは無いようですが、抜けている部分もかなりあるようです。したがって、キーワードによる検索に全面的に頼るということはできないと思います。

OCRに関しては自分でも後からできますので、不満があればいろいろやってみるというのも手かと思います。

BOOKSCANの利益を推定してみる

作業履歴から、BOOKSCANの利益構造を推定してみます。

履歴から3冊の裁断作業に40分程度かかっていることが分かります。スキャンも約40分。OCRも約40分です。ということは、スループットが4.5冊/h。スキャンやOCRのランニングコストを0と仮定すると、1冊250円の収入であれば時間当たりの売上1125円。

裁断作業に一人当たるとすれば、少なくとも人件費は1125円より安くなければなりません。東京ですと最低賃金は791円(2009年10月時点の地域別最低賃金)ですから、1125-791=334円/hになります。

ここからさらにスキャナやOCRのランニングコストが引かれます。仮にランニングコストが30円程度(機材消耗分も含む)とすると300円/hになります。1日12時間稼働しているとすると、3600円/日。これが端末の分だけ発生しますから、端末100台でやれば36万円/日です。あとはここから固定費(賃料、固定資産税、サーバ運用コストその他)を引けば営業利益になります。

もしかして結構おいしいビジネスかも?しれません。もし上記のような利益を出せるのであれば、あっという間に初期投資を回収できるでしょう。

もちろん人件費はもっと払っているかもしれませんし、初期投資も意外と大きいのかもしれません。その他の不明なコストも多くてなんとも言えませんが...

法的な問題もありますが、こういうビジネスはもっとやればいいと思います。というかそもそもは、紙資源の無駄でもあるので、出版社が率先して電子書籍を販売してほしいと思います。


1 コメント:

bookscan さんのコメント...

ブックスキャンです。

弊社のことなので大変興味深く
利益構造拝見させて頂きました。

せっかくなので私たちも計算してみました。

仮に100台あって1人4台のマシンを見たとして
人件費だけで、100台÷4台×時給900円(仮)×12時間すると、1日あたり270,000円の人件費になります。

1台あたり4.5冊毎時処理できると仮定されていますが、
これは全くエラーや詰まりがないと仮定しても、そんなに処理できません。
冊数が少なく、注文数も少ない場合には、このロジックで行けるかもしれません。

仮に100台で、毎時4.5冊づつ処理して12時間処理したら5,400冊も出来る計算です。
おそらく実際には、効率よくやって1/5。普通にやったら1/10程度の処理の能力が妥当なのではないかと思います。

仮にかなり効率良く出来て1日1,080冊処理出来て
なおかつ、うまくいって全オプションありで1冊250円の売上なら、
1080冊×250円で売上270,000円/日となります。

これに、地代家賃と管理部門の人件費などを入れると、
その時点で、赤字になってしまいます。

100台スキャナー・マシンを調達したと仮定し
OCRに耐えうるマシンやスキャナー、机・モニターなど調達すると、初期費用で
1セットあたり安くても15万程度はかかるものと思います。
そうなると1500万の初期費用を回収することが困難になります。

書いていて、自分で悲しくなりましたが
もっと良い方法があれば、是非教えて頂けるとありがたいです。

コメントを投稿