人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

電子書籍自炊のためのOCR、TWAIN未対応でも大丈夫?

TWAIN未対応の機種でスキャンしてから、それにバンドルされていないOCRソフトで改めて文字認識させるのは、どんな手間・損なことがあるでしょうか?

自炊のためにスナップスキャンの購入を考えています。ただ、どうしてもひっかかるのが「TWAIN未対応」です。

用途としては、ペーパーバックをOCRしてキンドル文書にするつもりです。将来はフランス語、その他マイナー言語の取り込みも考えているので、多くのOCRソフトを試すことになるはずです。ですからTWAINには対応していてほしいのです

が、対抗機種のキャノン製品はTWAINには対応しているものの、発売されてから時間もたち、スナップスキャンの流行りぶりから、こちらも決断しきれません。

ですから、スナップスキャンで取り込んで、あらためて処理しなおすのが大した手間でないなら、スナップスキャンでと考えています。

よろしく御教示ください>

●質問者: crocodile00
●カテゴリ:コンピュータ 書籍・音楽・映画
✍キーワード:OCR あらた キャノン キャン キンドル
○ 状態 :終了
└ 回答数 : 4/4件

▽最新の回答へ

1 ● a-kuma3
●40ポイント

「スナップスキャン」って、scansnap のことで良いですよね?


scansnap のセールスポイントは、別のソフトウェアに頼らず、そのスキャナと付属ソフトだけで、紙の電子化ができるところにあります。

あまり知らない人でも、コピー機の感覚で PDF を作ってくれることと、

連続でスキャンする仕様に特化していることが、メリットなのだと思います。


自信の表れでしょうか、TWAIN には頑固に対応しません。


しかも、SDK (開発キット) が有料なので、なかなかサードパーティ品も出てきません。

数年前に対応を依頼され調べたときには、100万からしたのですが、

最近のでは、20万くらいまで下げているよう(↓)です。

http://www.pfu.fujitsu.com/news/2011/new110207.html


後、数年経てば、TWAIN にも対応するかな?


あ、肝心の↓に言及して無かった (^^;

TWAIN未対応の機種でスキャンしてから、それにバンドルされていないOCRソフトで改めて文字認識させるのは、どんな手間・損なことがあるでしょうか?

対抗馬のスキャナが何か分かりませんが、scansnap のある程度上位の機種では、紙をフィーダーで給紙できます。

連続で処理できるので、例えれば、FAX を送る感覚で PDF ができあがります。

scansnap の精度に満足できるなら、そこから先にチマチマ作業するのが、けっこう手間に感じられるかも。


あくまでも、私見ですが、精度が特別良い、という感じはしません。

なので、気にするとしたら「フランス語など...」というところでしょうか?


参考になれば。


2 ● isogava
●0ポイント

スナップスキャン→スキャンスナップですね?

スキャンスナップの利点は大量高速スキャンですから、スキャンする手間・時間のストレスはかなり軽減されると思います。

TWAINに非対応でも、ある程度は連携できるソフトがあるようです。

http://scansnap.fujitsu.com/jp/solution/index.html#software

自炊の仕方にもよりますが、スキャンした画像をOCRで直接テキスト文書にするのであればOCRソフトからのTWAINは便利ですが、PDFで閲覧するのであれば、高速・高圧縮のスキャンスナップはお薦めです。

(私はCanonの複合機でスキャン&PDF化していますが結構時間がかかるのでストレスがたまります)

おそらくスキャンスナップの方が他のスキャナで読み込むより時間が早いので、読み込んだ後にOCRソフトを立ち上げてからテキスト変換しても、結果的には処理が早く終るかもしれませn。

原稿をスキャンする時間・手間と、OCRソフトで変換する時間・手間をてんびんにかけて検討してみてはいかがでしょうか。


3 ● どたん
●10ポイント

「スナップスキャン」というのは ScanSnap のことですよね?


私は ScanSnap S1500を使って自炊していますが、TWAIN非対応は全く問題ありません。

ScanSnap S1500にはAcrobat Standardがバンドルされているので、スキャンしてから直接PDFを作成できます。日本語OCRはAcrobatの機能で十分です。


Photoshopのように、TWAIN経由でないとスキャン画像を取り込めないようなアプリの場合はTWAIN対応が便利ですが、ScanSnapのように自分自身がアプリを制御できる場合はTWAINは必須でないと思います。


4 ● isogava
●50ポイント ベストアンサー

PCにの操作が苦手な方にとってはTWAIN対応の方が無難ですが、慣れてしまえば別々に操作するのはたいした手間ではないので、TWAIN非対応はデメリットと感じる必要はないと思います。

Kindle用ならモノクロスキャンなのでCanonの方が早いですが、カラーならScanSnapの方が早いですね。

遅い方が紙詰まりしにくく画質も確保できやすい面もあるのでなかなか判断しづらいです。

英語中心であれば、どちらもAcrobatが同梱されているのでそれでOCRは問題ないでしょう。

フランス語、さらにはパーリ語に対応したOCRソフトがPDFのからのOCR化に対応しているか、画像ファイルからの取り込みしか対応していないか、そちらの方を優先して考える必要があると思います。

ScanSnapは触ったこともあるので無難かつ間違いない選択と思いますが、自宅ではCanonのMX870でそこそこ使えているので、Canonも十分使えると思いますし。

機種の問題ではなく、値段との兼ね合いとOCRソフトとの組み合わせになるでしょうか。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ