人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

プログラムからPDFを操作する為の優れたライブラリを教えてください。

やりたい事は、
「ScanSnap S1500で紙の書籍をスーパーファインモード(600dpi)でPDF化しOCRをかけたPDFをiPadで読みたいのだが、データサイズが大きい&解像度が大きいのでiPadで快適に閲覧できない。なので、データサイズを落とし解像度を減らしたい。今のところAcrobat9 StandardでClear Scanで落とす方法でやっているが、GUIとかめんどいので、プログラムからやりたい」
です。

要件になおすと、
* 画像をOCR化して透明テキストが埋め込まれているPDFの全ページの解像度を減らす(その際OCRしたテキストも保持したい)
* 無料且つオープンソース(もし無理なら有料でも)
です。

無理なら、
* PDFの全ページを複数枚の画像に変換する
* 複数枚の画像を単一のPDFに変換する
でもいいです。

↓は見ました。C/C++の優れたライブラリがあってもよさそうな気がしているのですが。。。
# Apache PDFBox
# iText

●質問者: kunitz
●カテゴリ:コンピュータ インターネット
✍キーワード:Apache C/C++ GUI iPad iText
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● heke2mee
●60ポイント

優れているかどうか分かりませんがMicrosoft Officeをお持ちでしたら

OCRが付いているようなので、このような方法もあるようです。

http://tmp.junkbox.info/e48.html

ただ日本語が読めるかまでは不明です。



日本語を認識できるオープンソースのOCRライブラリのNHocrを使ったOCRサーバです。

日本語文字認識 - beta

http://appsv.ocrgrid.org/nhocr/index-j.html

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ