kunitz回答ポイント 60ptウォッチ 4

プログラムからPDFを操作する為の優れたライブラリを教えてください。


やりたい事は、
「ScanSnap S1500で紙の書籍をスーパーファインモード(600dpi)でPDF化しOCRをかけたPDFをiPadで読みたいのだが、データサイズが大きい&解像度が大きいのでiPadで快適に閲覧できない。なので、データサイズを落とし解像度を減らしたい。今のところAcrobat9 StandardでClear Scanで落とす方法でやっているが、GUIとかめんどいので、プログラムからやりたい」
です。

要件になおすと、
* 画像をOCR化して透明テキストが埋め込まれているPDFの全ページの解像度を減らす(その際OCRしたテキストも保持したい)
* 無料且つオープンソース(もし無理なら有料でも)
です。

無理なら、
* PDFの全ページを複数枚の画像に変換する
* 複数枚の画像を単一のPDFに変換する
でもいいです。

↓は見ました。C/C++の優れたライブラリがあってもよさそうな気がしているのですが。。。
# Apache PDFBox
# iText

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。
ログインして回答する

みんなの回答

この質問へのコメント

コメントはありません

この質問への反応(ブックマークコメント)

質問の情報

登録日時
2010-07-31 17:23:16
終了日時
2010-08-07 17:25:03
回答条件
回答にURL必須 1人2回まで

この質問のカテゴリ

この質問に含まれるキーワード

C/C++63ScanSnap26Apache1359オープンソース618GUI354iPad691OCR117PDF1176ライブラリ985プログラム5048

人気の質問

メニュー

PC版