人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

hyperestraierにてPDFの検索を行っているのですが、PDFの何ページ目にヒットしたかを知る方法を教えて下さい。
PDFのTEXT化は、pdftotextを使っております。

●質問者: kunitz
●カテゴリ:コンピュータ インターネット
✍キーワード:PDF 検索
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● 我意亜
●60ポイント

http://hyperestraier.sourceforge.net/index.ja.html

pdfからテキスト化した時に頁数の情報が失われてしまうので難しいと思います。

プログラムを書く必要がありますが、以下の様な実装でいかがでしょうか。

1.テキスト化した時に頁毎のテキストファイルに分割する

2.ファイル名には元PDFファイルと頁数が判断できる様なネーミングルールをする

3.分割テキストファイルをhyperestraierに登録する

4.検索したときにヒットしたファイル名から元のPDFファイルと頁数の情報を取得する

以上

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ