hyperestraierにてPDFの検索を行っているのですが、PDFの何ページ目にヒットしたかを知る方法を教えて下さい。

PDFのTEXT化は、pdftotextを使っております。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2009/10/19 20:58:26
  • 終了:2009/10/26 21:00:03

回答(1件)

id:q0123 No.1

我意亜回答回数9ベストアンサー獲得回数22009/10/20 14:40:43

ポイント60pt

http://hyperestraier.sourceforge.net/index.ja.html

pdfからテキスト化した時に頁数の情報が失われてしまうので難しいと思います。

プログラムを書く必要がありますが、以下の様な実装でいかがでしょうか。

1.テキスト化した時に頁毎のテキストファイルに分割する

2.ファイル名には元PDFファイルと頁数が判断できる様なネーミングルールをする

3.分割テキストファイルをhyperestraierに登録する

4.検索したときにヒットしたファイル名から元のPDFファイルと頁数の情報を取得する

以上

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません