▽1
●
うっち? ●50ポイント ベストアンサー |
javaでプログラミングできますか?
できるなら以下のサイトの方法で割りと簡単に解決できそうです。
以下の2つの処理を書いて、全ファイルに対して実行すればできそうです。
?以下のサイトを参考にPDFからテキストを抽出する
?抽出した文「字が空かどうか」などの判定文を入れて判定結果を出力
<参考サイト>
http://u-kari.blogspot.jp/2008/02/pdf.html
以下のツールを使うとPDF→Text変換可能です。バッチ化して一括変換してからエクスプローラで選別するのが早そうな気がします。
■ xdoc2txt ? PDF,WORD,EXCEL,一太郎などの各種バイナリ文書からテキストを抽出
http://ebstudio.info/home/xdoc2txt.html
<使い方> xdoc2txt.exe -f 出力ファイル名.txt 入力ファイル名.pdf
あと、COM形式のライブラリも付属しているので、VBScript を用いたプログラミングも可能です。
Dim xdoc2txt Set xdoc2txt = CreateObject("xd2txcom.Xdoc2txt.1") Dim strText strText = xdoc2txt.ExtractText("入力ファイル.pdf",False) WScript.Echo strText