kakunoshin回答ポイント 100pt

ウォッチ

PDFファイルをテキスト形式にする方法ありませんか？

アドビのAcrobat.com.com利用しましたが、誤字脱字だらけで使い物になりませんでした。
実際にやっておられる方の方法が知りたいです。

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ログインして回答する

ベストアンサー

SPX9002013/04/09 17:21:55
満足28pt

元がOCRだったら、そのPDFの埋め込みテキストがすでに違っている（認識率が低い）ことになりますね。であれば、もっと認識率が高いOCRソフトでもう一度認識からやり直すしかないのでは？もっとも、プリンタに付属するOCRソフトはそんな極端にひどいものではないはず（たいていは90%中盤から後半）なので、体験版がそれに勝るとは考えにくいですが。ぶっちゃけ認識率が60%なんてクソだと言えます。冷静に考えてください。60%というと、100文字認識させたら正解が60文字そこそこしかないってことですよ？40文字近くも間違ってる。ボロボロじゃないですか。

もし今の埋め込みテキストがそんなにひどいなら、元文書を作ったところにやり直しを依頼した方が良さそうな予感がします。元文書の画質が低いと、どんなOCRを使っても認識率は上がりませんので、もっと解像度を上げたらどうだろうと言うのが真っ先に思いつく点です。が、元文書がすでに汚い（ファクスで流れてきたものだったり、何世代コピーされたか解らないもの）では、おそらく何をやっても無駄な抵抗に終わりそうですが。

スター
- 1件のコメントを見る
- kakunoshin 2013/04/09 20:55:16
  
  はい。頼んでみます。
  
  スター

その他の回答

ラフティング2013/04/09 01:01:38
満足18pt

基本的に元文書次第のところがあると思います。（画像化されていたり、段組上の問題があったり、暗号化されていたり、、、と。）

当方は分量が少なければ、コピー＆ペーストでテキストエディタに貼り付けています。（量が多ければ、フリーソフトから適当なものを選んで使用。）

スター
- 1件のコメントを見る
- kakunoshin 2013/04/09 01:17:49
  
  メモ帳にコピペしても文字化けします。
  フリーソフトもいくつか試しましたがうまくいきませんでした。
  
  スター

kakunoshin
2013/04/09 02:04:34

http://q.hatena.ne.jp/1115015484

ここで紹介されている方法では出来ませんでした。

Baku77702013/04/09 05:28:38
満足18pt

コピペして誤字脱字があるって、どうやってＰＤＦにしたのか理解に苦しみますが。普通なら、透明テキストですから、誤字なんてありえませんからね。

私ならＰＤＦを作成した元のファイルを寄越せとか、ＰＤＦ作成環境を調べるところから始めます。ＯＣＲも原稿や書かれている内容によって最適なソフトは違いますかし、そのようなファイルなら、ＯＣＲソフトそのものの機能で一度別形式に変換してから作業します。

>フリーソフトもいくつか試しましたがうまくいきませんでした。

ここの意味がわからないのですが、ＯＣＲならフリーソフトの認識率なんて８０％を超えるはずはありませんし、ＰＤＦをダイレクトに加工するのなら純正Acrobatで作成されたＰＤＦの限られたバージョンまでと覚悟してください。

スター

1件のコメントを見る
kakunoshin 2013/04/09 07:06:04

紙媒体を　EPSON PX-504A を使用してダイレクトにPDFにしたそうです。
OCRソフト（e.Typist v.14.0 体験版）で識字率60％程度で、これが一番精度高かったので、とりあえず、これで作業することにしました。

（引き続き情報募集します）

スター

videosoft1232013/04/09 18:03:47
満足18pt

変換ソフトを利用すると、簡単になります。
例えば、使ったことがある4Videosoft PDF Text 変換。

スター

1件のコメントを見る
kakunoshin 2013/04/10 14:19:34

そのソフトでも文字化けしました。

スター

adlib2013/04/10 09:56:50
満足18pt

　
　チェック・ポイント
　
１．つぎのサイトを開いてから、メーカー・サポートに電話しましょう。
　0120-938-008（EPSON ビジネスインクジェット PX-504A）
http://www.epson.jp/products/biz/px504a/spec.htm
　
２．添付ソフトを使って、誤字脱字だらけになることはありません。
（原稿の上下左右が、水平・垂直に置かれているか、確認しましょう）
　この商品で、テキスト形式を得るには、他のソフトは必要ありません。
　
３．下記ソフトが、正常にインストールされているか、確認しましょう。
　OCR；読んde!!ココパーソナル 4.08 Windows 8 32bit版（20121011）
　PDF作成モジュール OCRコンポーネント 1.33 Windows XP（20130131）
http://www.epson.jp/dl_soft/list/4731.htm
　

スター

1件のコメントを見る
kakunoshin 2013/04/10 15:13:18

PDFファイルの元ファイルは昔、FAXで送られてきたものをスキャンしてPDFにしたそうです。
メーカーでは、そういうファイルは認識率悪くなるとのことでした。
あきらめます。
ありがとうございました。

スター

その他の回答を読む

この質問へのコメント

コメントはありません

この質問への反応（ブックマークコメント）

質問の情報

登録日時: 2013-04-09 00:45:45
終了日時: 2013-04-10 15:14:26
回答条件: 1人5回まで

この質問のカテゴリ

コンピュータ

PDFファイルをテキスト形式にする方法ありませんか？

ベストアンサー

SPX9002013/04/09 17:21:55
満足28pt

kakunoshin 2013/04/09 20:55:16

その他の回答

ラフティング2013/04/09 01:01:38
満足18pt

kakunoshin 2013/04/09 01:17:49

kakunoshin
2013/04/09 02:04:34

Baku77702013/04/09 05:28:38
満足18pt

kakunoshin 2013/04/09 07:06:04

videosoft1232013/04/09 18:03:47
満足18pt

kakunoshin 2013/04/10 14:19:34

adlib2013/04/10 09:56:50
満足18pt

kakunoshin 2013/04/10 15:13:18

この質問へのコメント

この質問への反応（ブックマークコメント）

質問の情報

この質問のカテゴリ

この質問に含まれるキーワード

人気の質問

メニュー

PC版

PDFファイルをテキスト形式にする方法ありませんか？

ベストアンサー

SPX9002013/04/09 17:21:55 満足28pt

kakunoshin 2013/04/09 20:55:16

その他の回答

ラフティング2013/04/09 01:01:38 満足18pt

kakunoshin 2013/04/09 01:17:49

kakunoshin 2013/04/09 02:04:34

Baku77702013/04/09 05:28:38 満足18pt

kakunoshin 2013/04/09 07:06:04

videosoft1232013/04/09 18:03:47 満足18pt

kakunoshin 2013/04/10 14:19:34

adlib2013/04/10 09:56:50 満足18pt

kakunoshin 2013/04/10 15:13:18

この質問へのコメント

この質問への反応（ブックマークコメント）

質問の情報

この質問のカテゴリ

この質問に含まれるキーワード

人気の質問

メニュー

PC版

SPX9002013/04/09 17:21:55
満足28pt

ラフティング2013/04/09 01:01:38
満足18pt

kakunoshin
2013/04/09 02:04:34

Baku77702013/04/09 05:28:38
満足18pt

videosoft1232013/04/09 18:03:47
満足18pt

adlib2013/04/10 09:56:50
満足18pt