編集不可のPDFファイルから本文をコピーする方法を教えてください。目的は英語の論文に翻訳ソフトを使用したいのです。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2005/05/02 15:31:24
  • 終了:--

回答(11件)

id:LSR No.1

LSR回答回数124ベストアンサー獲得回数02005/05/02 15:42:05

ポイント15pt

http://sasapanda.com/toshi/archives/200405/07_0255-764.php

Orbium -そらのたま-:移転しています。

コピー不可や印刷不可のファイルでなければツールバーにある、テキスト選択ツールを選択してから文章をドラッグすればできると思うのですが・・・


もしもコピー不可や印刷不可でしたらこちらに記載されています。著作権に注意しつつご利用ください。

id:kumasuzu

お返事遅れました。LSRさんにお教え頂いたプログラムを試して見たのですが、こちらのソフトがPDFのセキュリティ(暗号化)に対応していないのか、私の力量の未熟によって使用する事ができませんでした。理解できるようもう少し頑張って見ます。ありがとうございました。

2005/05/05 15:28:40
id:chipmunk1984 No.2

chipmunk1984回答回数790ベストアンサー獲得回数72005/05/02 15:44:54

ポイント10pt

http://www.sourcenext.com/products/pdf_todata/?i=top

ソースネクスト・ドットコム/文書作成ソフト/いきなりPDF to Data

こういったソフトを使用してテキストにするしかないのではないでしょうか?

id:kumasuzu

御回答ありがとうございます。残念ながらPDFウインドウの左下に鍵のマーク(暗号化制限)がございますので、使用できないようです。

2005/05/05 15:33:40
id:hiroyukiarita No.3

hiroyukiarita回答回数1792ベストアンサー獲得回数02005/05/02 17:26:46

ポイント10pt

http://www.keiyu.com/doc/pdftxt.htm

PDFのテキスト抽出とHTML変換(KeiYu HelpLab)

Acrobat ReaderとAcrobatの(テキスト選択ツール)、(範囲選択ツール)で、PDF文書中のテキストを選択できます。

PDF文書の指定範囲をドラッグして反転し、[編集]→[コピー]でコピーした後、テキストエディタなどを起動して[編集]→[貼り付け]などで貼り付けると、テキストのみが貼り付けられます。

id:kumasuzu

御回答ありがとうございます。残念ながらPDFウインドウの左下に鍵のマーク(暗号化制限)が表示されています。本来なら制限されたPDFは、頑張って勉強して自力で読まなければならないのですが、私の英語力では、かなりの年数が必要のようです。(T_T)

2005/05/05 15:36:09
id:kommychan No.4

kommychan回答回数136ベストアンサー獲得回数02005/05/02 18:50:04

ポイント10pt

このツールでテキスト化すれば、

翻訳も簡単だと思います

id:kumasuzu

御回答ありがとうございます。こちらのソフトもお教えいただいて挑戦した見たのですが、残念ながらPDFウインドウの左下に鍵のマーク(暗号化制限)がございますので、こちらのソフトも使用できないようです。

2005/05/05 15:38:42
id:tiptop No.5

tiptop回答回数66ベストアンサー獲得回数02005/05/03 00:41:01

ポイント10pt

http://pac.mediadrive.jp/pocr/

MediaDrive:やさしくPDF OCR v.2.0

要は、PDFを「画像」としてOCRに読み込み、テキスト化します。

画像の読み込みとしてPDFに対応しているOCRソフトならリンクのもの以外でも出来るはずです。

ただし、元のPDFの解像度が低いと誤字が増える可能性が高いです。

id:kumasuzu

御回答ありがとうございます。

読んでココ見ないな物でしょうか?以前使用した事があったのですが、tiptop様が仰られているように誤字が多かった気が致しました。

翻訳したいPDFもA4版数十枚にびっしりと英文が記載されています。誤字のチェックも不可能に近そうです。(T_T)

2005/05/05 15:46:33
id:p_p_p No.6

p_p_p回答回数2ベストアンサー獲得回数02005/05/03 10:47:11

ポイント10pt

URL はダミーです。

スクリーンショットなどでイメージを作ってからOCRにかけるか、面倒ならプリントアウトをスキャナーにかけてOCR->翻訳ソフトという流れではいかがでしょうか。

id:kumasuzu

御回答ありがとうございます。

読んでココ見たいな物ですよね?以前使用した事があったのですが、誤字が多かった気が致しました。最近のソフトはだいぶ改善したのでしょうか?

翻訳したいPDFもA4版数十枚にびっしりと英文が記載されています。誤字のチェックだけでも相当な時間がかかりそうです。(T_T)

2005/05/05 15:52:19
id:uun373 No.7

uun373回答回数6ベストアンサー獲得回数02005/05/04 13:38:28

ポイント10pt

http://blog.sf-dream.com/archives/2005/04/pdf_2.html

セキュリティのかかったPDFファイルからテキストを抽出する方法 : (Dreamのお好み情報箱)

こんにちは.

このサイトに書いてある情報が使えるかもしれません.


それで駄目なら,最悪,Acrobat Readerを最大化して目的のPDFを表示

→スクリーンキャプチャを取り画像に保存

→OCRソフトで読み取る,となると思います.

画像取り出し禁止のPDFからこの方法(最後のOCRは除く)で

画像を取り出したことはあります.

id:kumasuzu

御回答ありがとうございます。xdoc2txt 1.16 の使い方なのですが、どうしてもデスクトップ上のショートカットアイコンのリンク先に-f -nを追加して適用ボタンを押すと、「パス名が無効です。確認してください」とのエラーが出ます。もしお判りになられれば、このソフトの正しい使用方法を分かりやすくお教え戴けないでしょうか?因みにDドライブにProgram Filesを作製してそこで使用しています。よろしくお願い致します。

2005/05/05 17:31:00
id:troubleantenna No.8

troubleantenna回答回数71ベストアンサー獲得回数02005/05/05 05:28:43

ポイント10pt

pdftotextを使えませんか?

id:kumasuzu

御回答ありがとうございます。こちらの方法も、私には内容が難しく理解する事ができませんでした。もしよろしければ、分かりやすく御解説いただけにでしょうか?よろしくお願いいたします。

2005/05/05 17:54:34
id:s34itl No.9

s34itl回答回数117ベストアンサー獲得回数42005/05/05 18:12:02

ポイント35pt

http://www.bravaviewer.jp/reader.htm

Brava! Reader - �����Ŏg����PDF�ATIFF�ACSF�r���[��

このビューアを使えば、編集不可のpdfから、テキストをコピーすることができます。pdfを表示した後、「編集」→「選択」の後、矩形領域を選び、CTRL-Cまたは「編集」→「コピー」により、テキストをコピーします。


私もkazz7さんと同じような目的でいろいろ試したことがあります。


xdoc2txtはdos窓のコマンドラインでないと動かないと思います。それに、少なくとも日本語のpdfでは、空白やタブが無視され、ベタのテキストになってしまいます。


pdf表示→画面コピーは解像度が低く、これまで試した限りでは、ocrでは満足する結果が出ていません。拡大表示すればよいのですが、手間がかかり過ぎて...

id:kumasuzu

s34itl様 御回答ありがとうございます。何度かDLに失敗してしまいまして、時間が懸かってしまいました(^^ゞ

早速試して見ました。完璧です。本当にありがとうございました。この質問に御回答くださいました他の方々にもこの場をお借りしてお礼申し上げます。

2005/05/07 17:09:45
id:kommychan No.10

kommychan回答回数136ベストアンサー獲得回数02005/05/06 02:03:33

ポイント10pt

xdoc2txtの使い方ですが、

コンソールアプリなので

pdfと同じディレクトリにバッチファイル

を置いて実行すれば簡単です

(コマンドプロンプトを立ち上げてもいいけど)

id:uun373 No.11

uun373回答回数6ベストアンサー獲得回数02005/05/06 23:24:58

ポイント10pt

市販のソフトになるのですが,Acrobat Readerの強化ソフトとして動作し

表示されているPDFを翻訳して表示する翻訳ソフトが

あるようです.

編集不可能のPDFに対応しているかどうかメールなどでメーカーに確かめ,

対応しているようであれば購入を検討してみてはいかがでしょうか.


p.s. xdoc2txtは,

-f -n ”%1”

と加えると良いみたいです.

暗号化されたPDFは抽出できません.

コメントはまだありません

トラックバック

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません