ようこそゲスト さん ユーザー登録 ログイン

編集不可のPDFファイルから本文をコピーする方法を教えてください。目的は英語の論文に翻訳ソフトを使用したいのです。 編集不可のPDFファイルから本文をコピーする方法を教えてください。目的は英語の論文に翻訳ソフトを使用したいのです。.. を含むブックマークはてなブックマーク - 編集不可のPDFファイルから本文をコピーする方法を教えてください。目的は英語の論文に翻訳ソフトを使用したいのです。.. - 人力検索はてな

  • kumasuzu あなたも質問に答えられます! ウォッチリストに追加
  • 状態:終了
  • 回答数:11 / 0件
  • 回答ポイント:120ポイント
  • 登録:2005-05-02 15:31:24
  • 終了:--
  • カテゴリー:コンピュータコンピュータ 科学・統計資料科学・統計資料

1 回答者:LSR 2005-05-02 15:42:05 満足! 15ポイント

http://sasapanda.com/toshi/archives/200405/07_0255-764.php

Orbium -そらのたま-:移転しています。

コピー不可や印刷不可のファイルでなければツールバーにある、テキスト選択ツールを選択してから文章をドラッグすればできると思うのですが・・・


もしもコピー不可や印刷不可でしたらこちらに記載されています。著作権に注意しつつご利用ください。

質問者:kumasuzu 2005-05-05 15:28:40

お返事遅れました。LSRさんにお教え頂いたプログラムを試して見たのですが、こちらのソフトがPDFのセキュリティ(暗号化)に対応していないのか、私の力量の未熟によって使用する事ができませんでした。理解できるようもう少し頑張って見ます。ありがとうございました。

2 回答者:chipmunk1984 2005-05-02 15:44:54 満足! 10ポイント

http://www.sourcenext.com/products/pdf_todata/?i=top

ソースネクスト・ドットコム/文書作成ソフト/いきなりPDF to Data

こういったソフトを使用してテキストにするしかないのではないでしょうか?

質問者:kumasuzu 2005-05-05 15:33:40

御回答ありがとうございます。残念ながらPDFウインドウの左下に鍵のマーク(暗号化制限)がございますので、使用できないようです。

3 回答者:hiroyukiarita 2005-05-02 17:26:46 満足! 10ポイント

http://www.keiyu.com/doc/pdftxt.htm

PDFのテキスト抽出とHTML変換(KeiYu HelpLab)

Acrobat ReaderとAcrobatの(テキスト選択ツール)、(範囲選択ツール)で、PDF文書中のテキストを選択できます。

PDF文書の指定範囲をドラッグして反転し、[編集]→[コピー]でコピーした後、テキストエディタなどを起動して[編集]→[貼り付け]などで貼り付けると、テキストのみが貼り付けられます。

質問者:kumasuzu 2005-05-05 15:36:09

御回答ありがとうございます。残念ながらPDFウインドウの左下に鍵のマーク(暗号化制限)が表示されています。本来なら制限されたPDFは、頑張って勉強して自力で読まなければならないのですが、私の英語力では、かなりの年数が必要のようです。(T_T)

4 回答者:kommychan 2005-05-02 18:50:04 満足! 10ポイント

このツールでテキスト化すれば、

翻訳も簡単だと思います

質問者:kumasuzu 2005-05-05 15:38:42

御回答ありがとうございます。こちらのソフトもお教えいただいて挑戦した見たのですが、残念ながらPDFウインドウの左下に鍵のマーク(暗号化制限)がございますので、こちらのソフトも使用できないようです。

5 回答者:tiptop 2005-05-03 00:41:01 満足! 10ポイント

http://pac.mediadrive.jp/pocr/

MediaDrive:やさしくPDF OCR v.2.0

要は、PDFを「画像」としてOCRに読み込み、テキスト化します。

画像の読み込みとしてPDFに対応しているOCRソフトならリンクのもの以外でも出来るはずです。

ただし、元のPDFの解像度が低いと誤字が増える可能性が高いです。

質問者:kumasuzu 2005-05-05 15:46:33

御回答ありがとうございます。

読んでココ見ないな物でしょうか?以前使用した事があったのですが、tiptop様が仰られているように誤字が多かった気が致しました。

翻訳したいPDFもA4版数十枚にびっしりと英文が記載されています。誤字のチェックも不可能に近そうです。(T_T)

6 回答者:p_p_p 2005-05-03 10:47:11 満足! 10ポイント

URL はダミーです。

スクリーンショットなどでイメージを作ってからOCRにかけるか、面倒ならプリントアウトをスキャナーにかけてOCR->翻訳ソフトという流れではいかがでしょうか。

質問者:kumasuzu 2005-05-05 15:52:19

御回答ありがとうございます。

読んでココ見たいな物ですよね?以前使用した事があったのですが、誤字が多かった気が致しました。最近のソフトはだいぶ改善したのでしょうか?

翻訳したいPDFもA4版数十枚にびっしりと英文が記載されています。誤字のチェックだけでも相当な時間がかかりそうです。(T_T)

7 回答者:uun373 2005-05-04 13:38:28 満足! 10ポイント

http://blog.sf-dream.com/archives/2005/04/pdf_2.html

セキュリティのかかったPDFファイルからテキストを抽出する方法 : (Dreamのお好み情報箱)

こんにちは.

このサイトに書いてある情報が使えるかもしれません.


それで駄目なら,最悪,Acrobat Readerを最大化して目的のPDFを表示

→スクリーンキャプチャを取り画像に保存

→OCRソフトで読み取る,となると思います.

画像取り出し禁止のPDFからこの方法(最後のOCRは除く)で

画像を取り出したことはあります.

質問者:kumasuzu 2005-05-05 17:31:00

御回答ありがとうございます。xdoc2txt 1.16 の使い方なのですが、どうしてもデスクトップ上のショートカットアイコンのリンク先に-f -nを追加して適用ボタンを押すと、「パス名が無効です。確認してください」とのエラーが出ます。もしお判りになられれば、このソフトの正しい使用方法を分かりやすくお教え戴けないでしょうか?因みにDドライブにProgram Filesを作製してそこで使用しています。よろしくお願い致します。

8 回答者:troubleantenna 2005-05-05 05:28:43 満足! 10ポイント

pdftotextを使えませんか?

質問者:kumasuzu 2005-05-05 17:54:34

御回答ありがとうございます。こちらの方法も、私には内容が難しく理解する事ができませんでした。もしよろしければ、分かりやすく御解説いただけにでしょうか?よろしくお願いいたします。

9 回答者:s34itl 2005-05-05 18:12:02 満足! 35ポイント

http://www.bravaviewer.jp/reader.htm

Brava! Reader - �����Ŏg����PDF�ATIFF�ACSF�r���[��

このビューアを使えば、編集不可のpdfから、テキストをコピーすることができます。pdfを表示した後、「編集」→「選択」の後、矩形領域を選び、CTRL-Cまたは「編集」→「コピー」により、テキストをコピーします。


私もkazz7さんと同じような目的でいろいろ試したことがあります。


xdoc2txtはdos窓のコマンドラインでないと動かないと思います。それに、少なくとも日本語のpdfでは、空白やタブが無視され、ベタのテキストになってしまいます。


pdf表示→画面コピーは解像度が低く、これまで試した限りでは、ocrでは満足する結果が出ていません。拡大表示すればよいのですが、手間がかかり過ぎて...

質問者:kumasuzu 2005-05-07 17:09:45

s34itl様 御回答ありがとうございます。何度かDLに失敗してしまいまして、時間が懸かってしまいました(^^ゞ

早速試して見ました。完璧です。本当にありがとうございました。この質問に御回答くださいました他の方々にもこの場をお借りしてお礼申し上げます。

質問者が未読の回答一覧質問者が未読の回答一覧質問者が未読の回答一覧について

 回答者回答回数受け取り回数いるか賞回答時間
1 kommychan 136 123 0 2005-05-06 02:03:33
2 uun373 6 5 0 2005-05-06 23:24:58

この質問・回答へのトラックバックこの質問・回答へのトラックバック

R日記 そのにR日記 そのに R日記 そのに 2006-03-13 16:12:57
薄味オタクの日常薄味オタクの日常 薄味オタクの日常 2006-03-13 16:12:57
チラシのウラチラシのウラ チラシのウラ 2006-03-13 16:12:58
ここは酷い自律ですねここは酷い自律ですね 障害報告@webry 2008-01-07 22:42:34
「自律する人間」と「依存する人間」(國領二郎・慶大教授)・ネット時評?ビジネス-最新ニュース:IT-PLUS http://it.nikkei.co.jp/business/news/index.aspx?n=MMITs2000007012008 まあ偽装ものの食品を喰って
テキストを選択できないPDFファイルからテキストを抽出する方法テキストを選択できないPDFファイルからテキストを抽出する方法 地方の中規模印刷会社で苦悩するWebデザイナー改めWebディレクターの日記 2008-03-17 12:38:28
時々、PDFファイルを渡されて「これをホームページにしてくれない」と言われることがある。 PDFだったらそのままPDFでリンクだけ張っちゃろうかい! なんて思うこともあるが そういう