そこで、その参考書のe-bookが出ているらしいので、それに翻訳や、単語を検索しながら読もうかと考えています。
そこで気になることが。
そのe-bookの説明を見ると、テキストのコピー&ペーストができないようなのです。それでも、翻訳ソフトなどは使えるものなのでしょうか?
もしくは他の方法がありますか?
こんばんは。
テキストのコピー&ペイストが出来ない場合、
例えるならそれは絵のようなものです。
絵から字をみつけて認識することをOCR処理といいますが
翻訳ソフトでそこまでついているものは、ないのでは
ないでしょうか?
携帯端末で文字をよみとって英訳するなんていうのがありますが
あれはまさにOCR処理ですよねw
他の方法というのがOCR処理をかけるというものになるはずですよ。
pdfファイルなんですか?ならば下記のリンクのどれかが使えませんか?
pdfファイルからテキストを取り出すソフト2つとソースコードです。
http://www.softpedia.com/get/Office-tools/PDF/Easy-PDF-Text-Conv...
http://www.snapfiles.com/get/pdfplain.html
http://www.codeproject.com/cpp/ExtractPDFText.asp
あとはファイルを一旦画像としてプリントアウトして別名で保存、そのあとアクロバットプロのcapture pageって機能で文字を読み込むとか。(capture pageは本来はスキャンしたドキュメント、つまり画像、を文字とイメージに取り込み直す機能です)
ありがとうございます。
プリント禁止になっているかわかりませんので、調べてみます。
コマンドから、ルートでログインして、
chmodでファイルの「読み、書き」の両方が出来る様にして、
pdf2txtでテキストを抽出、
出来る、はずです。(http://www.pdf2txt.com/)
または最後の手段、
まずファイルを印刷します。
印刷したファイルをスキャナで画像として取り込んで、
アクロバットプロフェッショナルで開く。
機能の中の、Document->Paper Capture ->Start Capture
で文字を取り込む。きちんとスキャンされていればこれでなんとかいけるかと。
ありがとうございます。
プリント禁止になっているかわかりませんので、調べてみます。
プリントが可能であれば次のような方法が取れると思います。
(1)TIFF出力対応のプリンタドライバを印刷出力先に選択して、TIFF画像で保存する
白黒つけるぜ! White & Black 2値 Printer Driver これはフリーのTIFF出力仮想プリンタドライバです Microsoft Office Document Image Writer これはMicrosoft Officeに入っている仮想プリンタドライバで、TIFF出力可能。
(2)できたTIFF画像をダブルクリックし表示します
(設定をいじっていなければ"Windows画像とFAXビューワ"が開きます)
(3)文字部分をマウスで選択して、コピーを行うと自動的にOCRが動作して、クリップボードにテキスト形式に変換されてコピーされます
(4)翻訳ソフトなどに貼り付ける
OCRかける事はできるということですか?
PDFでコピーを禁止しているからと言って、絵になっているわけではないと思います。