本に印刷されてあるリスト(エクセル表)をそのままエクセルデータにしたいです。

「そのま〇PDF2データ」などのツールを購入しましたが、表が小さいのか、
文字と表の原形すらとどめない状態です。
ネット上にデータがあればいいのですが、ございません。
量が多いので、どうにか 本のリスト⇒(PDF)⇒エクセル表
とする方法はないでしょうか?

回答の条件
  • 1人2回まで
  • 登録:2011/02/26 23:09:36
  • 終了:2011/02/28 22:31:48

ベストアンサー

id:j4mika No.2

j4mika回答回数178ベストアンサー獲得回数252011/02/27 01:25:17

ポイント30pt

「そのま〇PDF2データ」については聞いたことがありませんが、

http://ai2you.com/ocr/product/koko13/trial01.asp

http://pac.mediadrive.jp/support/dl_try.html

などある程度名が通っているところの体験版などを使ってみて、

うまくいけば購入というのも良いかと思います。

また、

>文字と表の原形すらとどめない状態です。

が気になります。若干薄めで取り込んだり、本の裏に銀紙?白いコピー用紙?(どちらが有効だったか忘れた)などをくっつけ、そのソフトで可能な解像度ギリギリで読み取りを試みてはいかがでしょうか?

id:NishidaTetsuo

>若干薄めで取り込んだり、本の裏に銀紙?白いコピー用紙?(どちらが有効だったか忘れた)>などをくっつけ、そのソフトで可能な解像度ギリギリで読み取りを試みてはいかがでしょうか?

アドバイスありがとうございます。

1度うまくいかないとその方法を諦めてしまう性格のため、すごく良い指摘だと思います。

試してみます。

2011/02/27 10:54:03

その他の回答(4件)

id:kia_44 No.1

きあ回答回数396ベストアンサー獲得回数302011/02/26 23:53:53

ポイント30pt

現在の技術では基本的に、完璧にできる術はない。というのが回答になります。

それだけではさみしいので下記を。

画像データ(スキャンした後のデータ)からテキストデータを起こす技術をOCRといいます。

OCRソフトはいくつかあるのですが、日本語は極端に文字数が多いことがネックとなり、

なかなかうまくいっていないが現状のようです。

また、フォントなどの関係もあり、容易にできる言語ではないでしょう。

100%を求めるなら手打ちで行うしかない状態です。

OCRソフトで検索すると一通り出てきますのでお試しください。

正直なところ、現状で満足いくレベルの変換してくれるものはないので、結局手作業でやってます…。

発展してほしい分野ですよね。

id:NishidaTetsuo

そうなのですね。

ご回答ありがとうございます。

数年前にも前も同じような質問をして同じような回答された気がします。

そのときはとても高いソフトのため諦めました。

地道にやります・・・。

2011/02/26 23:59:02
id:j4mika No.2

j4mika回答回数178ベストアンサー獲得回数252011/02/27 01:25:17ここでベストアンサー

ポイント30pt

「そのま〇PDF2データ」については聞いたことがありませんが、

http://ai2you.com/ocr/product/koko13/trial01.asp

http://pac.mediadrive.jp/support/dl_try.html

などある程度名が通っているところの体験版などを使ってみて、

うまくいけば購入というのも良いかと思います。

また、

>文字と表の原形すらとどめない状態です。

が気になります。若干薄めで取り込んだり、本の裏に銀紙?白いコピー用紙?(どちらが有効だったか忘れた)などをくっつけ、そのソフトで可能な解像度ギリギリで読み取りを試みてはいかがでしょうか?

id:NishidaTetsuo

>若干薄めで取り込んだり、本の裏に銀紙?白いコピー用紙?(どちらが有効だったか忘れた)>などをくっつけ、そのソフトで可能な解像度ギリギリで読み取りを試みてはいかがでしょうか?

アドバイスありがとうございます。

1度うまくいかないとその方法を諦めてしまう性格のため、すごく良い指摘だと思います。

試してみます。

2011/02/27 10:54:03
id:mkonomi No.3

mkonomi回答回数651ベストアンサー獲得回数452011/02/27 00:48:10

ポイント35pt

「そのま〇PDF2データ」の機能が分からないのですが、

画像スキャン機能+OCR機能+PDF機能というところでしょうか?

 

①画像スキャン機能でdpiの選択ができるなら最大dpiに設定する

②画像スキャン機能で「本に印刷されてあるリスト」をスキャンして画像データを得る

必要なら、画像スキャンで得られた画像データ画像編集ソフトで調整する。

  - OCRの妨げになる汚れ等があれば除去する

  - 明るさ、コントラストを調整する

④OCR機能で画像データをテキストデータ化する

必要なら、テキストデータをテキストエディタで編集する

  - OCR誤変換文字があれば修正する

  - CSV形式に整える

⑥EXCELでテキストデータを読み込む

EXCELデータとして保存する

 

id:NishidaTetsuo

>「そのま〇PDF2データ」の機能

は、PDFファイルを元データとして、エクセルやワードなどにする有料ソフトです。

OCR機能のみでしょうか。

解像度を上げたり、明るさの調節をしたりしてみます。

2011/02/27 10:56:25
id:taroe No.4

taroe回答回数1099ベストアンサー獲得回数1322011/02/28 01:23:15

ポイント35pt

スキャナで取り込む場合、

新聞記事の文字程度の大きさをいじしてるのなら

普通はきれいに取れますよ。

無料版がありますのでこれをこれを試してみては?

http://ai2you.com/ocr/product/koko13/feature02.asp


そのま〇PDF2データの具体的なソフト名と

そのURLを示しても問題ないと思うのでそうされたほうが回答しやすいです。


スキャナから取り込んでPDFにして、このソフトでEXCEL化しようとしてるように

思うのですが、ソフトにOCR機能がないものはできない場合があります。

そういうソフトの変換もとのPDFはもともとEXCELやワードなどで作成されたPDFが対象となってるはずです。

マニュアル等を見てください。

ですからスキャナから取り込んだPDFとかはうまく変換できません。

id:NishidaTetsuo

>そういうソフトの変換もとのPDFはもともとEXCELやワードなどで作成されたPDFが対象となってるはずです。

>マニュアル等を見てください。

>ですからスキャナから取り込んだPDFとかはうまく変換できません。

そうなんですか!

考えもしなかったです。ありがとうございます。

道理でうまくいかない訳だ・・・

2011/02/28 22:24:51
id:mmm-ddd No.5

mmm-ddd回答回数22ベストアンサー獲得回数12011/02/28 17:14:16

ポイント5pt

EXはーくをたっち

PARをつかう。CFおK

id:NishidaTetsuo

ちょっと何言ってるのか分からないです(サンドイッチマン風に)

回答履歴みましたが、もう少し誠意を持って回答して頂ければと思います。

2011/02/28 22:29:39

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません