人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

Acrobatでハングルの書類をOCR読み取りして、テキストデータをWordに貼り付けようとしましたが、文字化けしてしまいます。WordのフォントをArial Unicode MSやMS UI Gothic, Batang等にしてから貼り付けてもダメでした。
Acrobatの設定をどうにかしたらうまくいくんでしょうか?

●質問者: kpasha
●カテゴリ:コンピュータ
✍キーワード:Acrobat MS OCR UI Unicode
○ 状態 :終了
└ 回答数 : 2/2件

▽最新の回答へ

1 ● konchan117
●34ポイント

Acrobat5.0のヘルプより抜粋ですが。。。この方法でどうでしょうか。お役に立てなければポイントは結構です。


Adobe PDF 文書の論理構造ツリーの編集

Adobe PDF 文書の中には、文書の内容に完全にアクセスできるようにするために必要な情報が、すべて含まれていないものがあります。

たとえば、図の代替テキスト、テキストの言語指定、また、スパンのための拡張テキストが含まれていないことがあります。

再利用により適した構造化PDF 文書およびタグ付きPDF文書を作成するため、これらの情報を文書の論理構造ツリーに付け加えることができます。

注意:文書の論理構造ツリーを編集するための他の手段も用意されていますが、Acrobat に精通したユーザでない限り、この節で説明している以外の方法で編集することは推奨できません。

文書の論理構造ツリーについてのより詳細な情報は、Adobe Acrobat 5.0 ソフトウェアディベロッパーズキット(SDK)に同梱されているTN 5406 というタイトルのテクニカルノートを参照してください。

図の代替テキストを追加するか、またはテキストの言語を指定するには:



1. ウィンドウ/タグを選択し、論理構造ツリーを表示させます。文書に論理構造ツリーが存在しない場合は、パレットに「利用できるタグがありません」と表示されます。

論理構造ツリーのエレメントを展開するには、エレメントの左にある記号をクリックします。


2.次のいずれかを行います。

・ 図に代替テキストを追加したい場合は、論理構造ツリーから<Figure> というタグの付いたエレメントを選択します。

・ 段落や他のエレメントに含まれているテキストの言語を指定したい場合は、論理構造ツリーから

というタグの付いたエレメントを選択するか、テキストを含んでいる他の種類のエレメントを選択します。


3. タグパレットの右上の角にある三角形をクリックしてタグパレットメニューを表示し、エレメントのプロパティを選択します。

(対応する項目の強調表示をオンにしていた場合は、まずこのオプションをオフにして、タグパレットメニューから他のコマンドを選択できるようにしてください)。


4. 次のいずれかを行います。

・ 図の代替テキストを追加するには、図の代替テキストを表すテキストを入力します。

たとえば、「図の説明」で始まる代替テキストを追加してから、続けてその図が説明する内容を記述したいという場合が考えられます。

図の代替テキストとして入力する情報は、スクリーンリーダーに読み込まれるため、ユーザはその文書に表示される図の内容を認識できます。

・ 段落や他のエレメントに含まれているテキストの言語を指定するには、言語ポップアップメニューで言語を選択します。

たとえば、言語を日本語に指定するにはJA を選択します。

論理構造ツリーの最上位階層のエレメントに指定された言語属性は、その下にあるすべてのエレメントに継承されます。

ほとんどの場合、文書内で言語が切り替わるときに限り、言語を指定する必要があります。指定しておくと、文書の内容を再利用する際に、正しい文字が使用されるようになります。

◎質問者からの返答

む、むずかしい。

今ゆっくり読み込む余裕がありませんので、後でじっくり拝見します。言語ポップアップメニューが鍵なのかな・・・

文書メニュー→Paper Capture→編集→OCRの言語・・・ここに韓国語を追加できればおそらくうまくいくんでしょうけど、どうやるんだろう。CD-ROMのオプションも全て追加してるんですが。うーん。


2 ● りくっち
●33ポイント

お疲れ様です。

もしかするとハングルのフォントが入っていないのではないでしょうか。

下記のサイトはハングル・フォントをWindowsでするための手順が掲載されています。

http://ilc2.doshisha.ac.jp/yyutani/HnglFont.html

◎質問者からの返答

フォントは入れてます。XPなので、使えるようにしていますと言った方が正しいでしょうか。

自分でハングル打ち込んで文章を作成することもありますので、これが原因とは考えにくいです。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ