これをアウトライン化しつつ、検索可能なPDF(透明文字付き)に変換する方法を教えてください。
PDFのテキストをアウトライン化する(Acrobat/Illustrator) | DTP Transit
こちらにアウトライン化のやり方がありますがやはり文字情報が消えるといっています。
もともとの状態がよくわかりません。
普通にテキストが埋め込まれているpdfなら、アウトライン化はせずフォントも共に埋め込めばよい(文字化けしない)のではないでしょうか。
アウトライン化すると画像扱い、つまり背景のようなものになるとおもいます。ネピアさんは画像処理ソフトでのテキストのアウトライン化の処理を行っているようです。その場合はテキストは切り落とされてしまう仕組みだとおもいます。
目で読み取れ、検索にもひっかかるpdfはアウトライン前のテキストpdfです。
文字化け回避しつつ検索可能にする意味でしたらよけいにアウトライン化せずフォントを埋め込んでください。
PDFで文字が検索できないのは、スキャナーを使用して保存した画像でPDF内部に文字コードがない場合、フォント埋め込みしたPDF[2] でPDFから正しい文字コードが取得できない場合、フォントがアウトライン化されてしまっている場合、などが考えられます。
https://www.antenna.co.jp/pdf/reference/FontEmbedding.html#a03
コメント(0件)