現在、テキスト変換すると文字化けしてしまうPDFをOCR処理して正しくテキストコピーできるPDFに変換したいと考えています
。
手元の大量のPDFは、reader ではきちんと表示されますが、テキスト保存すると文字化けします。
また、テキストコピーしようとするとエラーになります。
文字列の選択はできますが、文字列の検索はできません。
プロパティ→フォントをみると、
・実際のフォント、実際のフォントの種類
・埋め込みサブセット、エンコーディング:カスタム
などとあります。
テキストが文字化けせずに正しくコピーアンドペーストできるようなPDFに変換したいのですが、
acrobat pro DCのOCR処理でできますでしょうか?
またどのように操作すればよいか教えていただけますでしょうか?
なおおよそ4000ファイルのPDFを処理したいと考えています。