みんなの「教えて(疑問・質問)」にみんなで「答える」Q&Aコミュニティ

こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

解決済みの質問

PDF をワードやエクセルに変換すると文字化けする

よろしくお願い致します。

PDF をワードやエクセルに変換すると文字化けするのは何故でしょうか?
卒業文集の文章を、ブラザーの複合機でスキャンしpdfにしました。
それを変換ソフトを使って(変換中ocrと表示されます)ワードやエクセルにすると
文字化けしてしまいます。

どうにか文字化けしないようにするにはどうしたら良いでしょうか?
ご教授下さいませ。

投稿日時 - 2012-09-05 15:27:13

QNo.7681918

すぐに回答ほしいです

質問者が選んだベストアンサー

>PDF をワードやエクセルに変換すると文字化けするのは何故でしょうか?

何故でしょうって、そりゃOCRの宿命だから。

紙に印刷された白黒のパターンをもとに、何千字という辞書から正しいと考えられる文字を探すんですよ。
一文字も間違わない方が、むしろ不思議です。


もともとbrotherの添付ソフトであるプレストのOCRは認識率が低いです。


とりあえず、そんなに小さな字でなければ解像度を300-400dpiで固定し
原稿濃度を濃くしたり薄くしてスキャンして、一番認識率が高い(誤認識:文字化けの少ない)
コンディションを探してください。

きれいな原稿を用意するのも、認識率を高める一つの手です。

投稿日時 - 2012-09-05 16:30:42

お礼

ご教授ありがとうございました。
OCRとはそのようになっているんですね・・・
勉強になりました。

本当にありがとうございました。

投稿日時 - 2012-09-06 09:22:35

このQ&Aは役に立ちましたか?

0人が「このQ&Aが役に立った」と投票しています

回答(2)

ANo.2

それは「文字化け」とはいいません、「誤認識」といいます。
つまりパソコンが読み違えているだけ・・・
    
OCRソフトの宿命です。
対策は・・・
読み込んだ画像の明暗、濃度などの調整、OCRソフトの読み取り精度などで、多少は良くなるかも?

投稿日時 - 2012-09-05 16:59:39

あなたにオススメの質問