DTPの悪慣習

割と少ない労力で雑誌のデジタル化は進んでいる。ほんと、あいた手を少し使うだけで簡単にPDFになっていく。仕事をしながら、ちょっと紙をフィードするノイズを我慢するだけでいいのだから簡単なことだ。
これまで資料としては残しておきたいけど、諦めていたものが整理されるのだからこれほど嬉しいことはない。

OCRの認識能力はちょっと不満が残る。かなり完璧に文字認識できる雑誌もあれば、ほぼ全滅という雑誌もあるのだ。まあ、OCRの能力なんてこんなもんだと諦めていたのだが、きちんと読み込めるものと、ダメなものの違いがなんとなくわかると、ちょっと腹がたってきた。

OCRの認識が良い雑誌、=きちんと歯送りの文字組がされている雑誌
OCRの認識が悪い雑誌、=とんでもない文字詰めが行われている雑誌

まあ、OCRの機能からするとごくごく当たり前のことで、とんでもない文字詰めなんか知りはしないよということ、
枠の中に入れるというだけのイラストレーターでの日本語文字組がこんなところで障害になるのでした。ちゃんとページレイアウトソフトで作ってくださいよ。ページものであれば。