Microsoft Officeには、2007からPDF書き出し機能が付いています。普通に使うには十分な性能を持っているのですが、今日は少し困ったことが起きました。そこで、ジャストシステムのJUST PDFを使いましたら、この困った問題が解決されたのです。なので、ちょっと書いておこうと思いました。
その困った問題とは、使用したフォントによっては、PDFからテキスト情報が取り出せないことです(実は取り出せるのですが、それについては最後に)。PDF化された文書からは、よくコピペでテキスト情報を取り出すのですが、見た目は文字があってもそれは単なる絵で、テキスト情報は取り出せないのです。
OfficeのPDF書き出し機能には、いくつかのオプションがあるのですが、いろんなパターンを試しても結局うまくいきません(上のダイアログの、下部の)。仕方ないので、PCにインストールされていた一太郎2013 玄プレミアムに付属しているJUST PDFを使って、書き出すことにしました。このアプリケーションにはいろいろ思うところがあって、普段はほとんど使いません。しかし、こういうときこそ試さないと損だろうということで、さっそく標準オプションで書き出してみました。
結果!うまくいくではないですか。きちんとフォントも埋め込まれて、テキスト情報も取り出せます。これで、目的は達成できました。
ちょっと不便なのは、書き出す範囲を決められないことでしょうか。たとえばPowerPointでは、書き出すスライドを指定できません。Excelでは、書き出すワークシートを指定できません。アドオンで使う機能なので、このへんが限界のようです。あ、印刷で出力先にJUST PDF Driverを選択すれば、印刷機能と同等のオプションを指定できます。
すべて書き出してしまっても、JUST PDFの編集機能で、必要なページのみ切り出したり、目的は十分達成できます。まぁJUST PDFは、作成と編集を組みで使うアプリケーションのようです。
結局この問題は、ヒラギノのようなサードパーティのフォントか、OpenTypeのフォントを使うと起きるようです。Windows標準のフォント、Officeに付属しているHGフォントなどでは、何の問題もありません。ジャストシステムのアプリケーションでインストールしたフォント、アドビ製品に付属していたフォントなどでは、うまくいかないようです。
しのごの言っていてもしようがないので、万が一のときのために、PDF作成アプリケーションを入れておくといいかもしれませんね。
コメント