2021年9月8日水曜日

フォントとPDFへの埋め込みについて (続き)

 引き続いて調べたいことはいくつかあるのですが、なかなか進まないので少しだけ寄り道です。

デジタル庁はNoto Sans JPフォントを推奨フォントとしているので、デジタル庁の文書の中ではどう扱っているかを調べてみました。

9月1日に発行されたヴィジュアル・アイデンティティ・ガイドラインを見ると、テキストがすべて図形化され、テキストとして選択できないようになっていました。

さすがにこれはまずいと考えたのか、9月6日版で改訂されていました。

改訂内容を見ると、埋め込みフォントがすべてType3フォントになっていました。

Type3フォントはAdobe社がPostScript標準フォント形式のType1フォント仕様を有償ライセンスとしていた時代に無償で使用可能なフォント形式として提供していたもので、ヒント情報を持たない図形データだけで構成されたフォント形式のため、特に小サイズにおいて文字品質が確保できないという逆差別化がされています。

※ヒント情報は文字を構成する線幅や線間を調整して線幅のばらつきなどが起きないようにするための情報です。

また、Type3フォントは日本語対応などを考慮していない時代に作られた仕様のため、1個のフォントに255種の文字しか含めることができません。

このため、日本語テキストを使用する場合には255種の文字ごとに別のフォントとして登録する必要があります。

この改訂によってテキストデータがテキストデータとして扱えるようになり、コピペや読み上げができないという問題は解消されましたが、OTFフォントをType3形式に変換しながら埋め込むというのはあまり標準的な手順ではない (というか、どうやればできるのかわからなかった) ので、今後もこのような対応を継続していくのか、継続できるのか多少不安があります。

また、この手順で名刺データが作られると住所など小サイズの文字を使用する部分で品質が確保できるのかも問題となりそうです。

まあ、それ以前に「Digital Primary Black」で印刷品質が確保できるかの方がもっと問題ですけど。

もう一つ、Linux版のLibreOfficeでも同じようにPDF変換を試してみました。

LibreOfficeのPDF機能もOTFフォントをそのまま埋め込むのではなく、Type1フォント形式で255字種ごとに分割して埋め込みを行っていました。

Type1形式 (現在はライセンス費用が不要になっています) なので、ヒント情報が含まれており、OTFフォントと変わらない品質が確保できると思いますが、このように1個のフォントデータを複数のフォントに分割した場合に正しく処理できるのか、例えばフォントの字形データを展開した画像をキャッシュして再利用するようなシステムで問題が起きないかは確認が必要かもしれません。

ということで、Noto Sans JPフォントを使用した文書のPDF化におけるフォントデータ埋め込み方式にこんなのもあったという話でした。

bewise.jp - 2021年9月8日の投稿の再投稿

0 件のコメント:

コメントを投稿

AIに奪われる仕事、奪われない仕事

 少し前にAIに奪われる雇用の割合は日本がアジア圏で一番といった調査機関の報告がニュースに出ていました。 事務的な仕事が多いためだそうです。 AIに奪われる雇用の割合、日本が14%でアジア最高 代替可能な事務仕事多く 国際試算  (産経新聞サイト) また、他の調査では労働人口の半...