2021年8月11日水曜日

フォントとPDFへの埋め込みについて (続き)

 前回調べたNoto Sans JPの文字化けに関して、cmapを確認してみました。

このフォントには以下の5種類のcmapテーブルが実装されていました。

  • Platform 0 / Encoding 3 (Unicode BMP only)
  • Platform 0 / Encoding 4 (Unicode full repertoire)
  • Platform 0 / Encoding 5 (Unicode Variation Sequeces)
  • Platform 3 / Encoding 1 (Windows Unicode BMP)
  • Platform 3 / Encoding 10 (Windows Unicode full repertoire)

簡単にまとめると16ビットのUnicodeからCIDを引くcmapと32ビットのUnicodeからCIDを引くcmap、そして異体字セレクタ (別字形を選択するためのコード) を含むUnicodeからCIDを引くcmapの3種類が登録されています。

これらのcmapの内容を確認したところ、すべて前回調べたToUnicode cmapに登録されているCID値が設定されており、Microsoft Print to PDFの出力が (文字化けするけど) 正しい値を指定していることがわかりました。

cmapには問題がなさそうなので、次はCFFテーブル (フォントデータ本体) を調べてみようと考えています。

bewise.jp - 2021年8月11日の投稿の再投稿

0 件のコメント:

コメントを投稿

AIに奪われる仕事、奪われない仕事

 少し前にAIに奪われる雇用の割合は日本がアジア圏で一番といった調査機関の報告がニュースに出ていました。 事務的な仕事が多いためだそうです。 AIに奪われる雇用の割合、日本が14%でアジア最高 代替可能な事務仕事多く 国際試算  (産経新聞サイト) また、他の調査では労働人口の半...