bewise.jp: フォントとPDFへの埋め込みについて (続き)

2021年8月11日水曜日

前回調べたNoto Sans JPの文字化けに関して、cmapを確認してみました。

このフォントには以下の5種類のcmapテーブルが実装されていました。

簡単にまとめると16ビットのUnicodeからCIDを引くcmapと32ビットのUnicodeからCIDを引くcmap、そして異体字セレクタ (別字形を選択するためのコード) を含むUnicodeからCIDを引くcmapの3種類が登録されています。

これらのcmapの内容を確認したところ、すべて前回調べたToUnicode cmapに登録されているCID値が設定されており、Microsoft Print to PDFの出力が (文字化けするけど) 正しい値を指定していることがわかりました。

cmapには問題がなさそうなので、次はCFFテーブル (フォントデータ本体) を調べてみようと考えています。

bewise.jp - 2021年8月11日の投稿の再投稿

bewise.jp