evan.hong fda20c9f20 init | 3 лет назад | |
---|---|---|
.. | ||
tools | 3 лет назад | |
unihan | 3 лет назад | |
.bumpversion.cfg | 3 лет назад | |
.gitignore | 3 лет назад | |
.python-version | 3 лет назад | |
.travis.yml | 3 лет назад | |
CHANGELOG.md | 3 лет назад | |
GBK_PUA.txt | 3 лет назад | |
LICENSE | 3 лет назад | |
Makefile | 3 лет назад | |
README.md | 3 лет назад | |
kHanyuPinlu.txt | 3 лет назад | |
kHanyuPinyin.txt | 3 лет назад | |
kMandarin.txt | 3 лет назад | |
kMandarin_8105.txt | 3 лет назад | |
kMandarin_overwrite.txt | 3 лет назад | |
kXHC1983.txt | 3 лет назад | |
kanji.txt | 3 лет назад | |
merge_unihan.py | 3 лет назад | |
nonCJKUI.txt | 3 лет назад | |
overwrite.txt | 3 лет назад | |
pinyin.txt | 3 лет назад | |
zdic.txt | 3 лет назад |
汉字拼音数据。
拼音数据的格式:
{code point}: {pinyins} # {hanzi} {comments}
#
开头的行是注释,行内 #
后面的字符也是注释{pinyins}
中使用逗号分隔多个拼音示例:
# 注释
U+4E2D: zhōng,zhòng # 中
Unihan Database 数据版本:
Date: 2020-02-18 18:27:33 GMT [JHJ]
Unicode version: 13.0.0
kHanyuPinyin.txt
: Unihan Database 中 kHanyuPinyin 部分的拼音数据(来源于《漢語大字典》的拼音数据)kXHC1983.txt
: Unihan Database 中 kXHC1983 部分的拼音数据(来源于《现代汉语词典》的拼音数据)kHanyuPinlu.txt
: Unihan Database 中 kHanyuPinlu 部分的拼音数据(来源于《現代漢語頻率詞典》的拼音数据)kMandarin.txt
: Unihan Database 中 kMandarin 部分的拼音数据(普通话中最常用的一个读音。zh-CN 为主,如果 zh-CN 中没有则使用 zh-TW 中的拼音)kMandarin_overwrite.txt
: 手工纠正 kMandarin.txt
中有误的拼音数据(可以修改)GBK_PUA.txt
: Private Use Area 中有拼音的汉字,参考 GB 18030 - 维基百科,自由的百科全书 (可以修改)nonCJKUI.txt
: 不属于 CJK Unified Ideograph 但是却有拼音的字符(可以修改)kanji.txt
: 日本自造汉字 的拼音数据 (可以修改)kMandarin_8105.txt
: 《通用规范汉字表》(2013 年版)里 8105 个汉字最常用的一个读音 (可以修改)overwrite.txt
: 手工纠正的拼音数据(可以修改)pinyin.txt
: 合并上述文件后的拼音数据zdic.txt
: 汉典网 的拼音数据(可以修改)