嘉义县 水富县 乐安县 大关县 长岛县 华池县 武川县 大冶市 广水市 彭州市 合阳县 崇信县 民丰县 资中县 新邵县 休宁县

通用规范汉字表

  2019-09-22来源:网络

  原标题:通用规范汉字表

第36卷第6期2014年11月
宁夏大学学报(人文社会科学版)
JournalofNingxiaUniversity(HumanitiesSocialSciencesEdition)
Vol.36
No.6
Nov.2014
《通用规范汉字表》研究(一)
导夫,马子象
(宁夏大学学术期刊中心,宁夏银川750021;宁夏大学新华学院,宁夏银川750021)
摘要:2013年6月5曰,国务院公布了由教育部、国家语言文字工作委员会组织制定的《通用规范汉字表》。《通用规范汉字表》共收录汉字8105个,分为三级。其中,一级字表为常用字集,收字3500个,主要满足基础教育和文化普及的基本用字需要。二级字表收字3000个,使用度仅次于一级字。一、二级字表合计6500字,主要满足出版印刷、辞书编纂和信息处理等方面的一般用字需要。三级字表收字1605个,是姓氏人名、地名、科学技术术语和中小学语文教材文言文用字中未进入一、二级字表的较通用的字,主要满足信息化时代与大众生活密切相关的专门领域的用字需要。本文对《通用规范汉字表》的收字分布进行初步统计,对《通用规范汉字表》的笔画进行定量分析,对《通用规范汉字表》与其他字表予以简单比较,对《通用规范汉字表》的补充和调整提出建议,以期对基础教育和文化普及,出版印刷、辞书编幕和信息处理,信息化时代与大众生活密切相关的专门领域的用字需要等方面,提供一些基本而实用的参考资料。关键词:汉字;《通用规范汉字表》;一级字表;二级字表;三级字表;收字分布;笔画;定量分析中图分类号:H13文献标志码:A文章编号??001-5744(2014)06-0020-11
2019-09-22,国务院公布了由教育部、国家语言文字工作委员会组织制定的《通用规范汉字表》。《国务院关于公布〈通用规范汉字
[1]
步统计,对《通用规范汉字表》的笔画进行定量分析,对《通用规范汉字表》与其他字表予以简单比较,对《通用规范汉字表》的补充和调整提出建议,以期对基础教育和文化普及,出版印刷、辞书编纂和信息处理,信息化时代与大众生活密切相关的专门领域的用字需要等方面,提供一些基本而实用的参考资料。
-《通用规范汉字表》收字统计与分析
表〉的通知》指出:“《通用规范汉字表》是贯彻《中华人民共和国国家通用语言文字法》,适应新形势下社会各领域汉字应用需要的重要汉字规范。制定和实施《通用规范汉字表》,对提升国家通用语言文字的规范化、标准化、信息化水平,促进国家经济社会和文化教育事业发展具有重要
音\y,,[2]
《通用规范汉字表》共收录汉字8105个,分为三级。其中,“一级字表为常用字集,收字3500个,主要满足基础教育和文化普及的基本用字需要。二级字表收字3000个,使用度仅次于一级字。一、二级字表合计6500字,主要满足出版印刷、辞书编纂和信息处理等方面的一般用字需要。三级字表收字1605个,是姓氏人名、地名、科学技术术语和中小学语文教材文言文用字中未进入一、二级字表的较通用的字,主要满足信息化时代与大众生活密切相关的专门领域的用字需要”[3]。本文对《通用规范汉字表》的收字分布进行初
收稿日期:2019-09-22
经笔者对比统计,《通用规范汉字表》收录汉字在CJK(CJKUnifiedIdeographs),CJKExt-A(CJKUnifiedIdeographsExtensionA),CJKExt-B(CJKUnifiedIdeographsExtensionB),CJKExt-C(CJKUnifiedIdeographsExtensionC),CJKExt-D(CJKUnifiedIdeographsExtensionD),以及2019-09-22最新公布的CJKExt-E(CJKUnifiedIdeographsExtensionE)定本⑷中都有分布。此外,在PUA(PrivateUseArea)区尚有3字。为了便于说明问题,兹将《通用规范汉字表》收录CJK?CJKExt-A,CJKExt-B,CJKExt-C,CJKExt-D,CJKExt-E,以及PUA汉字胪列如下。1.《通用规范汉字表》共收录汉字8105个,
作者简介:导夫?1961-),宁夏平罗人,宁夏大学学术期刊中心编审,主要从事汉语言文学研究。
—20—
其中收录CJK汉字7829个。它们是:
统一
一丁七万丈三上下不与丐丐丑专且丕世丘丙业丛东丝丞丢两严丧个丫中丰串临丸丹为主丽举NB乃久么义之乌乍乎乏乐乒乓乔乖乘乙乜九乞也习乡书乩买乱乳Nx乾了予争事二亍于亏云互亓五井亘亚些亟亡亢交亥亦产亨亩享京亭亮亲亳亵N堕镹度艘谑踩守熵暄峤銎统鹭虢窠槿源硬植肿惺怂谈断少谪鹎畲钜载硪秦锩茄鲋儇蜇跫廴畏莘缕笄哓罯 伍伎伏伐休众优伙会枢伞伟传伢伲伤伥伦伧伪伫依伯估伲伴伶伸伺似伽任怡佃但位低住佐佑体何秘佗佘余佚佛作佝佞佟你佣佤佥佩佬佯佰佳佴佶恬Oz佻佼橋佾使O丱樫┲冻拶ɡ藤з岸監樄┮老缆陆恼觳嗲瓤胭旰钣崆骤璞愦俣碣纯〖儋耷卫杆追┵蒂繁S豳剐刨顿辟擦┵迟笮薷┚阗絆鮋鲑喊迟沦谋顿康官驪倘候倚倜Po借倡倥倦淙倨倩倪倬倭倮锛债揶值倾PA偃假偈偌偎偏P_偕做停谌健偬Pm锲P纪蒂唾浅タ焊道麿钒狿暣鲑钨洗①写甙临焉礟荘蜗馪迟伊虐辽召再譹捤劢┢з淤刭偃謇躊璔3馕儿兀允元兄充兆先光克免兑兔兕兖党兜兢入全八公六兮兰共关兴兵其具典兹养兼兽冀冁内冈冉册再Q徝叭杳崛咝淳┕谮T┶ざ氡寰隹鲆崩涠迟黄嘧稼×沟蛄杓醮誕愉菽阜卜镔炱究说市淄拱汲龌髹屎涞兜笕蟹智胸卓粆0刑划刖列刘则刚创初删判刨利别划刭刮到刳制刷券刹刺刻刽刿剀剁剂剃R`削RK剌前S0剑剔RU剖剜剞Rw剡剥剧剩剪副割剽剿劁劂R勁遑媪θ鞍旃游褊搅佣氽聚坷⒗蚏价朗撇旅阊玆袍吕绽每鼻谀糝嗲谯纳坠次鹪劝倚儋檗速牖背自言呀晨锵回蟹素哑デ絊湂鲋扱鲍鲎泹鲐鲑鲒鲔鲕湒?矩绘簖鲛鲜?br />鲞鲟鲠鲡鲢鲣鲤鲥鲦鲧蜜?鲔鲫掙鲭鲮?鲰鲱鲲鲳鲴鲵鲷鲸?鲺鲻鲼鲽鲳鳇揑?鲽鳃鳄鳅鳇}陲霄△Ⅶw褱吟ū铟鍦埙瑱M鳞鳟擩溡鳢鳢鳝鸟鸠鸡鸢鸣鸬鸥鸦鸽鸨鸩鸪鸫鸬鸭?鸯钨鸱鸲鸳鸵鸶鸷鸸鸹鹤摘濻鸽鸾鸿鸫鹁鹂鹃鹄鹤鹆鹇鹈鹉鹊鹋鹌鸥鹎鹏濸鹑鹧鹌鹕濾鹗鹘瀁鹚鹛鹜II鹞鹤鹞瀉鹚鹣鹤鹦鹧鹨鹩鹪鹫鹬鹭瀗鹳鹰鹱鹩鹳鹤鹾鹿磨麂麇麈麋麝麒麓灃麝麟麦麸灩麻麽麾黄骷黉黍黎黏黑黔默黛黜黝黟黠炨黢黥黧黩黪黯黹黻黼黾鼋鼍鼎鼐鼐鼓鼗鼙鼠鼢焎?鼬鼯媭鼷鼹鼻鼽鼾焎齄搖齐e幊蓥沉湫脉戳漩祡9龇龈廌艇揔龌龙龚食龟俞新。2.《通用规范汉字表》收录CJKExt-A区汉字77个。它们是:诌依哎啁缀X售悠跬辩箩綷轶分呃馀?狼篡黑瞰桐祛槊j汶沆n稳獗uQq鎞錿烤爝坂扼璞摁指倥锓璞觌垭倮涂咭ぜ恼煮磭┾垓眼咔手4钹镨鲫掦岠鹇滱驾瀉濾鹛鹧美。3.《通用规范汉字表》收录CJKExt-B区汉字36个。它们是:`uIII梆谝塘樘yN疣溃琦谳t趚喉唛砂亏茧糨⑤阅饭旖紣犤个田罪酗巾搛蚓ā?.《通用规范汉字表》收录CJKExt-C区汉字44个。它们是:R懵嗱袕 ]琼锏揎頧吻铋恋鞒馅誸伴掺圹尴鷵$镭镝阑颉?颓悚馇櫦肤驹?骚?骥_觜渞莺。5.《通用规范汉字表》收录CJKExt-D区汉字8个。它们是:t@综链珙鞑颈驻涒。6.《通用规范汉字表》收录CJKExt-E区汉字
108个。它们是:惮VA抠抡捞埤烃坜嵴廒眍0钟见挟栀lx狈涠妪焊惮耠球t椾毖蚁跹怏耦松蚋兕劬噶沾緙/缰镶苘茜?蘸蜍讦忙饯垠湮堤璁坹s6鄂酿钱论银祈钵钟轳绍姆??宏镇铍猴锱镨撇镇镙辚链闺皑哜啧顿颜胚驷跣验驰鳝膦鲍扝跪铫鳓?br />暨鲦鳝鹋鹛瀁骞鹫鹞骱
夗龈。7.《通用规范汉字表》收录的“洚嶖锾”3个汉字,尚未被Unicode的最新版本收录,因此,这3个汉字目前只能在PUA区编码使用。《通用规范汉字表》收录以上各区汉字占各区汉字总数之比例详见表1。
表I《通用规范汉字表》与统一码各区收字对比表统一码区名收录汉字总数《通用规范汉字表》收录汉字占该区汉字比例(%)
编码范围
版本
CJK(CJKUnifiedIdeographs)
4E00-9FFF
1.0.1
20941
7829
37.386
CJKExt-A(CJKUnifiedIdeographsExtensionA)
3400-4DBF
3.0
6582
77
1.170
CJKExt-B(CJKUnifiedIdeographsExtensionB)
20000-2A6DF
3.1
42711
36
0.084
CJKExt-C(CJKUnifiedIdeographsExtensionC)
2A700-2B73F
5.2
4149
44
1.061
CJKExt-D(CJKUnifiedIdeographsExtensionD)
2B740-2B81F
6.0
222
8
3.604
CJKExt-E
(CJKUnifiedIdeographsExtensionE)
2B820-2CEA18.1.1
5762
108
1.874
PUA(PrivateUseArea)
E000-F8FF
1.0.0
6400
3
0.047
合计(只计PUA区实收3字,不包括空位;该比例为《通用规范汉字表》总字数占统一码汉字合计数之比例)从上表可以看出,《通用规范汉字表》在收字上具有以下几个明显的特征:第一,与CJK各区收字均有一定对应关系。分别为:CJK基本汉字7829个,CJKExt-A汉字77个,CJKExt-B汉字36个,CJKExt-C汉字44个,CJKExt-D汉字8个,CJKExt-E汉字108个。第二,与CJK各区收字的关联度呈不平衡状
80370
8105
10.085
态。其中,所收录汉字占CJK基本汉字的37.386%,CJKExt-A汉字的1.170%,CJKExt-B汉字的0.084%,CJKExt-C汉字的1.061%,CJKExt-D汉字的3.604%,CJKExt-E汉字的1.874%。与CJK基本汉字关联度最高,与CJKExt-B汉字关联度最低。第三,与CJK各区收字总数差别巨大,尚有—25—
补充空间。收字只占CJK及其扩展汉字总数的10.085%,与中、日、韩三国以及其他汉字使用区所使用汉字总量存在巨大差距,补充空间丰厚。
二《通用规范汉字表》笔画统计与分析
用规范汉字表》各笔画统属汉字占《通用规范汉字表》汉字比例,《通用规范汉字表》各画汉字总画数占《通用规范汉字表》汉字总笔画数之比例,《通用规范汉字表》各画汉字数量占《通用规范汉字表》汉字总数之比例排序,《通用规范汉字表》各画笔画数量占《通用规范汉字表》总笔画数之比例排序等数据。
笔者对《通用规范汉字表》收录的8105个汉字,按其总笔画数进行排序、统计,给出《通
表2各笔画统属汉字占《通用规范汉字表》汉字比例笔画统属汉字(个)比例(%)1220.025笔画统属汉字(个)比例(%)163274.035
2160140207
0.2590.7401.7272.5544.5537.551
1718
228121
2.8131.493
34
19202122232425263036合计
9566382615881118105
1.1720.814
567
369612
0.4690.321
89101112131415
777899872862801664496388
9.58711.09210.75910.6359.8838.1926.1204.787
0.1850.0990.0990.0120.0120.012100
—26—
1.按汉字的笔画数从少到多对《通用规范汉字表》收录的8105个汉字排序,统计出《通用规范汉字表》各笔画统属汉字占《通用规范汉字表》汉字的比例(见表2)。
2.按汉字的笔画数从少到多对《通用规范汉字表》收录的8105个汉字排序,统计出《通用规范汉字表》各画汉字总画数占《通用规范汉字表》汉字总笔画数之比例(见表3)。
表3各画汉字总画数占《通用规范汉字表》汉字总笔画数比例笔画1总笔画数(画)2比例(%)0.002笔画16总笔画数(画)5232比例(%)5.916
2
42
0.047
17
387621781805
4.382
34
180
0.204
1819
2.4632.041
560
0.6331.170
5
10352214
20
1320
1.492
67
2.5034.844
2122
798572345
0.9020.647
4284
8
6216
7.028
23
0.3900.2170.2260.0290.0340.041100
9101112131415
8091872094829612863269445820
9.1489.85910.72110.8699.7617.8516.580
2425263036合计
19220026303688444
3.按汉字的笔画数从少到多对《通用规范汉字表》收录的8105个汉字排序,统计出《通用规
范汉字表》各画汉字数量占《通用规范汉字表》汉字总数之比例排序(见表4)。—27—
表4各画汉字数量占《通用规范汉字表》汉字总数之比例排序该画汉字数量及比例排序12345678910111213141516171819202122232425262728笔画91011128137141561617541819203212222324251263036汉字数量89987286280177766461249638836932722820714012195666038262115882111比例(%)11.09210.75910.6359.8839.5878.1927.5516.1204.7874.5534.0352.8132.5541.7271.4931.1720.8140.7400.4690.3210.2590.1850.0990.0990.0250.0120.0120.012
4.按汉字的笔画数从少到多对《通用规范汉字表》收录的8105个汉字排序,统计出《通用规
范汉字表》各画笔画数量占《通用规范汉字表》汉字总笔画数之比例排序(见表5)。
—28—
表5各画笔画数量占《通用规范汉字表》汉字总笔画数之比例排序
排序12345678910111213141516171819202122232425262728
笔画笔画数量121110139148151671761819205212242325243236302619612948287208632809169446216582052324284387622142178180513201035798572560345200192180423630262
该画笔画数量及比例比例(%)10.86910.7219.8599.7619.1487.8517.0286.5805.9164.8444.3822.5032.4632.0411.4921.1700.9020.6470.6330.3900.2260.2170.2040.0470.0410.0340.0290.002多者为36画。在1画至36画中,27-29画、3135画等8个笔画无汉字分布。其中,1-26画汉字呈连续分布状态,27-36画汉字呈断续分布状态。2.《通用规范汉字表》中,各笔画统属汉字数
—29—
以上统计数据揭示了《通用规范汉字表》的一些汉字属性信息。1.《通用规范汉字表》中,各笔画汉字呈连续分布和断续分布两种状态。笔画最少者为1画,最
考意义。GBK标准字符集中,“在1画至48画中,量差别巨大。最少者为26脚、30圆、36幽等3个34画、37画、38画、40-47画等11个笔画无汉字笔画,它们均统属1个汉字。最多者为9画,统属分布。其中,1-33画汉字呈连续分布状态,34-48899个汉字。画汉字呈断续分布状态”[5]。各笔画统属汉字数量3.《通用规范汉字表》中,各画汉字数量占“最少者为35画、36画、39画、48画等4个笔《通用规范汉字表》总汉字数之比例高低悬殊。各画,……最多者为12画,统属1962个汉字”[6]。画汉字数量占《通用规范汉字表》总汉字数之比12画、11画、13画、10画、14画、9画、15画、例,最高为11.092%,最低为0.012%,差异性显8画、16画,“这9个笔画的汉字数为14533个,著。其中,超过5%的有:9画、10画、11画、12占GBK标准字符集总汉字数的69.195%。其他28画、8画、13画、7画、14画。这8个笔画的汉字个笔画的汉字数为6470个,占GBK标准字符集总数为5983个,占《通用规范汉字表》总汉字数的汉字数的30.805%”[7]。12画、15画、13画、1473.819%。其他20个笔画的汉字数为2122个,占《通用规范汉字表》总汉字数的26.181%。画、16画、11画、17画、10画、18画、9画,4.《通用规范汉字表》中,各画笔画数量占“这10个笔画的笔画数为194625画,占GBK标准《通用规范汉字表》总笔画数之比例高低悬殊。各字符集总笔画数的72.193%。其他27个笔画的笔画笔画数量占《通用规范汉字表》总笔画数之比画数为74965画,占GBK标准字符集总笔画数的例,最高为10.869%,最低为0.002%,差异性显27.807%”[8]。12画、11画、13画、10画、14著。其中,超过5%的有:12画、11画、10画、画、9画、15画、16画,“这8个笔画在两个比例13画、9画、14画、8画、15画、16画。这9个上皆高,都超过5%;……其他26个笔画,在这两笔画的笔画数为68749画,占《通用规范汉字表》个比例上,都相对较低”[9]。37个笔画“平均各画总笔画数的77.732%。其他19个笔画的笔画数为统属汉字567个之多。……平均每字画数为12.19695画,占《通用规范汉字表》总笔画数835画”[1°]。这与GBK标准字符集简繁混编的特的22.268%。性有一定关联。5.《通用规范汉字表》中,各画汉字数量、笔画数量占《通用规范汉字表》总汉字数、总笔画[1]中华人民共和国国务院.通用规范汉字表[Z].北京:中华人民共和国国务院,2019-09-22.数之比例较高者,主要集中于少数笔画。从单个笔[2]国务院关于公布《通用规范汉字表》的通知[M]//画看,9画、10画、11画、12画、8画、13画、李行键.《通用规范汉字表》使用手册.北京:人民出14画,这7个笔画在两个比例上皆高,都超过版社,2013.5%;7画、15画、16画,这3个笔画只在其中一
参考文献:
个比例上较高,超过5%。其他18个笔画,在这两个比例上,都相对较低。6.《通用规范汉字表》中,平均各画统属汉字过多,平均每字笔画过繁。28个笔画共分布汉字8105个,平均各画统属汉字289.46个。8105个汉字总画数为88444画,平均每字画数为10.91画。这两种情形与《通用规范汉字表》各画汉字数量占《通用规范汉字表》汉字总数之比例排序的前10位,与《通用规范汉字表》各画笔画数量占《通用规范汉字表》汉字总笔画数之比例排序的前10位,基本呈正相关。仅12画、11画、10画、13画、9画、14画、8画、15画、16画这9个笔画的笔画数就达68749画,占《通用规范汉字表》总笔画数的77.732%。一句话,《通用规范汉字表》中,10画以上的汉字数量太多。值得注意的是,笔者在?GBK标准字符集汉字笔画统计与分析——GBK标准字符集汉字研究之一》(《宁夏大学学报》人文社会科学版2013年第六期)一文中,对GBK标准字符集收录的21003个汉字进行统计,揭示的一些汉字属性,对深入理解《通用规范汉字表》汉字属性,具有参—30—
[3]中华人民共和国国务院.通用规范汉字表:说明[M].通用规范汉字表,2013:7.[4]IS,IRG.CJKUnifiedIdeographsExtensionE[Z].2019-09-22.[5]导夫.GBK标准字符集汉字笔画统计与分析——GBK标准字符集汉字研究之一
[J].宁夏大学学报:人文
社会科学版,2013(6):22-27.[6]导夫.GBK标准字符集汉字笔画统计与分析——GBK标准字符集汉字研究之一
[J].宁夏大学学报:人文
社会科学版,2013(6):22-27.[7]导夫.GBK标准字符集汉字笔画统计与分析~~GBK标准字符集汉字研究之一
[J].宁夏大学学报:人文
社会科学版,2013(6):22-27.[8]导夫.GBK标准字符集汉字笔画统计与分析——GBK标准字符集汉字研究之一[J].宁夏大学学报:人文社会科学版,2013(6):22-27.[9]导夫.GBK标准字符集汉字笔画统计与分析——GBK标准字符集汉字研究之一
[J].宁夏大学学报:人文
社会科学版,2013(6):22-27.[10]导夫.GBK标准字符集汉字笔画统计与分析——GBK标准字符集汉字研究之一
[J].宁夏大学学报:人文
社会科学版,2013(6):22-27.
【责任编校周永军】