一说到关于汉字一共有多少个?和一些现在大约有多少汉字拼音这样的相关题,总是能引起不少的讨论关注度,那么今天小编为大家带来解。
我们聊了很多生僻字,有些是特殊字,有些是某些汉字的特殊写法。人们常说常用汉字只有3000个,但有些汉字却可以有多种写法。
那么汉字一共有多少个呢?今天我们就来讨论一下这个题。
一
自古以来的汉字数字
中国有五千年的历史,汉字的历史更是悠久,以至于很难说清楚有多少个汉字。
据学者考证,甲骨文、金文上的汉字约有5000个,其中已知含义的约有3000个。
我国第一部词典《说文解字》收录汉字9353个。
北宋的《类编》收录汉字33190个,清代的《康熙字典》收录汉字46933个,是古代汉字数量最多的字典。
《汉语词典》收录词语5.6万余条,2020年发布的最新版《新华词典》收录词语1.3万余词。
不要对这些数字感到惊讶。《现代汉语常用汉字表》只列出了3500个汉字,但根据《汉语生存状况报告》,常用汉字有2394个,占了语言空间的99%。
就拿所谓常用汉字之一的邦中华书法为例,我小时候家里就有这本书,但妈妈强迫我练,我很不愿意练。这本字帖有2500字长。
2
不同编码标准产生的题
在计算机普及和数字时代到来之前,只有字典可以作为汉字计数的标准。
然而,数字时代到来后,中国政府开始定期收集词典以外的汉字统计数据,并将其编入国家标准文件。
中国大陆第一个标准于1980年制定,名为GB2312,是汉字信息交换的国家代码,在中国大陆广泛使用。新加坡等地区也使用这种编码。
台湾于1983年开始使用著名的“BigFive”,又称big5字体。
这两个标准深深地伤害了前几代电脑玩家的心。在很多王国奇侠迷的心中,曹操还有一个名字——“成为巨人”。
其实,这就是大五码中的“曹操”二字。由于缺乏标准,台湾制作的在大陆电脑上玩时会显示奇怪的名称。
为了解决这个题,当时有辅助软件提供了文本编码选择,使得部分汉字能够正确显示。
为了解决这个题,韩中日联合研究小组于1993年5月正式成立了CJK,同年,标准化组织公布了10646,韩国也将其作为标准,制定了GB130001。-93。
三
汉字数字粗略指南
为什么汉字国家标准不是中国自己制定的,而是上制定的?尽管汉字是中国特有的文字,但使用汉字的国家并不限于中国。
最有代表性的是日本、韩国、越南,它们的文字有时被称为“汉字”,在写法、读音、义上都具有鲜明的汉字特征。
“Mi”字被选为2020年日本年度汉字
因此,ISO字库的来源也包括这些国家,此外,国外还有大量的古汉字书籍和文献,每个国家都有自己的汉字文化研究所或与国内汉字研究所合作。还定期向ISO报告新汉字。
值得注意的是,时至今日,沿用的是根据汉字标准建立国内汉字集的做法。
这也为所谓的“汉字总数”提供了一个粗略的参考标准。
此外,韩国于2012年启动了“汉字数据库”项目,目标是对总计约50万个汉字进行编码,其中汉字30万个,少数民族文字10万个,甲骨文等稀有古文字10万个。
4
汉字数字的发展
这50万汉字已经涵盖了历史上所有的汉字。然而,这个数字不太可能增加。
我们常说语言是“常识”,在这一点上,汉字是相似的。例如,2020年发布的iso10646扩展字符集g已经包含了闽语bing。
此外,化工行业还出现了新的汉字。2017年5月9日,新化学元素中文名称公布,两个新字“——”纳入国家标准。
这些汉字将成为现在和未来在线和数字通信的基石。
5
汉字输入题
然而,随着汉字数量的增加,我们面临着新的题。这么多汉字怎么输入?
例如,我们通常使用拼音输入法。汉语拼音有300多个读音,在GB2312时代,总共有6000多个字符,但当你输入一个读音时,对应的汉字数量平均只有20到30个。
根据输入法每行显示10个候选字符计算,翻页两三遍就可以找到你要输入的汉字。
然而,如今汉字数量已达到9万多个,平均每个读音的候选汉字数量为300页。
我是否需要翻页300次才能找到我要输入的特定汉字?
我们都遇到过这样的题我用拼音输入法找某个单词,一直滚动也找不到,如果再详细查找,可能要花几分钟才能找到。类型。单词。
不用担心。已经有很好的解决办法了。我们稍后会寻找机会讨论这个题。
结尾
我的扫帚禅
汉字文化博大精深,
常用汉字不到3000个。
《新华字典》收录了大约8000个汉字。
如今的电脑、手机等终端;
大约可显示3万个汉字。
2005年国家标准GB18030-2005,
包含汉字7万多个。
最新标准10646,
包含汉字九万多个。
不管有多少个汉字
如果无法识别并且无法在计算机上输入,
所有这些汉字文化都消失了。
我们的工作就是与您合作。
探索汉字文化。
欢迎关注通知。我是一把扫帚。
消失文字女真文、契丹文、突厥文、八霸蒙古文、利特文、哈啰文、吐火罗文、西夏文、玉真文。
1.余震文字
女真文字是金代女真人创造的文字。据《秦史》记载,秦皇阿古太祖命完颜续人仿契丹文字和汉字创制女真文字。天福三年颁布《女真达子》。秦僖宗元年,一个新人物诞生,名叫“女真小子”。继承女真小字的女真字主要是类似于方体汉字的单字。
2、契丹
契丹文字是辽代契丹人参照汉字而创造的记录契丹语的文字,是汉字的衍生体,在契丹建立的辽国具有隶书的地位人们。有两种类型大字和小字。大字母和小字母都有含义和语音成分,小字母比大字母有更多的语音成分。尽管大小字母都没有被完全破译,但小字母的研究比大字母更多。
明昌帝二年,张宗下令废止契丹文字。
3.突厥语
突厥文字是7世纪至10世纪突厥人、维吾尔人、东人等民族使用的拼音文字。也称为鄂尔浑-叶尼塞文字和突厥符文文字。目前流经鄂尔浑河流域、叶尼塞河流域以及中国新疆、甘肃省部分地区。各种突厥文字中使用的字母数量在外观上也各不相同,一般认为有38至40个字母。大多数源自阿拉姆语字母,有一些来自突厥部落或部落符号,还有一些是表意符号。
4.西夏
西夏文字,又称河西文字、范文、唐古特文字,是记载西夏党项人语言的文字。它属于表意文字系统,汉藏语系的强势语支。西夏人的语言已灭绝,与现代羌语、木雅语关系最为密切。大庆元年,西夏敬宗李元昊命宰相耶利仁荣制作。历时三年完成,总字数5000多个,形状方正,笔画复杂,结构模仿汉字,但又具有自己独特的特点。
它在西夏王朝管辖的宁夏、甘肃、陕西北部、内蒙古南部等广大地域流行了约两个世纪。元明时期,在部分地区仍流传约三个世纪。西夏文字专家李凡文认为,西夏文字总数为5917个,但实际上有意义的文字有5857个。
5.帕帕蒙古语
它是元代忽必烈统治时期由“国名”帕斯巴创造的蒙古文字,在上被称为“帕斯巴新蒙古字母”,并通过它的创造和传播,提升了蒙古文的文明进程。蒙古社会发展到一定程度。元帝国灭亡后,八丝巴文逐渐被废弃,成为死文。
No Comment