阅读文章

汉字编码--未来推动汉字演化的动力

[日期:2008-06-06] 来源:原创  作者:高国鹫 [字体: ]

 

汉字编码—未来推动汉字演化的动力

作者: 高国鹫

 

为了表达汉字,目前主要采用如下三种方法:一是按笔画书写;二是按部首检索;三是按字根编码,这里把上述三种表达汉字的方法,统称为广义汉字输入。

现在已经知道,汉字的演化,是一个求简易、求区别的过程,汉字从诞生时起就伴随着面对自身的简化,那么推动汉字演化的动力是什么?实际就来自这三种广义汉字输入,汉字的演化与输入方法紧密相联的,下面详细论述随着输入方法的改变,看汉字在演化过程中,汉字的结构是怎样发生变化的。

 

   按笔画书写汉字

 

笔画的演化,是一个求简易、求区别的过程,这是指在书写时,笔画的种类和数量要简化,在汉字平面中,笔画的分布要与别的字有所不同。

这是最古老、使用时间最长的汉字表达方式。在最初造字时,字和画很难区分,字作为画,其欣赏价值因人而异,因字而异,喜欢就画,不喜欢就不画,为了能让别人看得懂,字要画得与实物很像,要用很多笔画去描绘,造成汉字结构复杂,这就是甲骨文、金文、篆文等古文字笔画繁而且多的原因。画作为字,不管是否喜欢,也不管是否写得好看,需要时就得写,有时一篇文章要写好多次,否则别人读不懂你表达的是什么意思,但是,如果一件很简单的事情要用很长时间来描画,那么这种文字就没有生命力。

书写难是推动汉字演化的动力,因此,汉字笔画的演化,将直接推动汉字的演化,从而改变汉字的结构,反之,如果笔画的演化不能推动汉字的演化,也就是说因种种原因,汉字的笔画不能改变,那么汉字就要被淘汰,或被其它文字(外来文字)所取代。

汉字笔画的演化,主要是笔画种类和笔画数量的改变,书写难首先表现在笔画种类的繁多,其次是笔画数量的偏大,因此,汉字的演化隶书前主要是笔画种类的简化,汉字由甲骨文、金文、篆文等古文字演化成隶书,这时汉字的笔画种类也逐渐趋于稳定,现代汉字笔画为31种(目前分类还不统一)。

古文字经脱胎换骨演化成隶书,也把笔画多这一原始特征直接带入隶书,因此,隶书以后汉字的演化主要是笔画数量的简化,这个过程一直持续到今天,目前繁体字平均12画以上,简体字平均9画多。有时为了区分,某些字会增加些笔画,但这对汉字总的笔画数量来说,其变化率是微不足道的,而对于目前31种笔画种类,如果只增加一种,其变化率也是很明显的,汉字演化规律决定了不能把目前31种汉字笔画种类,演化成上百个甚至更多新的笔画种类,因为这是把汉字重新引入篆书,因此是行不通的,但增加新笔画种类的个例也不是没有,例如“專”字被简化成了“专”,“言”字作为偏旁被简化成了“讠”,而“专”的第三笔、“讠”的第二笔就是新增加的笔画种类。

 

     按部首检索汉字

 

部首的演化,是一个求简易、求区别的过程,这是指在检索时,部首的种类和结构要简化,在汉字平面中,部首与其它笔画的分布,要与别的字有所不同。

这是对笔画书写的否定,汉字原本可按笔画检字,这与书写方法的一致性理应得到推广,但汉字演化至今,笔画多仍是汉字的基本特征,在最初造字时,并不是沿着笔顺这种线性关系发展的,而是按图形拼凑这种平面关系进行的,因此,汉字按部首检字是一种回归,顺应了汉字的造字法,这比按笔画检字能节省很多时间。

汉字结构复杂,有音序,形序及义序检字法,前两种最常用,对音序检字法,见本文按字音输入汉字的有关章节,形序检字法包括部首、笔画笔形和四角号码等,但部首检字法历史最悠久、应用也最广。

部首由两千年前许慎创建,是最常用的一种检字方法,缺陷是在检字时,既要查部首,又要查笔数,在立部及归部上,目前仍存在歧义性,至今还没有具体的归部原则,不同字典对部的确定也都各不相同。

检字难是推动汉字演化的动力,因此,部首将沿着推动汉字演化的方向,首先自行演化,直到能够推动汉字的演化时为止,最终成为一种辅助性文字,即所谓“部首同字”,例如,部首在汉字结构中的最佳定位是在上、在左、在外框,那么部首检字法应促使汉字沿着这一方向进行演化,从而改变汉字的结构,反之,如果部首的演化不能推动汉字的演化,那么部首就要被淘汰,或被其它方法所取代。

部首检字法在许慎《说文解字》共设立540部,两千多年来,经过对部首的确定、定位、归部等几次大的改良,到1983年制定《汉字统一部首表》共设201部。部首演化至今,仍看不出具有推动汉字演化的动力,因此可以断定,部首检字法最终将被淘汰、或被其它方法所取代。

 

     按字根编码汉字

 

字根的演化,是一个求简易、求区别的过程,这是指在编码时,字根的种类和结构要简化,在汉字平面中,字根与其它笔画的分布,要与别的字有所不同。

这是对部首检字的发展,它们的区别是,部首不能用于计算机汉字编码;而字根可取代部首用于字典检字。

为方便计算机输入汉字,自上世纪七十年代末汉字编码的诞生,无论政府、企业、个人,几乎都对这一新生事物产生了浓厚兴趣,据统计,目前汉字编码总数已达数千种,经过市场筛选,能得到认可的并不多,能推广普及的尚未面世。

对采用什么方法编码并没有严格限制,但要推广使用,那必须按照汉字拆分的有关规定,目前除了笔画之外,主要是采用基础部件编码。

基础部件由字根演化成,字根始创于1982年,但汉字到底有多少种不同的字根,因汉字拆分的方法不一样,得到的字根数就不相同,后来形成一大流派,因有些字根并不好分析,造成“好学的不好用,好用的不好学”现象。为此1997年颁布汉字基础部件标准,对字根拆分方法进行大统一,如果汉字不按基础部件拆分,这种汉字编码国家将不预认可。但基础部件标准的颁布,并没有扼制住人们编码的热情,目前各种编码方案仍在不断涌现。

编码难是推动汉字演化的动力,字根将沿着推动汉字演化的方向,首先自行演化,直到能够推动汉字的演化时为止,最终成为一种辅助性文字,即所谓“码同字”, 反之,如果字根最终演化的结果,不能推动汉字的演化,那么字根就要被淘汰,或被其它方法所取代。

根据目前汉字拆分理论,字根只能演化成基础部件,这虽然有利于统一汉字编码,却不能推动汉字的演化,因此,从汉字编码功能考虑,基础部件最终将被淘汰、或被其它方法所取代已经不可避免。但作为局部使用,因汉字采用基础部件编码,码长比较短,适用于专职打字员和通用字(约7000字)的快速盲打,从这一点考虑,基础部件还要长期存在下去。

汉字根据字源或参考字源的有理据拆分,是制约基础部件演化的直接原因。现在抛开汉字理据,将基础部件按字形继续拆分,那会被拆成一种“符号”。在码长曲线(见笔者的《汉字编码三大定律》)上,汉字拆分由整字过渡到中值点,能产生简便、适于推广普及的汉字编码方案,因此把这种“符号”定位在码长曲线中值点附近,并称为字元,字元与整字平均笔画差值绝对值,比字元与笔画平均笔画差值绝对值要大得多,例如,简化字的平均笔画约9笔,字元的平均笔画约3 笔(由9笔开平方得到),笔画的平均笔画只有1笔,因此,字元与整字相差约6笔,与笔画相差约2笔,二者差值为4笔,由此可知,从笔画组合寻找字元,比从整字拆分寻找字元要简便得多,根据汉字编码演化规律,未来汉字编码发展方向,将会由整字拆分过渡到笔画组合。

笔者在《笔画组合理论与汉语拼形方案》文章中,论述了由笔画组合成的拼形字元,以及由拼形字元编码的《汉语拼形方案》汉字输入法,笔者还会陆续发表文章,详细介绍汉语拼形是否具有推动汉字演化的能力,并成为一种辅助性文字,即“码同字”的。

 

 

     按字音输入汉字

 

汉字不是拼音文字需要标音,最早给汉字标音的是譬况法,譬况法的演化,是一个求简易、求区别的过程,这是指字形逐步向拼音字母(拉丁字母)过渡,字音逐步向统一标准(国际音标)过渡。

我国地域辽阔,南北方温差大,形成多风俗多方言,造成汉字读音复杂,一字多音、一音多字,严重影响到人们的交流和汉语的推广。

标音难是推动汉字演化的动力,因此,譬况法将沿着推动字音演化的方向,首先自行演化,直到能够推动字音的演化时为止,最终成为一种辅助性文字,即所谓“音同字”,反之,如果标音方法的演化不能推动字音的演化,那么这种标音方法就要被淘汰,或被其它方法所取代。

为了给汉字标音,从汉代的譬况法始、经读若法、直音法,反切法、历时两千多年,到民国时期颁布注音字母,目前港澳台仍在应用,中华人民共和国建立以后,开始着手汉语拼音方案的研制,在吸取了三百年来各种拼音方案的优缺点基础上,经过反复论证、修改,终于在一九五八年颁布《汉语拼音方案》。

汉字标音方法最终采用《汉语拼音方案》,该方案具有两个显著特点,一是推动了汉字读音的变化,汉语拼音字母采用国际音标,这已经是将汉字的读音纳入到国际标准;二是成为一种辅助性文字,即所谓“音同字”,汉语拼音除了注音之外,在汉字按音序检索、行业用语略写、音译术语转写、语言文字信息处理、科技代码、速记、人名地名拼写等许多领域都得到了广泛应用,现已从国家标准发展成为拼写汉语的国际标准。

 

     数字键盘输入汉字

 

手机等数字键盘,不但要输入数码,还要输入英文、汉语拼音和汉字形码,因此要进行字母键位的设定,其演化规律也是一个求简易、求区别的过程,这是指输入英文、汉语拼音、汉字形码要简单和通用化,另外还要减少歧义性。

目前数字键盘字母键位的设定,是根据《信息技术 数字键盘汉字输入通用要求》(GBT/ 18031——2000)制定的,并参照了国际标准。采用该标准输入单个字母需要按1——4键不等,因此在输入英文专有名词或词库中没有的词语时要繁琐;在输入汉语拼音时,因重码难以解决而不能直接输入汉语词组,这足以说明目前数字键盘字母键位的设定,存在着严重的缺陷,其简易性和区别性都比较差。随着中国信息产业的深入发展和汉字编码理论的不断完善,用户对文字输入技术会提出更高的标准要求,届时将会直接推动目前数字键盘字母键位设定的演化。

笔者在《数字键盘复码字母键位设定原理》文章中,详细介绍了数字键盘复码字母键位的设定,以及相应输入技术,包括数字英文、数字汉语拼音和数字汉语拼形,这也是目前在文字(包括英文和汉字)输入功能上,唯一接近于计算机字母键盘的数字键盘字母键位的设定,输入单个字母都是两键,可直接输入汉语拼音词组。笔者还会陆续发表文章,详细介绍数字英文、数字汉语拼音和数字汉语拼形是怎样实现“码同字”的。

 

     结论

 

从汉字的演化史看,书写繁难是推动汉字演化的动力,首先是笔画种类的简化,从造字始,经甲骨文、金文、篆文历时数千年,一直延续到隶书。隶书以后,随着社会发展和人们交流的频繁,书写繁难仍是推动汉字演化的动力,主要是笔画数量的简化,历时两千多年一直延续至今。进入信息时代以后,人们由按笔画书写,改用计算机通过汉字编码来完成,书写方法发生了根本性改变,过去因汉字笔画多而制约人们交流的状况,今天基本不复存在,因此,未来推动汉字演化的动力,也将由按笔画书写转化为汉字编码,编码难是推动汉字演化的动力,而汉字编码的演化,也是一个求简易、求区别的过程,这里的简易是指简单易学,区别是指重码要少。

 

《汉字近形编码论文之六》

辽宁省/本溪/高国鹫

E-mailhypx8798@yahoo.cn

200866

 




阅读:
录入:

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:痴庵:王铎

下一篇:关于汉字编码第二次整理探讨
相关文章       汉字  汉字编码三大定律 
本文评论
  汉语的编码何时时能走向国际化呢?   (木屋 ,2008-07-25 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章