阅读文章

汉字编码--未来推动汉字演化的动力

[日期:2008-06-06] 来源:原创  作者:高国鹫 [字体: ]

 

湘潭市工贸中专、工贸学校、湘潭市工业贸易中等专业学校招生简章

温馨提醒:中考成绩出来后,考生一定要第一时间主动与赵老师取得联系并尽快办理入学手续,因为报考人数远远大于招生人数,招满为止,任何一所学校的录取工作都不会因为你分数高就留下名额耐心等你,实际上每年都有很多成绩优秀的考生犹犹豫豫没有及时联系赵老师导致错过升学机会,实在可惜!!!湘潭市工业贸易中等专业学校面向全国招生,可以提前预约登记,具体情况请咨询我校赵红斌老师(13467920032微信同号,请注意点击此处可以直接拨打赵老师手机号码,如遇忙音请先添加赵老师微信并留言!!!)

汉字编码—未来推动汉字演化的动力

作者: 高国鹫

 

为了表达汉字,目前主要采用如下三种方法:一是按笔画书写;二是按部首检索;三是按字根编码,这里把上述三种表达汉字的方法,统称为广义汉字输入。

现在已经知道,汉字的演化,是一个求简易、求区别的过程,汉字从诞生时起就伴随着面对自身的简化,那么推动汉字演化的动力是什么?实际就来自这三种广义汉字输入,汉字的演化与输入方法紧密相联的,下面详细论述随着输入方法的改变,看汉字在演化过程中,汉字的结构是怎样发生变化的。

 

   按笔画书写汉字

 

笔画的演化,是一个求简易、求区别的过程,这是指在书写时,笔画的种类和数量要简化,在汉字平面中,笔画的分布要与别的字有所不同。

这是最古老、使用时间最长的汉字表达方式。在最初造字时,字和画很难区分,字作为画,其欣赏价值因人而异,因字而异,喜欢就画,不喜欢就不画,为了能让别人看得懂,字要画得与实物很像,要用很多笔画去描绘,造成汉字结构复杂,这就是甲骨文、金文、篆文等古文字笔画繁而且多的原因。画作为字,不管是否喜欢,也不管是否写得好看,需要时就得写,有时一篇文章要写好多次,否则别人读不懂你表达的是什么意思,但是,如果一件很简单的事情要用很长时间来描画,那么这种文字就没有生命力。

书写难是推动汉字演化的动力,因此,汉字笔画的演化,将直接推动汉字的演化,从而改变汉字的结构,反之,如果笔画的演化不能推动汉字的演化,也就是说因种种原因,汉字的笔画不能改变,那么汉字就要被淘汰,或被其它文字(外来文字)所取代。

汉字笔画的演化,主要是笔画种类和笔画数量的改变,书写难首先表现在笔画种类的繁多,其次是笔画数量的偏大,因此,汉字的演化隶书前主要是笔画种类的简化,汉字由甲骨文、金文、篆文等古文字演化成隶书,这时汉字的笔画种类也逐渐趋于稳定,现代汉字笔画为31种(目前分类还不统一)。

古文字经脱胎换骨演化成隶书,也把笔画多这一原始特征直接带入隶书,因此,隶书以后汉字的演化主要是笔画数量的简化,这个过程一直持续到今天,目前繁体字平均12画以上,简体字平均9画多。有时为了区分,某些字会增加些笔画,但这对汉字总的笔画数量来说,其变化率是微不足道的,而对于目前31种笔画种类,如果只增加一种,其变化率也是很明显的,汉字演化规律决定了不能把目前31种汉字笔画种类,演化成上百个甚至更多新的笔画种类,因为这是把汉字重新引入篆书,因此是行不通的,但增加新笔画种类的个例也不是没有,例如“專”字被简化成了“专”,“言”字作为偏旁被简化成了“讠”,而“专”的第三笔、“讠”的第二笔就是新增加的笔画种类。

 

     按部首检索汉字

 

部首的演化,是一个求简易、求区别的过程,这是指在检索时,部首的种类和结构要简化,在汉字平面中,部首与其它笔画的分布,要与别的字有所不同。

这是对笔画书写的否定,汉字原本可按笔画检字,这与书写方法的一致性理应得到推广,但汉字演化至今,笔画多仍是汉字的基本特征,在最初造字时,并不是沿着笔顺这种线性关系发展的,而是按图形拼凑这种平面关系进行的,因此,汉字按部首检字是一种回归,顺应了汉字的造字法,这比按笔画检字能节省很多时间。

汉字结构复杂,有音序,形序及义序检字法,前两种最常用,对音序检字法,见本文按字音输入汉字的有关章节,形序检字法包括部首、笔画笔形和四角号码等,但部首检字法历史最悠久、应用也最广。

部首由两千年前许慎创建,是最常用的一种检字方法,缺陷是在检字时,既要查部首,又要查笔数,在立部及归部上,目前仍存在歧义性,至今还没有具体的归部原则,不同字典对部的确定也都各不相同。

检字难是推动汉字演化的动力,因此,部首将沿着推动汉字演化的方向,首先自行演化,直到能够推动汉字的演化时为止,最终成为一种辅助性文字,即所谓“部首同字”,例如,部首在汉字结构中的最佳定位是在上、在左、在外框,那么部首检字法应促使汉字沿着这一方向进行演化,从而改变汉字的结构,反之,如果部首的演化不能推动汉字的演化,那么部首就要被淘汰,或被其它方法所取代。

部首检字法在许慎《说文解字》共设立540部,两千多年来,经过对部首的确定、定位、归部等几次大的改良,到1983年制定《汉字统一部首表》共设201部。部首演化至今,仍看不出具有推动汉字演化的动力,因此可以断定,部首检字法最终将被淘汰、或被其它方法所取代。

 

     按字根编码汉字

 

字根的演化,是一个求简易、求区别的过程,这是指在编码时,字根的种类和结构要简化,在汉字平面中,字根与其它笔画的分布,要与别的字有所不同。

这是对部首检字的发展,它们的区别是,部首不能用于计算机汉字编码;而字根可取代部首用于字典检字。

为方便计算机输入汉字,自上世纪七十年代末汉字编码的诞生,无论政府、企业、个人,几乎都对这一新生事物产生了浓厚兴趣,据统计,目前汉字编码总数已达数千种,经过市场筛选,能得到认可的并不多,能推广普及的尚未面世。

对采用什么方法编码并没有严格限制,但要推广使用,那必须按照汉字拆分的有关规定,目前除了笔画之外,主要是采用基础部件编码。

基础部件由字根演化成,字根始创于1982年,但汉字到底有多少种不同的字根,因汉字拆分的方法不一样,得到的字根数就不相同,后来形成一大流派,因有些字根并不好分析,造成“好学的不好用,好用的不好学”现象。为此1997年颁布汉字基础部件标准,对字根拆分方法进行大统一,如果汉字不按基础部件拆分,这种汉字编码国家将不预认可。但基础部件标准的颁布,并没有扼制住人们编码的热情,目前各种编码方案仍在不断涌现。

编码难是推动汉字演化的动力,字根将沿着推动汉字演化的方向,首先自行演化,直到能够推动汉字的演化时为止,最终成为一种辅助性文字,即所谓“码同字”, 反之,如果字根最终演化的结果,不能推动汉字的演化,那么字根就要被淘汰,或被其它方法所取代。

根据目前汉字拆分理论,字根只能演化成基础部件,这虽然有利于统一汉字编码,却不能推动汉字的演化,因此,从汉字编码功能考虑,基础部件最终将被淘汰、或被其它方法所取代已经不可避免。但作为局部使用,因汉字采用基础部件编码,码长比较短,适用于专职打字员和通用字(约7000字)的快速盲打,从这一点考虑,基础部件还要长期存在下去。

汉字根据字源或参考字源的有理据拆分,是制约基础部件演化的直接原因。现在抛开汉字理据,将基础部件按字形继续拆分,那会被拆成一种“符号”。在码长曲线(见笔者的《汉字编码三大定律》)上,汉字拆分由整字过渡到中值点,能产生简便、适于推广普及的汉字编码方案,因此把这种“符号”定位在码长曲线中值点附近,并称为字元,字元与整字平均笔画差值绝对值,比字元与笔画平均笔画差值绝对值要大得多,例如,简化字的平均笔画约9笔,字元的平均笔画约3 笔(由9笔开平方得到),笔画的平均笔画只有1笔,因此,字元与整字相差约6笔,与笔画相差约2笔,二者差值为4笔,由此可知,从笔画组合寻找字元,比从整字拆分寻找字元要简便得多,根据汉字编码演化规律,未来汉字编码发展方向,将会由整字拆分过渡到笔画组合。

笔者在《笔画组合理论与汉语拼形方案》文章中,论述了由笔画组合成的拼形字元,以及由拼形字元编码的《汉语拼形方案》汉字输入法,笔者还会陆续发表文章,详细介绍汉语拼形是否具有推动汉字演化的能力,并成为一种辅助性文字,即“码同字”的。

 

 

     按字音输入汉字

 

汉字不是拼音文字需要标音,最早给汉字标音的是譬况法,譬况法的演化,是一个求简易、求区别的过程,这是指字形逐步向拼音字母(拉丁字母)过渡,字音逐步向统一标准(国际音标)过渡。

我国地域辽阔,南北方温差大,形成多风俗多方言,造成汉字读音复杂,一字多音、一音多字,严重影响到人们的交流和汉语的推广。

标音难是推动汉字演化的动力,因此,譬况法将沿着推动字音演化的方向,首先自行演化,直到能够推动字音的演化时为止,最终成为一种辅助性文字,即所谓“音同字”,反之,如果标音方法的演化不能推动字音的演化,那么这种标音方法就要被淘汰,或被其它方法所取代。

为了给汉字标音,从汉代的譬况法始、经读若法、直音法,反切法、历时两千多年,到民国时期颁布注音字母,目前港澳台仍在应用,中华人民共和国建立以后,开始着手汉语拼音方案的研制,在吸取了三百年来各种拼音方案的优缺点基础上,经过反复论证、修改,终于在一九五八年颁布《汉语拼音方案》。

汉字标音方法最终采用《汉语拼音方案》,该方案具有两个显著特点,一是推动了汉字读音的变化,汉语拼音字母采用国际音标,这已经是将汉字的读音纳入到国际标准;二是成为一种辅助性文字,即所谓“音同字”,汉语拼音除了注音之外,在汉字按音序检索、行业用语略写、音译术语转写、语言文字信息处理、科技代码、速记、人名地名拼写等许多领域都得到了广泛应用,现已从国家标准发展成为拼写汉语的国际标准。

 

     数字键盘输入汉字

 

手机等数字键盘,不但要输入数码,还要输入英文、汉语拼音和汉字形码,因此要进行字母键位的设定,其演化规律也是一个求简易、求区别的过程,这是指输入英文、汉语拼音、汉字形码要简单和通用化,另外还要减少歧义性。

目前数字键盘字母键位的设定,是根据《信息技术 数字键盘汉字输入通用要求》(GBT/ 18031——2000)制定的,并参照了国际标准。采用该标准输入单个字母需要按1——4键不等,因此在输入英文专有名词或词库中没有的词语时要繁琐;在输入汉语拼音时,因重码难以解决而不能直接输入汉语词组,这足以说明目前数字键盘字母键位的设定,存在着严重的缺陷,其简易性和区别性都比较差。随着中国信息产业的深入发展和汉字编码理论的不断完善,用户对文字输入技术会提出更高的标准要求,届时将会直接推动目前数字键盘字母键位设定的演化。

笔者在《数字键盘复码字母键位设定原理》文章中,详细介绍了数字键盘复码字母键位的设定,以及相应输入技术,包括数字英文、数字汉语拼音和数字汉语拼形,这也是目前在文字(包括英文和汉字)输入功能上,唯一接近于计算机字母键盘的数字键盘字母键位的设定,输入单个字母都是两键,可直接输入汉语拼音词组。笔者还会陆续发表文章,详细介绍数字英文、数字汉语拼音和数字汉语拼形是怎样实现“码同字”的。

 

     结论

 

从汉字的演化史看,书写繁难是推动汉字演化的动力,首先是笔画种类的简化,从造字始,经甲骨文、金文、篆文历时数千年,一直延续到隶书。隶书以后,随着社会发展和人们交流的频繁,书写繁难仍是推动汉字演化的动力,主要是笔画数量的简化,历时两千多年一直延续至今。进入信息时代以后,人们由按笔画书写,改用计算机通过汉字编码来完成,书写方法发生了根本性改变,过去因汉字笔画多而制约人们交流的状况,今天基本不复存在,因此,未来推动汉字演化的动力,也将由按笔画书写转化为汉字编码,编码难是推动汉字演化的动力,而汉字编码的演化,也是一个求简易、求区别的过程,这里的简易是指简单易学,区别是指重码要少。

 

《汉字近形编码论文之六》

辽宁省/本溪/高国鹫

E-mailhypx8798@yahoo.cn

200866

 




阅读:
录入:

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:痴庵:王铎

下一篇:关于汉字编码第二次整理探讨
相关文章       汉字  汉字编码三大定律 
本文评论
  汉语的编码何时时能走向国际化呢?   (木屋 ,2008-07-25 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章