湘潭市工贸中专,湘潭职校,湘潭中专,湘潭市工业贸易中等专业学校,湘潭工贸学校,湘潭市一职,学校简介,招生简章,入学指南

附录

关于制订《汉字部件规范》的若干问题

《汉字部件规范》研制组

  

一、制订规范的意义

随着计算机应用的日渐广泛及计算机教育在中小学和高校的逐渐普及,汉字信息处理已经成为当前十分重要的课题。它既关系到使用汉字传播信息的速度与质量,又关系到教育手段的更新,对识字教学的科学性也有直接的影响。而字形处理在汉字信息处理中既是关键问题,也是难点问题。

  汉字是由不同数量、不同功能的部件依照不同的结构方式组合而成的。部件的数量、功能和组合方式(位置、置向、交接法)是每个汉字区别于其他汉字最重要的属性。汉字的信息量主要由部件及其组合来体现。将组成汉字的部件拆分出来是汉字字形处理中首要的基础工作,也正是由于它的重要性,以致于人们在相当长的时期内,在不同地区、不同信息处理系统中自发地进行了这一工作,计算机形码的编制出现了万“码”奔腾的局面,部件拆分的不规范现象也逐年增多。这种状况既不利于计算机的应用,又不利于语言文字的统一规范,同时也给计算机教育和识字教育造成了很大的困难。

  尽快制订出汉字部件规范,不但可以解决存在的上述问题,而且有利于普及科学的汉字知识,增强全社会的语言文字规范意识,其意义非常重大。

 

二、制订规范的可行性

1)规范性是评价汉字编码及其他信息处理系统的重要标准,也是使用者,特别是中小学教育界的使用者,选择输入系统的首要条件。过去由于缺乏部件规范,使编码的制订者和计算机的使用者缺乏衡量与选择的标准,造成了很多混乱。因此,制订规范已经成为大家共同的要求,具有广泛的社会基础。

2)在有关GB13000.1字符集的字形规范、笔顺规范、基本术语规范等相关的规范中,有的已经制订,有的正与部件规范同步制订,这些都为部件规范的制订工作打下了良好的基础。

3)进入90年代以来,有关计算机编码技术和汉字构形规律的理论研究已取得了实用性成果,使部件规范的制订具有科学的理论依据。

4GB13000.1大字符集中的西文操作系统和汉字部件自动拆分软件及其他软件工具的研制成功,使研究、制订部件规范有了高效可靠的技术手段。

5)信息处理界与语言文字学界的长期合作,促进了彼此的交流、沟通与理解,使制订部件规范所需要的学科交叉和理论交融有了比较成熟的条件,也为部件规范的制订准备了具有合作精神的专家队伍和专业人员。

从以上几点可以看出,部件规范的制订条件已经成熟,具有可行性。同时,这也是国家语委向《汉字部件规范》研制组(参加单位有北京语言文化大学、北京信息工程学院和上海交通大学)下达研制任务的主要依据。

 

三、制订规范的基本原则

中文信息处理用汉字部件规范必须在两个方面具有严密的科学性。首先,必须符合汉字构形规律;其次,必须在部件的信息量和系统性上符合信息处理的需要。只有在这两方面是科学的,才能避免在部件规范形成中易出现的主观随意性,使最终成果既具有规范意义,又具有应用价值。

部件规范所确立的是用以衡量中文信息处理工作规范性的基础部件及其使用规则。它在拆分下限和拆分与归纳原则上应有严格的限定性;而用于编码设计时应在不违背规范的基础上,给出自由创造的余地。这两方面应在《基础部件表》和使用规则中体现。

为保证部件拆分与归纳的科学性,必须在理论上和实际操作中处理好汉字形体与理据的关系、历史与现实的关系、普遍规律与特殊情况的关系。研制组对上述三种关系的基本认识是:我们所要处理的汉字是现代汉字,因此,必须从现代汉字的实际出发。但是,现代汉字是从历史汉字传承而来的,当现代汉字的之形规律不够清晰时,必须参考历史,从字源上更深入地了解其构形规律。汉字属表意文字,其中相当一部分现代汉字的构形是可以分析理据的,另有一部分在参考字源后,仍可追溯其理据。在这两部分汉字中,理与形是一致的,从理也就是从形。只有少部分现代汉字的理据不能直接分析,追溯历史后,理与形仍产生矛盾。当处理这些汉字时,应从现代汉字的实际出发,从形不从理。从总体看,汉字的构形是有规律的,又是成系统的。但是,由于现代汉字是变动不定的开放系统,GB13000字符集中的汉字又有一部分是日、韩专用汉字,必然会有游离于系统之外的特殊情况。对这些特殊情况进行处理时,应尽量选择既不违背实际情况又适应总体系统的最佳方案。

正是基于以上认识而形成了制订部件规范的基本原则,即“从形出发,尊重理据,立足现代,参考历史”。

 

四、汉字构形原理及相关的概念术语

1.汉字结构分析

1)结构理据

根据字源或参考字源,从汉字的部件组合中分析出的造字意图称结构理据。

例如:“旦”的理据是像太阳(日)从地平线(一)升起。“架”的理据 是从“木”、“加”声。

现代汉字中有一部分无法直接分析造字意图,或形体与字源发生矛盾而无法参考字源分析理据。

2)结构层次

汉字按理据由多个部件组合时,大部分是依层次进行的。在每个层次中,一般为两部件组合。少部分为一次性多部件平面组合。

例如:“蓓”、“蕾”为多层次组合,各层均为两部件。

 

2.部件拆分

将汉字拆分为部件称部件拆分。

1)拆分根据

指将汉字拆分为部件的理论或现实根据。根据结构理据所进行的部件拆分,称有理据拆分;当无法分析理据或理据与字形发生矛盾时,依照字形所进行的部件拆分,称无理据拆分。

2)拆分程序

指将汉字拆分为部件的次序。对层次结构的汉字递次进行有理据拆分,称层次拆分;对平面结构的汉字进行一次性的有理据拆分或无理据拆分,称平面拆分。

3)过渡部件

进行汉字层次拆分时,在完成最后一步拆分之前所拆分出的合成部件,称过渡部件。

3.部件归纳

将部件归纳成组的工作称部件归纳。部件归纳分同形部件归纳、主形与变体的归纳和形似部件归纳三方面。

1)同形部件

形体完全相同的部件,不论其意源是否相同,均称同形部件。

2)主形部件

在各组中具有代表和称说其他部件作用的领先部件称主形部件。

3)变体部件

与主形意源相同、形体略有差异的部件称变体部件。常见的变体部件有:

因部位不同或组合方式不同而书写发生变异的变体部件。例如:“爪”,在上方写作“爫”;“川”在下方写作“”,在中间写作“巛”。(“甾”的“巛”,难道是“中间”?)

在组字时省减某些部件或笔画而与主形功能仍然相同的变体部件。例如:“衣”与“”;“豕”与“”。(“畏”的下面怎么办?)

在组字时重加某地部件或笔画而与主形功能仍然相同的变体部件。例如:“长”与“”。

放置方向不同而与主形功能相同的变体部件。例如:“八”与“丷”。

4)形似部件

与主形部件形体相似,而意、源不同的部件称形似部件。例如:“子”与“孑”、“孓”。

5)部件组

综合考虑部件之间的形、意、源关系,将主形、变体和形似部件归纳在一起所形成的组合称部件组。部件组是部件系统中最基本的组合。

 

五、部件拆分的原则

1.不违背形体的原则

1)交重不拆(交轻可拆吗?)

例如:“串”不拆分为“中”、“中”;“东”不拆分为“七”、“小”。

2)相离相接可拆

例如:“明”拆分为“日”、“月”(相离);“名”拆分为“夕”、“口”(相接);“韭”拆分为“非”、“一”(相接)。

3)极少数不影响结构和笔数的笔画搭挂,按相接处理。

例如:“孝”为“子”搭挂在“耂”上,可拆出。

2.遵照结构规律的原则

1)字形合乎理据的,进行有理据拆分。无法分析理据或形源矛盾的,依形进行无理据拆分。

例如:“分”拆分为“八”、“刀”(根据理据,有理据拆分);“赤”拆分为“土”、“”(参考字源,有理据拆分);“亦”拆分为“亠”、“”(无法分析理据,无理据拆分);“虎”拆分为“虍”、“几”(形源矛盾,无理据拆分)。

2)在进行多部件的有理据拆时,应依汉字组合层次进行。

例如:“蓓”的第一次拆分为“艹”、“倍”、第二次拆分为“艹”、“亻”、“咅”第三次拆分为“艹”、“亻”、“立”、“口”。

3.相关对应的原则

1)有对应关系的简化部件与繁体部件一般应统一处理。

例如:“讠”与“言”(简体不拆,繁体也不拆分。)

2)主形与变体,尽量统一处理。

例如:变体“肉”与主形“月”均不拆分。

4.合理控制下限的原则

1)两个以上的相离、相接部分,若其中任一个无构其他字的能力,则不再拆分。

例如:“西”不拆为“一”、“”(“”无构其他字能力);“黑”不拆分为“”、“灬”(“”无构其他字能力)。

2)两个相离的对称部分,不分开用以构字的,不再拆分。

例如:“兆”、“竹”、“非”不再拆分。

3)传统独体字和部首,以及构字能力较强或拆分后均为非字部件的,叫有相离或相接部分,不再拆分。

例如:“石”不拆分为“丆”、“口”;“禾”不拆分为“丿”、“木”。

4)拆分出的部件中,有一个是单笔画的,一般应为有理据拆分。

例如:“太”拆分为“大”、“丶”;“生”拆分为“丿”、“”;“犬”拆分为“大”、“丶”;“自”拆分为“丿”、“目”。

5)最末一次拆分,不可拆分成两个以上的单笔画。

例如:“刀”不拆为“”、“丿”;“刂”不拆为“丨”、“”;“川”不拆成“丿”、“丨”、“丨”;“”、“氵”均不再三分;“”、“灬”均不再四分。

5.综合衡量的规则

以上规则无法兼顾时,应权衡其利弊,综合处理。

 

六、部件归纳的原则

1.按形归纳的原则

1)处在不同部位、大小不同的同形部件,均归纳为一个,不再分立。

例如:

2)笔画变异的同一部件,变异的笔画与原笔画同类者,归类为不分立的部件;笔画不同不同类者,按变体归纳。

例如:“火”作左面偏旁时,捺改写为点,不再分立;“王”作左面偏旁时,横改写为提,不再分立;“木”中间一笔或为竖,或为竖钩,不再分立。

3)意、源虽相同,但形体差异较大的部件,分立为不同部件。

例如:“火”与“灬”分立;“水”与“氵”分立;“手”与“扌”分立;“心”与“忄”分立。

2.兼顾传统的原则

1)传统独体字作部首时,因部位不同而写法相异,除形体差异较大者外,一般按主形与变体归纳。

例如:“示”(主形)与“礻”(变体);“金”(主形)与“钅”(变体);“食”(主形)与“饣”(变体);“衣”(主形)与“衤”(变体)。

2)将意源不同的同形部件归纳为同一部件时,用不同的例字提示其部位与来源的差别。

例如:“口”的例字,“吐”、“扣”、“司”、“占”中“口”源于口舌之口;“吊”中之口为讹变之形;“高”、“兽”、“豆”中之“口”源于象形号。

“厶”的例字,“私”、“公”中的“厶”同源不同部位;“丢”、“允”、“勾”、“牟”中的“厶”均为不同位、不同源的同形部件。

3.简化部件系统的原则

1)有对应关系的简体与繁体部件,按主形与变体归纳。

例如:“贝”与“”。

2)组字字数极少的罕用部件,尽量避免单独成组。

例如:“孑”、“孓”依形归入“子”组。

3)日、韩方提出的汉字的部件,不论归在哪组,均以“*”标识。

4.优选主形的原则

1)非字部件与成之部件之间,以成字部件为主形。

例如:“八”(主形)与“丷”(变体);“文”(主形)与“攵”(变体)。

2)繁体部件与简体部件之间,以简体部件为主形。

例如:“见”(主形)与“”。

3)上述两个条件无差别时,以组字能力较高、便于称谓的部件为主形。

例如:“土”(主形)与“士”(形似部件);“子”(主形)与“孑”、“孓”(形似部件);“人”(主形)与“入”(形似部件)。

 

七、《汉字基础部件表》的使用规则

1.基础部件不再拆分的规则

1)《汉字基础部件表》中的部件均为基础部件,不得再行拆分。

例如:“非”不得再拆分为左、右两部分;“矛”不得再拆分为“”与“”。

2)《汉字基础部件表》中的部件没有包容关系,不得将大部件拆分后归入小部件。

例如:“疒”不是“广”与“冫”的组合,不得再拆分为“广”和“冫”;“广”不是“厂”与“丶”的组合,不得再拆分为“厂”和“丶”。

2.基础部件可以组合的规则

《汉字基础部件表》中的基础部件可组合成字部件使用,但不得组合出非字部件使用。

例如:可用“”、“由”、“八”组合成“黄”,作为部件使用;可用“自”、“田”、 “丌”组合成“鼻”,作为部件使用;不得用“”、“由”组合成“”,作为部件使用;不得用“自”、“田”组合成“”,作为部件使用。

 

 

文载《计算机世界》1998427

 

 

 

下册

井田汉字,独一无二的汉字结体构形理论,科学地解决数码时代汉字所面临的问题。

湘ICP备05008125  语言文字网  2003-2013©版权所有