湘潭市工贸中专,湘潭职校,湘潭中专,湘潭市工业贸易中等专业学校,湘潭工贸学校,湘潭市一职,学校简介,招生简章,入学指南

汉字输入技术与应用研讨会论文集

 

电脑、汉字、文化


——汉字输入法的理论初探

  

王尧世

 

 

【摘  要】一国之文化,是国民生活经验和智慧之累积,其载体主要为文字,所以文化和文字,两者相互依存,谁也少不了谁。
中国的汉字,承载着中国的文化,更蕴含着中华民族的智慧。象形和形声,是其中的特色和精华。没有象形和形声的特色,汉字的优点便荡然无存,中国的文化将随之动摇。
电脑的出现,为信息传播技术开创了崭新的模式,创造了空前的效率。而信息的载体,仍必须以文字为主。所以文字处理技术〔即汉字输入〕是信息处理技术的重要组成部份〔基础〕。
汉字输入方法,牵涉到方方面面。例如:汉字的特性、使用的工具、应用的范围和使用者的学习能力等等。本文试图从這四个角度,对现况进行观察分析,并提出解决问题的明确主张。

 

1.汉字输入与中国文化

 

中文汉字是成熟优美的文字。中国在历史上的点点滴滴,都用它来记载;我们在生活中的方方面面,都用它来描写。没有汉字,便没有中国文化。

中国文化的发展,受汉字的影响很大。而汉字的发展,又直接受着书写和印刷工具的影响。所以一个时代的文字书写和传播工具的改变,深刻的影响着〔实际上就是推动〕那一个时代文化的发展。

从二十世纪末叶开始,中国和世界一起进入电脑信息科技时代,人类文化的发展又走到了一个新的转捩点。我们手中的笔,将逐渐走入历史,按键将成为输入文字的主要方法。电脑将成为新的文房四宝。汉字输入电脑,是中国文化和西方科技接轨的基础,电脑中的汉字输入方法,对未来中国新文化的发展,必然会产生决定性的影响!

 

2.汉字输入问题的分析

 

随着电脑的普及,使用电脑的人口,年龄层不断扩大。对于各种不同年龄层次的使用者,在汉字输入上各有不同的问题。

2.1. 对于中老年人:

问题之一:用字形,要背要记的太多、想记记不住。

问题之二:用拼音,年轻时没有学过,或已经忘记。

在字形与拼音两头都够不着的情形之下,许多中老年人,虽然满心想学、想用电脑,也只好望着电脑兴叹。大量有丰富知识和经验的社会精英,被排拒在电脑门外。

2.2. 对于青少年人:

问题之一:用字形,要背要记的太多、想想也害怕。

问题之二:用拼音,看似没有问题,实际问题多多。

青少年人虽然拼音能力强,但有汉字特性和自身条件的限制。

①在汉字特性方面:汉字天生的“字多音少”,同音字或词都十分严重。无论使用那一种智能拼音,在理论与实际上都难以克服选字的麻烦。

②在自身条件方面:青少年人虽然拼音熟练,但认识的字数有限。电脑中不会读的字太多,用拼音根本无法输入,用字范围只能在自己认识的圈子里打转。一旦遇到自己不会读的字,谁也不敢说汉字输入“没有问题”。

 

3. 汉字输入理论的初探

 

目前,国内外的汉字输入方法虽然已经很多,但都还非常稚嫩。大多数的方法只提出一些一时权宜的措施。没有理论基础,没有宏观构想,甚至连汉字的基本特性也弃置一旁。这些方法的共同之处是:它只能告诉使用者怎样做(How?),却无法告诉他们为什么(Why?)

本书试图从“人性本能、社会需要、汉字特性、键盘环境、”等四个角度,架构起一套汉字输入的理论。用客观的理论告诉我们:①社会需要什么样的汉字输入法?②汉字的特性是什么?,③影响汉字输入法的客观条件为何?以及④怎样才是合情合理、合乎时代和大众需要的汉字输入法?

3.1. 汉字输入应该解决的问题

汉字的优点很多,但它也有两个不易解决的问题:

第一、汉字检索不便。第二、输入电脑不便。

今日的汉字,好比有聪明的头脑,但缺乏两条健全的腿,行走非常不便。多年以来,汉字为人所诟病者在此。所以,任何优秀的汉字输入法,必须同时能解决这两个难题,使汉字既有聪明的头脑,也有两条健全的腿,才是汉字问题的根本解决。

3.2. 我们需要什么样的输入法

以上的分析,我们认识了影响汉字输入的几个关键。从人心要求角度来看,一种成熟的汉字输入方法应该避免下面几个陷阱:

第一、必须以字形代替拼音,符合汉字特性,避免拼音障碍。

第二、必须以视觉代替笔顺,符合看形按键,适应新的要求。

第三、必须以客观代替主观,符合键盘特性,真正一看就懂。

第四、必须以逻辑代替口诀,打汉字讲道理,避免死背强记。

第五、必须以广用代替单用,满足检输合一,解决根本问题。

第六、必须以效率取信大众,比较实际效果,避免权威压人。

3.3. 汉字特性给予我们的启示

中文汉字,论及造字原理,虽有六书之说,但如今我们所使用的汉字,75%以上都是以“象形字”为基础的“形声字”。所以“象形”与“形声”是汉字的最主要特色。

一般形声字,包含“义”与“声”两个部分,其中“义部”代表字义,“声部”表示读音。“义部”与“声部”,都以“形”为特征表示出来。例如:

在“湾、湖”两个字中,氵为义部,表示与水有关;“弯、胡”分别表示读音。

在“芬、芳”两个字中,为义部,表示与草有关;“分、方”分别表示读音。

在“忠、恕”两个字中,心为义部,表示与心有关;“中、如”分别表示读音。

用这种方法造字,有二个显著优点:第一、能“望文生义”,符合人性。第二、能“以少驭多”,所以非常科学。好的汉字输入方法,必须符合汉字“以形表意”的特性,使用者才能轻松驾驭汉字,发挥出汉字的优点。

3.4. 汉字造字法的优点和缺点

“象形”和“形声”字的特色在“形”和“声”,它的优点是更贴近人性〔更适合用眼睛看──能够望文生义〕,但亦有缺点。

放眼当今世界,所通行的文字,可以分为两大类:

①象形文字──可以汉字为代表。②拼音文字──可以英文为代表。

拼音文字的特点在使用字母。使用字母有二个显著的优点:

①有了字母,就有了统一的排序,所以检索方便。

②因为字母个数有限,容易用机械〔包括打字机和电脑〕处理。

以上二个优点,亦正是汉字严重的缺点。

这二个缺点成为许多人诟病汉字的焦点,甚至动摇了中文汉字数千年的根基。有人主张废除汉字,就是忘了汉字的优点而只看到它的缺点。汉字输入方法的纷歧,根本原因亦在这里。

3.5. 取长补短在建立合理字码

我们的汉字,由基本笔划和部首组成,表面上没有标准的字母,亦没有统一的排序,因此缺少了字母文字的优点。

从汉朝的许慎作《说文解字》以来,人们的注意力只在笔划和部首之间打转,直到二千多年以后的今天,问题没有太大改善。

但自从汉字产生了“码”的观念之后,汉字排序和机械化处理问题的解决,显露了端倪。通过码的使用,汉字可以有了排序。通过码的使用,汉字也可以机械化处理。接下来的问题是:“码”好不好用?合不合理?

所以,如今的问题是:怎样为汉字建立一套好用、合理的字码,使它既保有汉字原有的特色和优点,又具有字母的功能。也就是创造一套使汉字既贴近人性,保留特色,又便于检索和机械化处理的字码。

3.6. 中西结合是码的大势所趋

怎样才是汉字合理的字码?这要从码的内涵和使用者的角度去考量。

第一、码的内涵有二层:①既要保留汉字特色、②码的形式必须通用。

①从汉字特色来看,还是不能忘记“象形”与“形声”。

②从码的形式考虑,不能不使用英文字母和符号,因为它是当今全世界最通行的文字符号,也是电脑键盘上唯一的文字符号。

从以上二个前题,我们把问题缩小了范围:“如何用英文字母和符号,依汉字的特色输入汉字?” 这个问题牵涉到一中一西二个方面。

第二、使用者的角度是:将一中一西二个对象,加上人的因素,三者结合,只有二种方式:

①中文(字元)─→通过人(背诵记忆转换) ─→英文(字码)

②中文(字元)─→通过人(逻辑推理转换) ─→英文(字码)

第①种方式就是一般的字形类输入法,其中的“背诵记忆”缺少客观标准,不讲求逻辑,只讲求记忆,其缺点之分析,已见本文以上各节。

去了芜,存下菁。第②种方式是我们可以找到“合理”字码希望之所在,它就是研究汉字输入理论的焦点。

3.7. 以中英象形替代死背强记

此处,推理的起点是汉字,它的特色在字元的形状。推理的终点是个别的英文字母和符号,它的特色亦在形状。把这二者结合起来,最直接的方式是用眼睛看,而以像与不像为客观标准。

这样,就为我们带来了合理的答案,那就是:“中→象→英”。

“中→象→英”的含义是:“将中文字元的形状,通过人的眼睛和象形思维,转化为相似的英文字母和符号,就成为中文字元的“码”。这个过程,将主观意识降至最低,客观成分提至最高,人脑工作的路径最短,是汉字码的最高境界〔“中→象→英”在这里是一个概念,具体的方法见本文第4段〕。

中西以象形结合,配合简单的形声取码规则,作为汉字的字码,解决了汉字悬了二千多年的难题,使汉字既保有了传统的优点。又很方便的检索和机械化处理。

3.8. 以形声双轨排除单轨障碍

汉字输入法从开始到现在,已发展成字形类与拼音类两大派别,其间壁垒分明,互不相让。实际上,字形与拼音皆各有所偏,形声兼用,则能避其短而扬其长,而且用途广,使用更方便。

①在避短上──简化字形为首尾两码,简化拼音为首音一码,再将两者结合为一字最多三码,简化了拆字规则,使学习更加容易,而且按键少,输入更快。

②在扬长上──经常写一些东西的人,有时会遇到一些知其音而忘了形的字,也会遇到一些知其形而不会读的字。这时,如果你惯用字形输入法,遇到第一种状况,打不出字。如果你用拼音,遇到第二种状况,也打不出字。这是字形或拼音单一方法的严重的缺失。而既用形又用声的双轨码,正可以弥补这项缺失。

解决查字困难──目前,每一本中文字典,都必须同时有部首与拼音两种索引,不但浪费了巨大的篇幅,而且使用不便。试看任何一本英文字典,根本不用索引,查起来却快又方便。两者差别在那里?差别在汉字的排序。按照拼音编排,乱了部首,而且不知读音的字无法查;按照部首编排,又乱了拼音。而且查一个字需要数二次笔划,很不方便。如将汉字的形首、形尾,转变成形状相似的英文基码,按英文字母顺序排列。检索时不用数笔划,也不需要索引表,检索汉字,比查英文字典更快;即使不会首音,只要使用形首、形尾,也能很快查到。

 

4. E码汉字输入法简单说明

 

根据第三段所架构的理论,设计〔首尾音〕与〔中象英〕的E码。简单说明如下:

4-1. 〔首尾音〕取元规则

一般中文汉字,只取形首、形尾、首音三个部份;无形尾的,只取形首、首音两个部份。其中形首在字的上方、左边、左上角、或外部。形尾在字的下方、右边、右下角、或内部下方。不会汉语拼音者只用形首、形尾即可。

 

例如:

〔首〕的形首为〔丷〕,形尾为〔目〕,首音为〔S〕。

〔音〕的形首为〔丶〕,形尾为〔日〕,首音为〔Y〕──以上为上下型汉字

〔创〕的形首为〔人〕,形尾为〔〕,首音为〔C〕。

〔汇〕的形首为〔氵〕,形尾为〔匸〕,首音为〔H〕──以上为左右型汉字

〔原〕的形首为〔厂〕,形尾为〔小〕,首音为〔Y〕。

〔因〕的形首为〔囗〕,形尾为〔大〕,首音为〔Y〕──以上为包含型汉字

〔人〕的形首为〔人〕,无形尾,首音为〔R〕。

〔口〕的形首为〔口〕,无形尾,首音为〔K〕。──以上为独体型汉字。

4-2. 〔中象英〕编码原理

将汉字的〔形首〕和〔形尾〕,转换为形状相似的英文字母或符号,再加上〔首音〕,就是E码。照此按键,就能输入汉字。

所有中文汉字,都是由〔点、横、撇捺、直〕四种基本笔型组成,再由这四种基本笔型,产生31组〔14+3〕基本字元,每一组基本字元有相同的特征,用一个形状相似的英文字母或符号代表此特征,这便是中象英的基码。

说明:

①以上31组包括了所有出现在汉字首尾的字元,少数表中找不到的字元,以相似者替代。在电脑上,可用万能键[]替代,输入无障碍。

②以上31组字元的中英象形代码〔如底下行所示〕有90%以上与英文字母或符号形状相似,只有最后3个〔带*号者〕稍有差异。请注意!

 

 

附表1:中英象形基码表

 

 

 

撇捺类

羊火头

纵横类

封口类

3/4封口

单点型

多点型

单撇型

多撇型

直竖型

直钩型

撇捺型

斜交型

羊字头

火字头

十字型

卄字型

口中空空

口中有物

上开口

下开口

丶亠讠礻衤

冫丬氵水

丿亻

⺈夕彳彡爫

丨卜忄心

刂丁扌

八人大夫

乂又攵女

丷羊

小火灬

十丰巾中

艹卄业川卅

日目四田母

凵山臼

冂门月

·

3/4封口

1/2封口

阝尸类

竹木类

扭折类

王贝类

 

右开口

左开口

右下开口

往下向右

耳朵型

尸户型

竹片型

木字型

向右扭折

向左扭折

王工型

几贝型

单横型

宝盖雨鸟

土士型

万能键

勹弓

厂广疒斤

乚七弋廴辶

卩乃耳

尸户

片爿

木未末耒丫

厶幺纟巛

了 子犭

工王正互亚

儿几九尢贝

*

*冖宀鸟

*土士

                

附表2:中象英的E码部分字例

以下各字例中,第一码为形首基码、第二码为形尾基码,三码版加首音。

文=形首()+形尾()=基码(.)+基码(X) 、三码版+首音(w)

言=形首()+形尾()=基码(.)+基码(O) 、三码版+首音(y)

刘=形首()+形尾()=基码(.)+基码(J) 、三码版+首音(l)

河=形首()+形尾()=基码(;)+基码(J) 、三码版+首音(h)

汉=形首()+形尾()=基码(;)+基码(X) 、三码版+首音(h)

汇=形首()+形尾()=基码(;)+基码(C) 、三码版+首音(h)

化=形首()+形尾()=基码(/)+基码(L) 、三码版+首音(h)

信=形首()+形尾()=基码(/)+基码(O) 、三码版+首音(x)

行=形首()+形尾()=基码()+基码(J) 、三码版+首音(x)

很=形首()+形尾(  )=基码()+基码(K) 、三码版+首音(h)

美=形首()+形尾()=基码(V)+基码(A) 、三码版+首音(m)

善=形首()+形尾()=基码(V)+基码(O) 、三码版+首音(s)

荷=形首()+形尾()=基码(H)+基码(J) 、三码版+首音(h)

花=形首()+形尾()=基码(H)+基码(L) 、三码版+首音(h)

限=形首()+形尾()=基码(B)+基码(K) 、三码版+首音(x)

陆=形首()+形尾()=基码(B)+基码(U) 、三码版+首音(l)

邓=形首()+形尾()=基码(X)+基码(B) 、三码版+首音(d)

部=形首()+形尾()=基码(.)+基码(B) 、三码版+首音(b)

合=形首()+形尾()=基码(A)+基码(O) 、三码版+首音(h)

俞=形首()+形尾()=基码(A)+基码(J) 、三码版+首音(y)

展=形首()+形尾()=基码(P)+基码(K) 、三码版+首音(z)

尾=形首()+形尾()=基码(P)+基码(L) 、三码版+首音(w)

请仔细观察以上字例,读者不难发现:各字的第一码,形状很像形首的字元;各字的第二码,形状很形尾的字元。使用形首形尾的中象英基码,输入中文汉字,中西合璧,唯妙唯肖,易认易记,“直觉”而“高雅”。

井田汉字,独一无二的汉字结体构形理论,科学地解决数码时代汉字所面临的问题。

湘ICP备05008125  语言文字网  2003-2013©版权所有