阅读文章

最短的汉字编码方案

[日期:2009-11-09] 来源:  作者:杨士辉 [字体: ]

最短的汉字编码方案    杨士辉   杨松   2009.1.4

 

 

现在的字典,大多数都是按照汉语拼音音节表的次序来排列的。使用音节表查字,首先要知道待查字的汉语拼音。为了弥补音序法的不足,我们可以采用‘笔画笔顺法’列出一张笔画检字表。笔画少的字排列在前面,笔画多的字排列在后面;笔画相同的字,按照笔形的横、竖、撇、点、折排序。

我们采用下述方法对笔画检字表中的汉字进行编码,每个汉字只用2~3个字符来代表。

我们用9个阿拉伯数字1~925个拉丁字母a~km~z ,字母‘l’不用,因为它与数字‘1’容易混淆,总共用34个字符。

编码方法如下:第一个字符用来表示汉字的笔画数;第二和第三个字符用来表示笔画数相同的汉字按笔顺排列的序数。34*34=1056,两位数可以表示1056个字。常用汉字中,9画,10画的字最多,但是都小于1000.

用这种方法对汉字进行编码,每个汉字只需要2~3个字符,而且没有重码,这是最短的汉字编码。

编码举例如下:一(11),乙(12,二(21),十(22),三(31),干(32),丰(41),王(42),玉(51),刊(52),匡(61),耒(62),寿(71),玕(72),奉(81),玩(82),砉(91),耔(92),耕(a1,(a2),慧(b1),耜(b2),(c1),(c2),(d1),瑟(d2,(e1),(e2),(f1),(f2),(g1),(g2),(h1),(h2),(i1),(i2),(j1),(j2),(k1),(k2),(m1),(m2),(n1),(n2),(o1),(o2),(p1)

 

参考文献

 

苏培成《现代汉字学纲要》。北京大学出版社200112月第二版

苏培成选编《现代汉字学参考资料》。北京大学出版社200112月第一版

王开扬《汉字现代化研究》齐鲁书社20048月第一版

张普 著《汉字编码键盘输入文集》中国标准出版社1997年第一版

李公宜主编《汉字信息字典》科学出版社1988年第一版

e-mail:zgsyysh@163.com




阅读:
录入:杨士辉

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:遭遇汉字编码危机

下一篇:汉字笔画编码方案
相关文章      
本文评论
  编码虽短,只有2-3各字符。可是使用者很难记住每个编码字,1000多个只有2个字符的常用字度很难记住了,何况7000个通用汉字的编码字,可以想象有多难了。这种编码叫做“无理编码”,实用价值不高。和从前使用的“邮政编码”相类似,只是比较短而已。   (杨维诚 ,2010-02-13 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章