阅读文章

李牧:繁简“非对称”字组的自动转译实验

1. 提要

[日期:2009-08-27] 来源:语言文字网  作者:李牧 [字体: ]

1. 提要

1.1 定义:

本文所谓“繁体”,泛指台湾规范字;“简体”泛指大陆规范字。“非对称的繁简对应也包括异体关系,笔者刻意不予区分,因为无论它们的关系如何,其解决的方式一样,须化“非对称为“一对一的对应。

1.2 样本:

各家得出的“非对称字组数量有相当差异,其原因除是否包含异体关系之外,还有就是各人所依据的样本资料不同。笔者是以大陆规范《现代汉语通用字表》7000字,以及台湾规范CNS11643常用5401字为主要样本,加上为求二者对应而采录的1700多个台湾次常用字,合计样本字数7376字,共得非对称”270字组(一简对二繁240组,一简对三个以上繁体字30)。字组数量曾依实际情况更新,并用繁简自动对译一一验证无误。

1.3 自动转译的实验:

因为“非对称字组中包括不少异体关系,所以,要解决此项问题,使两岸文字成为一对一的对称,必须彻底解决异体字的分歧,甚至需要两岸文字规范的统合;但这并非短期内能达到的目标。目前海峡两岸交往频繁,繁简字的转译全赖计算机自动转换。以短程目标而言,如果自动对译时没有误译,则即使存在“非对称字组,也不至于影响文意的正确传达。基于这个理念,笔者作了全部270字组自动转译的实验(见文末附表),并假定完全没有词汇的智能设计。转译实验的结果显示:“繁转简时,都没有误译,“非对称字组皆可保持现状;“简转繁时,大部分字组也没有误译,只有18组字出现误译,须作改变。


[1] [2] [3] [4] [5] 下一页   
【内容导航】
第1页:1. 提要
第2页:2.0 自动转译实验的方式及结果
第3页:3.0 某些非對稱字轉譯的調整(举例说明)
第4页:4.0建议剔除的异体字
第5页:5.0 结语


阅读:
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:周胜鸿:《简化字总表》中的“非对称繁简字”形音义简析表

下一篇:骆骏 张蓉德:同音替代简繁字琐议
相关文章       繁简之争  第十二次汉字书同文学术研讨会 
本文评论
  你這簡直是亂搞,别扭到底是不要扭還是真正的彆扭呢?背着到底背地裏還是揹著東西呢?   (正我漢字 ,2010-03-12 )
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
本周热点
  暂时没有相应新闻
 
最新文章