阅读文章

[转载]汉字拓扑码(兴趣组)【与输入法无关】

91-105楼

[日期:2013-01-18] 来源:北大中文论坛  作者: [字体: ]

jr0jr 发表于 2011-5-10 20:46:54

回复CFit先生

任合两个字,只要有差别,都可以找到办法区分,这个不难。
但是如果差别很小,识别的复杂度会急剧增加。

之后不管出什么样的字,原来的表示方法都能清楚地表示这一个汉字,而没有歧义,这才是问题的难点。
也许会建议使用正体字的原型,或者修改某些差别小的字型,但是,在现有汉字体系内,再新造字似乎得不偿失。强调一下,我说的是现有汉字体系。

也就是说是否真正找到了汉字的本征特征,任你再出现什么字,只要人能看出区别的,原来的方法就能区别,而不是看到差别再增加一种特性,再细分一下就能区分了,这样的办法会的人很多。
所以,只有工程的方法是不够的,还有有认知心理研究。即便如此,仍然不是只有一种选择。
有多种方案供大家参考,不是好事么?体现一下自然选择的妙处。

 

金岷彬 发表于 2011-5-11 10:36:44

回复 86楼 jr0jr 先生的帖子

1,金岷氏对于用形式语言来表达汉字字形的探索,很感兴趣,愿意适当参与这个论题的讨论。并且一直在关注 网友们各自的 表达汉字字形的算法表示 和 思维方式,从中吸取营养。

2,抱歉,金岷氏对于汉字的冗余度问题,没有做过探讨,谈不出属于自己的学见。多年前,曾经介绍过陈明远对于 汉字字形的清晰性、区别性与汉字笔画数的关系 所做的统计和统计数据分析。金岷氏受教、受益于这篇文章,懂得了汉字字形的清晰性与区别性的辩证关系;也把这种关系看作是评判机器汉字阅读适性好坏的具体内容之一。陈文《现代汉字笔画的统计分析》刊载《中国语言学报》第一期,商务印书馆1982-12 。
        在陈文的基础上,或许可以去讨论汉字字形的冗余度——在保证区别性和清晰性的前提下,哪些笔画可以变形或者省减,但金岷氏没有向探讨字形冗余度的方向走。
        此外,金岷氏还觉得 jr0jr  先生要注重汉字的字形美学问题。这是因为,汉字的阅读性能与书写性能都与社会对汉字的字形美学观念息息相关,一种被认为字形不美的(机器)字体,它的阅读适性不会很好,推广使用的范围会狭窄。而且,文字符号的发展,总是向着美化的方向发展,不论机器字体还是手写字体都如此。

3,受到 jr0jr 先生话题的启发,笔者近两天打算写一段东东,讨论汉字的斜向笔画,与八卦符号之间,在操作技术上的关联。也算是从(工程)操作技术去研究汉字和汉字文化的一种努力;也算是近期阅读苏培成教授《现代汉字学纲要》一书的阅读札记,从汉字的字源分析方面,讨论现代汉字的的某些字形结构。

[ 本帖最后由 金岷彬 于 2011-5-11 10:40 编辑 ]

 

客串客串 发表于 2011-5-11 13:30:46

部颁560部件标准,贯彻了“交重不拆”的原则。对于电脑自动组字来说,我觉得选用560部件集最理想了。它极大地简化了汉字的结构。
    如果每个部件都配上左、右、上、下、中五种不同组字方位相应的字库图片,组出来的汉字,其美观性估计还是不错的。

 

jr0jr 发表于 2011-5-11 17:44:40

原帖由 客串客串 于 2011-5-11 13:30 发表 http://pkucn.com/images/common/back.gif
部颁560部件标准,贯彻了“交重不拆”的原则。对于电脑自动组字来说,我觉得选用560部件集最理想了。它极大地简化了汉字的结构。
    如果每个部件都配上左、右、上、下、中五种不同组字方位相应的字库图片,组出来 ...

什么是“交重不拆”的原则?可否客串先生给个链接啊?

 

jr0jr 发表于 2011-5-11 17:51:56

回复 92楼 的帖子

谢谢金先生的参与!

字形美涉及认知心理学,应该在有条件的时候做做人机互动实验的。

我所在的大学,心理学系和语言学系有一个专门的跨学科的组织(Psycholinguistics Centre),研究语言和思维的奥妙,经常邀请在校师生参与他们的实验。可惜人家只要英语为母语者。。。不知道国内的汉字汉语研究有没有类似的和认知心理学结合的机构?

 

客串客串 发表于 2011-5-11 17:58:32

原帖由 jr0jr 于 2011-5-11 17:44 发表 http://www.pkucn.com/images/common/back.gif
什么是“交重不拆”的原则?可否客串先生给个链接啊?
就是笔画纠缠在一起的部件,不允许拆散开来。比如“夷,串,戈,龙,聿”之类,要当做一个整体看待。

 

jr0jr 发表于 2011-5-11 18:37:25

回复 96楼 的帖子

如果使用560部件,研究汉字生成、新式输入法,那就是另一个皮教授的实验室了。实用性很强,也有不错的现实意义,但是我自己没什么兴趣。没有兴趣,就没有动力。:shy:

我个人的兴趣,主要是用工程的方法分析汉字信息的承载能力。从创新的角度上看,就是怎么可以做到无字根地析构汉字,或者说,把研究字根的拓朴和字形的拓扑融为一体,把汉字作为一个复杂但有规则的平面结构。

这个是有些新意的。直言不讳的说,这也是个学术噱头。但是,如果创建人雄心太大,实施人操作不当,也很有可能走上类似鼓吹“全盘拉丁”、“分词书写”的外道。因为很容易在工程操作的纷乱里,迷失对汉字传统的认识。

对此,我其实很担心。借北大中文论坛的宝地,发帖求教,也是基于这个忧虑。往下该怎么走呢?我对宏观目的不迷茫,对微观操作不迷茫,可就是在怎样秉承目去具体操作的这个度上,很迷茫。。。就像一个即将给自己亲人做手术的外科医生,目的很明确,手法也不陌生,可是,该怎么下刀呢?:(

[ 本帖最后由 jr0jr 于 2011-5-11 19:33 编辑 ]

 

yywzw05 发表于 2011-5-11 21:06:24

原帖由 jr0jr 于 2011-5-11 17:44 发表 http://www.pkucn.com/images/common/back.gif
什么是“交重不拆”的原则?可否客串先生给个链接啊?

官方(《汉字部件规范》研制组)关于这个问题是这样回答的:
(1)交重不拆
例如:“串”不拆分为“中”、“中”;“东”不拆分为“七”、“小”。
http://www.yywzw.com/pan/pan-03b-05.htm


客串先生举的例子“龙”确实是560部件中的一员:



但是“龙”字是怎么交重的呢?我真没有看明白。

类似的结构如:“有、友、发”很多,它们都不是560部件中的一员,“同理”“类推”在这个问题上不起任何作用。

 

yywzw05 发表于 2011-5-11 21:31:25

原帖由 金岷彬 于 2011-5-11 10:36 发表 http://www.pkucn.com/images/common/back.gif
受到 jr0jr 先生话题的启发,笔者近两天打算写一段东东,讨论汉字的斜向笔画,与八卦符号之间,在操作技术上的关联。也算是从(工程)操作技术去研究汉字和汉字文化的一种努力;也算是近期阅读苏培成教授《现代汉字学纲要》一书的阅读札记,从汉字的字源分析方面,讨论现代汉字的的某些字形结构。


很感兴趣,拭目以待。

期盼早日看到林工的论述。

 

客串客串 发表于 2011-5-11 22:08:18

原帖由 yywzw05 于 2011-5-11 21:06 发表 http://www.pkucn.com/images/common/back.gif
官方(《汉字部件规范》研制组)关于这个问题是这样回答的:
(1)交重不拆
例如:“串”不拆分为“中”、“中”;“东”不拆分为“七”、“小”。
http://www.yywzw.com/pan/pan-03b-05.htm
客串先生举 ...

它有那个原则,但也不是每个部件都能贯彻到底的。换句话来说,这原则并不特别严谨。而且,560部件集的确定,也不止考虑字形方面的因素,它还考虑了字源,字理和习惯等因素。
由于遭不少人诟病,560部件规范并未得到切实的执行。
我只是觉得,大字根多些,有利于降低在描述汉字结构上面的复杂性,可以减小电脑动态组字的难度,减少甚至避免组字时各部件相互间的笔画穿插,更易达到美观的要求。

[ 本帖最后由 客串客串 于 2011-5-11 22:09 编辑 ]

 

jr0jr 发表于 2011-5-11 23:45:37

请教客串先生

如果目的就是基于560部件的动态组字,那目前研究的热点是什么? 某种输入法?

 

客串客串 发表于 2011-5-12 00:01:00

原帖由 jr0jr 于 2011-5-11 23:45 发表 http://www.pkucn.com/images/common/back.gif
如果目的就是基于560部件的动态组字,那目前研究的热点是什么? 某种输入法?

不是输入法。现有汉字字形的冗余度太大,以完整描述汉字字形的方法输入汉字,效率太低。
热点其实也没什么热点,据说难题倒有,那就是很难组出美观的汉字。几个部件拼在一起,必须进行一定的缩放变形和作一定的穿插或者交叠处理,这种电脑处理,怎么也比不上书法家的手艺啊。组出来的字太丑,不入眼,垃圾。你别小瞧了这种形变处理,反正到目前为止,还没有人能攻克它。

[ 本帖最后由 客串客串 于 2011-5-12 00:03 编辑 ]

 

jr0jr 发表于 2011-5-12 00:08:26

您能给个图像什么的么?我没见过拼部件的。有多丑我也看看 :cry:

我真的是没有经验。请见谅。

 

jr0jr 发表于 2011-5-12 00:09:25

再有,如果不做输入法,要动态组字干嘛?

 

客串客串 发表于 2011-5-12 00:15:52

原帖由 jr0jr 于 2011-5-12 00:09 发表 http://www.pkucn.com/images/common/back.gif
再有,如果不做输入法,要动态组字干嘛?

你自己在PHOTOSHOP里拼拼看嘛。
动态组字的意义在于,可以组出unicode没有收录的字,甚至错字,可以造新字,让汉字进入一个自由世界。



上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9..] [14] 下一页   
【内容导航】
第1页:说明
第2页:1-15楼
第3页:16-30楼
第4页:31-45楼
第5页:46-60楼
第6页:61-75楼
第7页:76-90楼
第8页:91-105楼
第9页:106-120楼
第10页:121-135楼
第11页:136-150楼
第12页:151-165楼
第13页:166-190楼
第14页:191-205楼


阅读:
录入:湘里伢子

语网特别申明:各专栏专辑作者文责自负,对自己的作品享有完整版权,在语网的发布不影响其再版权,即作者还可另行投稿或出版。任何人均可在本站发布或转载文章,但这并不意味着本站赞同其观点或证实其内容的真实性,如涉及版权等问题,请作者来函联系。

评论 】 【 推荐 】 【 打印
上一篇:[转载]井田汉字,汉字形体结构演变的终点站(下)

下一篇:“井田汉字”走的是“拼形”路线
相关文章      
发表评论


点评:
 
字数(限500字,建议200字以内):
姓名:

  • 尊重网上道德,遵守中华人民共和国的有关法律法规
  • 承担一切因您的行为而导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
站内查询



 
最新文章