应从工程学角度来认识汉字的字元结构体系(一)
详细内容
一
21世纪,大家最关注的已不是汉字从何处来,而是向何处去的问题。
汉字结构的分析,原本是语文教学的一块传统领地,现在却成了计算机课的入门知识。夺回这块领地是我们的神圣职责,也是本文的写作初衷。
汉字演变的脚步时快时慢却从未停止过,特别是当它必须适应信息技术(书写工具、文字载体)的发展时,汉字从来都进行了相应的变革。今天人类已经迈进信息社会的门槛,汉字作为一种信息载体,在技术应用中遇到了不少困难,最突出的是在汉字信息处理方面,已经到了非“主动”改革不可的地步。为了满足计算机的要求,这种改革是仅仅作字体上的创新,还是要进一步使方块形的平面文字线性化?抑或汉字根本就无需改变,需要改变的却是我们对汉字的认识角度。传统的汉字理论无法回答这个问题,根本满足不了现实的需要。
众所周知,汉字“隶变”以后,形体逐渐由图形化走向符号化,特别是大规模简化后,结构方面又出现了新的情况,已经很难用六书理论去解释了。尤为重要的是,六书理论无法从工程学的角度来深入研究现代汉字的内部结构体系,对于汉字今后规整化、信息化的发展趋势并没有明确的指导意义。
我们希望汉字保持长期的稳定,但是汉字总在发展,变化是绝对的,不变是相对的。从三千多年前的甲骨文进化到今天的楷书,汉字大多已经面目全非,图画性早已荡然无存,符号性逐渐得到增强,但是并没有发生过本质上的根本变化,字形仍是文字的根本。汉字怎样由它的成形线条构成部件,又怎样由部件构成数以万计的各不相同的形体,这就需要对字形的结构单位、结构层次、结构关系和结构模式进行分析。许多学者为此进行了有益的探索并且作出了可喜的成绩,汉字的结构方式已经到了可以重新认识并作出科学概括的阶段。
二
我们可以把汉字当作一种纯粹的符号和工具,通过研究汉字的基础理论,把汉字改革和汉字处理两项工作结合起来,有利于促进汉字的规范化和标准化,有利于解决汉字在信息时代所面临的难题。笔者根据信息时代的需要,总结了前人的一些研究成果,找到了汉字的形符――字元,并且从工程学的角度来认识汉字内部存在着的字元结构体系,使得每个汉字的结构图形能够转换成一串有序的线性的字元集合。
事实上,汉字的形符是客观存在的,字元作为汉字的拼形字母,只是长期以来没有被人发觉。在这里,本文将首先对汉字的形符――字元作些简单的介绍。
字元由汉字“田”蜕变而来,即汉字“田”上各直线段在不同取舍情形下的各种组合单元,例如:一、丨、二、三、十、干、土、工、王、匚、凵、口、日、田(这里用形状相近的汉字描述)。
研究表明,字元按一定的规则可繁衍出一系列自相似层次嵌套结构,成千上万的汉字及其构件与这些结构相同或相近。
(1)一级衍生:字元上的正笔被某一字元取代,产生一级衍生字符。例如:
十→丰巾中申甘井工→正
王→里缶土→出击
(2)二级衍生:一级衍生字符上一阶字元的正笔被某一字元取代,产生二级衍生字符。例如:十→廾→册十→?→串
依次类推,字元通过衍生可产生一系列衍生字符,笔者将字元(元形字符)及其衍生字符统称为字元字符。
下面根据汉字的实际情况对汉字构件与字元间的关系作些简单分析。
零件是指构成汉字的可离析的、最小的、独立的笔画组合单元。
零件可以按其字元特征分为如下2类: