习斋 2006-10-20 10:11
清理“汉字优越”论的误导
来源: 人民网(北京) 作者:米阿仑
编者按:本文作者对于汉语态度比较激烈,有中肯的地方也有过激之处,无论如何,这也是一种声音,我们做的,只是倾听更多的声音,哪怕它并非代表我们的本意。
多年来,严重违背科学技术原理的“汉字优越”论十分盛行,对社会造成极大误导,对中文信息科技发展也造成极大干扰。要自主创新地发展核心技术和争取获得中文信息科技发展的战略主动权,就需要对“汉字优越”论的误导做一番清理。
(一)1989年,“汉字优越”论开始弥漫大陆。当时,最流行的一个说法是:联合国文件中,汉字印刷的文件最薄,所以,汉字比英文等文字更优越。由于鼓吹者有联合国总部翻译工作的经历,其说法蒙住了许多人。
做任何比较都有个起码前提:条件和方式相同。然而,英文书写和汉字书写是不同条件方式:英文是字母符号单线字符串方式,而汉字则是部首笔画平面绘画方式。如果汉字的部首笔画也用单线字符串方式,那么,一个汉字所需要的单线长度往往超过英文字母方式;如果英文词汇也用平面绘画方式,那么,它所需要的平面空间与汉字差不多。
举个例子,“中国人”用三个汉字符号,英文“CHINESE”用七个不可再分割的书写符号单线串写而成。然而,如果汉字也用不可再分割的符号以单线字符串方式书写,例如部首笔画,那就有“竖、折、横、竖”等14个符号,比英文的字符串长得多。能因此而说英文印刷更薄、因而比中文的汉字更“优越”吗?当然不能。所谓“联合国文件中,汉字印刷的文件最薄,因而汉字更优越”的说法,不具备起码的比较分析常识,那种比较是毫无意义的。
(二)“汉字优越”论的鼓吹者们说,汉字平均信息量大,所以,汉字比英文更优越。这是望文生义的说法。信息学基本原理说明,某数据所使用的符号系统的平均信息量越大,它的不稳定性和消耗就越大,对数据管理和信息传递是不利因素。例如,英文平均信息熵是4.03比特左右、汉字是9.6比特左右,汉字平均信息量比英文符号大许多。做同样的数据作业,汉字符号系统的总体消耗最大,其信息量大是不利因素。
如果平均信息量大能换来更高的平均精密精确度(例如可靠性和避免歧义等等),或许也值得。可是,据海内外专业人员考察分析,汉字和英文等文字符号系统的平均多余度差不多;也就是说,汉字平均信息量大,并没有换来更高的精密精确度、并没有换得更可靠和更有效地避免歧义的实效。要达到大体相同的精密精确度和可靠性,汉字符号系统的消耗比英文符号系统高出许多,能说汉字比英文更“优越”吗?见到“大”就是好,占领了许多人的头脑,于是,见到“汉字平均信息量大”、就望文生义地以为那是多么“优越”,殊不知那是中文数据管理和传递的不利因素。以“汉字信息量大”作“汉字优越”的理由,是违背信息学科学原理和基础知识的。
(三)“汉字优越”论的鼓噪者们说,计算机操作,汉字输入比英文还快,几个键敲下去就能出现整个词组短句,而英文却要一个个字母敲打,所以,汉字比英文更“优越”。这是缺乏计算机知识的说法。
了解计算机输入输出原理的人都知道,文字符号如何显示和键盘操作的关系,完全是人为程序所规定的。例如,有程序规定:Zhongguo =“中国”,ren =“人”,zgr = Zhongguo + ren。这样一来,连续敲打“zgr”就会显示“中国人”三个汉字。按照同样方法,英文输入输出也编个程序,敲打“Shakespeare_12”就能显示整部《第十二夜》、几十万个英文符号都显示出来了,能因此而说英文输入比中文汉字输入快、因而英文文字系统比汉字文字系统更“优越”吗?显然不能。
英文的计算机操作普遍采用一个个字母输入的方法,是为了英文数据全面管理有统一的标准,是为了更好的成本效益,而并非是因为搞英文计算机数据管理的人员连如何规定词组短句的简单程序设计都不知道,更不是因为英文跟其它文字符号相比有什么“优劣”之分。
(四)“汉字优越”论还有个说法:“汉字所具有的象形表意特点,特别适用于现代科技,是一种更为理想的电脑语言。”这个说法不符合事实,也不符合计算机工作原理。
自中文计算机技术开始发展以来,为汉字输入法而消耗的时间已有30多年,花费的资金和人力更是无法计算,可是,到目前为止,派出所户口登记和银行开户头为汉字数据库不够用而出现的尴尬多次发生,中文数据传递和处理发生乱码的问题至今没有完全解决。现有汉字数据库是二字节,要包括所有汉字,就必须用四字节,其成本之高和效益之低是不言而喻的。更值得注意的是,就算汉字数据库建设完毕,那也不能满足中文数据全面管理的需要,一切还得从头做起。在这些事实面前,怎么能说是“汉字特别适用于现代科技”和“更为理想的电脑语言”呢?
所谓“电脑语言”,既不是英文、也不是中文或其它人类使用的语言文字符号,而是由“0”和“1”组成的二进制语言,即“机器语言”。不管某个数据的种类是图象、声音、还是文字,它的计算机处理都是由二进制开关动作完成的,跟它所使用的文字符号是不是象形表意及其书法写法如何都毫无关系。如果汉字符号是比二进制还“更为理想的电脑语言”,为什么全世界没有一台计算机(包括在中国使用的计算机)是取消二进制而采用汉字符号系统而设计制作的呢?
(五)中国政府早已颁布了现代汉语拼音方案和正词法等语言文字标准规范,并为联合国等国际官方组织所接纳为全球使用的国际标准规范。可是,“汉字优越”论鼓吹者们却说那些标准规范是“左倾”和“盲目西化”,主张回到近百年前的“汉字注音”。由于“汉字优越”论的严重误导,目前,海内外发行的绝大部分中文教材和许多文字资料采用了“汉字注音”方法,给中文数据管理带来了严重的消极后果。
例如,“北京是中国的首都”这句话,符合国家标准规范的现代汉语拼音书写方式是:“Beijing shi Zhongguo de shoudu”。而“汉字优越”论主张的“汉字注音”书写方式是:“bei jing shi zhong guo de shou du”;到数据处理的时候,其方式是:“beijingshizhongguodeshoudu”。不必多说,用这样的方式来处理中文数据,给词界判断带来了完全不必要的巨大消耗,使检索、排序和自动翻译等数据处理的歧义错误百出,大大降低了工作效率,甚至使本来可以从容完成的管理艰难,而且,即便可以容忍歧义,其成本代价之高超出一般想象。正因为如此,多年来,中国的自动阅读和自动翻译等科研技术几乎就没有获得实质性的发展。
从文化历史的角度看,中文书写引进西方的标点符号方法,使汉语的文字表达更清晰准确和更容易阅读,为扫盲和帮助更多人享受教育机会提供了条件。同样道理,使用正词法等方法确定词界,将使汉语的文字书写进一步清晰准确和容易阅读,对中文信息技术和文化现代化的发展都有重要的积极意义。而采用“汉字优越”论所主张的“汉字注音”的做法,不但是文化倒退和人为地给中文信息技术发展制造障碍,而且,从国家生活角度看,没有经过法律程序就否定甚至在行动上对抗国家已颁布的正词法等相关标准规范,也是说不过去的。
违背事实和科学原理的“汉字优越”论泛滥了十六年左右,充斥了许多报刊媒体,甚至不少政府官员、院士、名人学者和作家们也跟着人云亦云。中文信息技术要自主创新发展和掌握战略主动权,就需要清理“汉字优越”论造成的严重误导。为此,笔者郑重地建议:请不要再继续散布违犯科学原理和违背事实的“汉字优越”论了。