|
将古老汉字和现代信息技术 完美结合
把汉字输入计算机,除有计算机外,还要有操作系统、汉字库和输入系统,三者缺一不可。所谓输入系统实际就是汉字检索代码化,即把每一个汉字,分解改编成机器能读识的代码。什么才叫快速输入呢?就是汉字代码输入的速度,要达到人的正常语言速度,即每分钟200个汉字以上。
把汉字输入计算机,1959年已由美国国际商业公司(IBM)实现。他们设计的卡德韦尔汉字打字机,按每字笔画顺序打制孔码,一共只能打2333个汉字。其后,有photon公司的“辅键式汉字打字机”,能打5040个汉字。但每次必须在168键的大键面上标出的5040个汉字中找到所需之字,右手按下该字所在大键,左手按下标有该字字位码的一个辅键,电脑才能把该字反映出来。辅键共有30个。用起来非常麻烦。
进入上世纪60年代,日本、美国、加拿大、苏联,及中国台湾、香港等地的专家们,力图将汉字快速地输入计算机的各种方案竞相出现。他们在168个大键、30个辅键的方案基础上缩小,于是不断有108键、96键、87键、64键的报道出现。
1964年,对汉字检索和编码已有很高造诣的郑易里推出了《汉字四拼字码方案和打字》的完整方案。这个方案,已经实现了只用32键将汉字拆根编码输入。尤其是他经过大量分析统计,认为每个汉字最多用4个代码是检索汉字最精炼、最科学的码数。他将这个方案汇报给邮电部后,邮电部当即派了两位技术人员配合他完善和实现这个方案。郑易里还书面向中国科学院、邮电部等单位建议组成协作组,运用世界上刚刚兴起的电子计算机来迅速攻克处理汉字的难关。他的这个建议比后来著名的“748”工程(即汉字激光照排项目)早提出10年。随后,“文革”爆发,邮电部的两位技术人员撤回。在那艰难的岁月中,郑易里一边应付各种运动,一边修订他主编的《英华大辞典》,一边注视着国外汉字输入计算机的各种方案的进展。他心急如焚,可又无可奈何,只有自己孜孜不倦,日夜孤身奋战。到“748”工程开始时,他的字根编码理论和方案已引起各方面专家的重视和称赞。
1978年8月,“748”工程顺利实现。《光明日报》当时做了报道,并公布了照排样张,轰动了国内外汉字印刷界。可是它的汉字输入法是拼音法,由于汉字重音字多,导致输入时重码率高,输入速度慢。就像计算机运算速度已是高速公路,而输入法却是牛车!要实现快速输入,还得是形码输入法!
1980年11月,郑易里与邮电部第七研究所合作,率先创造了26键输入方案,第一个在世界上完成了只用A—Z26个通用键位将汉字字根代码化的输入方案。他们运用这个方案对《标准电码本》内全部9324个汉字,以及《标准电码本》中没有,而收入《新华字典》(1979年修订本)中的1726个汉字,共11050个汉字进行了编码,重码字130个,占总编码字数的1.2%。这个重大成果,已大大领先于当时国外所有公司和专家研究的汉字输入成果,率先攻克了26键通用键盘大关!当时,双方约定对方案保密,争取资金实施。后来,邮电部单位调整,人员离去,又只剩下郑易里独自奋战了。
1979年,郑州一位陶工程师研究了一种汉字编码方案,河南省科委组织鉴定,约请郑易里参加。在会上,郑易里坦诚地对这个方案提出了一些建议,他的精辟见解引起很大震动。第二天,河南科委请郑易里做专题报告,他有关汉字编码字根论的研究理论及方案进展,激起听众极大兴趣,当即就有人电告了在南阳科委工作的王永民。王永民一听,星夜赶到郑州,见到了郑易里,诚心讨教,这时他才知道汉字还有编码一说。以后,他带人到北京郑易里单位和家中虚心请教。郑易里不但热心接待,同时也诲人不倦,有问必答。1980年,南阳科委立项拨款研究汉字输入编码课题,特邀郑易里去南阳指导协助。郑易里见南阳科委这么支持汉字编码研究,王永民等人如此求知心切,非常高兴。此时正值酷暑8月,时年已75岁的郑易里一到南阳,就连续讲了7天课,将自己多年对汉字、汉字编码的研究心得和成果,都传授给了王永民等人。从1980年8月到1983年8月的几年间,郑易里不顾高龄,4次应邀去南阳指导和帮助课题组一起实现这个后来被称为“五笔字型”的汉字编码项目。
当时南阳的课题组虽然努力,但事倍功半,长期停滞在48键上。当郑易里创先实现的26键方案6月份定稿打印成册后,得到农科院的许可,他最先给南阳的王永民寄了去。王永民接到后,大喜过望,在给郑易里的回信中,掩不住兴奋之情地写到“这是一个伟大的成功!是字形方案的高峰上插上的一面鲜红的旗帜!体系的严密,科学思想的一贯,构成的精密,使用方法之简易及实编效果的惊人!”并认为这是形码界爆炸的第一枚原子弹!同年11月在北京西郊举行的汉字信息处理技术学术交流会上,郑易里将这世界上最先实现的26键的具体方案广为散发。与会的专家问郑易里,这是您多年研究的巨大成果,这一散发出去,别人不是很容易偷去吗?郑易里回答:“中国大陆是汉字的发源地,最好的汉字编码,应该诞生在中国大陆,只要是中国大陆的人,谁拿去用都一样!”
几个月以后,南阳课题组完成了26键的五笔字型汉字输入法。1983年8月五笔字型在郑州召开鉴定会。鉴定会的文件中写道:“郑易里先生关于汉字研究的理论是当今比较系统完整的科学理论。这一理论不但为大家所公认,而且已成为许多字形编码研究的基础……”
“郑老是我们南阳从事字形编码研究的导师。我们对郑老关于汉字理论的学习和认识是逐步加深的。虽然我们前期的研究也贯穿着郑老的理论,但真正全面地运用郑老的理论于汉字字形编码的实践,则见于我们的26键五笔字型汉字编码方案。”在报告的最后写道:“我们不知道怎样用言语表达我们对著名学者郑易里先生的感激之情……”可以说,“如没有郑老的理论做基础,WBZX(五笔字型)方案将不能成立”。“如没有郑老的教益和指导,也许到今天我们还一无所获!”按当时王永民的主要助手张道政的说法,五笔字型和郑易里先生的六笔字型并无重大区别,两者之间是有密切关系的。鉴定会后,大家都非常高兴。但是,郑易里却清醒地告诫课题组说:五笔字型在字形拆分的规范方面还有许多问题,汉字编码是涉及文化和教育的大事,应该尽量做到规范化,希望改进以后再推出。可是市场不等人。王永民等人还是迫不及待地将五笔字型推出了。尽管如此,郑易里还是以他博大的胸怀,为了鼓励年轻人的发展,书写了热情洋溢的祝贺五笔字型诞生的讲话。五笔字型由于适应了当时社会急需快速输入汉字的需要,推广得很成功。但是,它的繁琐、缺乏系统性和不规范性,也引起越来越多专家的责难。
这时,郑易里感到自己对社会的责任并没有完成,一个比较理想的汉字输入法还没有产生。什么是理想的汉字输入法呢?它要完全符合国家文字规范与人们头脑中对汉字的认知;要容易学,使老幼都易上手;要有每分钟超过200字的口语速度;要通用,也就是中华民族的全部汉字、日本汉字、韩国汉字用它都能轻易地编码和输入;而且要有一个完整的编码规律和科学体系。
1985年5月,郑易里的《26键汉字拆根输入码》在中国农科院的大力支持下通过了鉴定,专家们给予很高评价。而这时的郑易里,已在80岁高龄下离休了。他半个世纪的努力和愿望,不该只诞生一个不规范的五笔字型就草草收场。3年后,在1988年一个偶然的机会,他有飞机制造工程师职称的女儿毅然接过老父的接力棒,而她的丈夫,是一位管理专家。他们优势搭配,在郑老的指导下,又得到了中文信息界的许多专家的支持,共同对父亲的科学成果进行了创新和优化,从而使郑老的26键成果,迅速得到提高。在文字系统的规范、重码率、编码的规律性等方面,又有一个飞跃。1990年7月,经过国家主管部门组织的严格评测,编码输入系统各个测试项目全面达到优秀,总水平居世界领先。11月,几乎集中了我国大部分的文字学家、计算机专家、教育学家的国家级鉴定,充分肯定了郑易里在我国编码学术领域的奠基性贡献和郑码编码系统在理论性、实践性等方面的世界领先水平。
在鉴定中专家们还发现,郑易里和女儿郑珑独具匠心地为郑码设计了一种查字法。它将郑码字根按一、丨、丿、丶、乙五种规范的笔画顺序排列,又根据汉字笔画的起笔的频度和英文从A—Z的序列设计了具有联想功能的查字表。这样就科学地将人工检索汉字与计算机检索汉字有机地结合在一起了。它的意义在于,如果字典摒弃多歧义性的部首检字法而采用与计算机检索汉字原理相同的郑码字根检索法来检索汉字,那么,从小使用这种字典的孩子接触计算机后,郑码检索法就是输入法,能快速地输入汉字,完全不用新学或培训。试想,这会对提高全体国民在信息时代的科技素质起到多么重大的作用啊!
1992年中国标准技术开发公司根据国家课题完成了当时世界最大的6万电脑大汉字库,但无法检索应用。专家们分析了各种输入法后,认为只有郑码才有可能完成。果然,郑珑用了不到20天,就将6万汉字全部编码完成。在国家电脑大汉字库诞生的新闻发布会上,操作员用郑码轻击4键就能准确和快速地从6万汉字中检索出任一汉字!
到2002年,应用郑码的快手,输入汉字的速度已超过每分钟240个汉字,超过了正常语言速度,成功地解决了汉字快速输入的历史难题。
1996年10月,以郑码为核心的《计算机全汉字信息处理系统集成》项目荣获国家科委、国防科工委、中国科学院、中国科协、中国自然科学基金会5单位联合颁发的全国科技信息优秀成果一等奖,此为我国科技信息界最高荣誉。1999年,该项目又荣获“国家科技进步奖”。
2000年,继1995年Windows所有中文版全部预装郑码以后,在所有英文版的多文种处理中也预装了郑码。
2002年,美国IBM公司全面预装郑码汉字输入系统。
|