曩鎏 关孑目前计算枫汉字输人响思考 文0霍生玉(徐州师范大学教科院) 曾美勤(中国人民解放军海军工程大学) 00%。【4】在 摘要:目前,计算机汉字输入存在两个 入法的达85%,青少年用户近l方面的问题:一是一些活力汉字打不出来; 拼音输入状态下,键入l笔画字,与键入3 6 二是一些我们习用的固定词语却需费时费 笔画字,耗时和用力完全一样。因此,笔画 力地一一选字才能打出来。因此,在新形势 多寡已不再成为汉字输入的障碍,唯一要 下,电脑通用字库应当更新,收字应由过去 关注的是时代发展对文字进化的需要,即 的以字形简洁为重要原则转变为以表意精 字义和情感色彩微妙差异表述的需要。根 确为第一旨归,由以经济实用为第一原则 据信息学中的负熵理论,信息量越大,不定 转变为以区分度大,字量足够丰富为重要 性就越小。信息只有存在差异,才能将此事 标准 同时,应立足于现代用词的层面,改 物与彼事物相区分。【5】对于汉字来说,为了 进汉字输入法,提高计算机汉字输入速度。 更有效地区分彼此和精确表达,则从理论 关键词:电脑通用字库;汉字输入;表 上要求增加字的信息量和区别特征,即增 加字的笔画或繁化字的结构。那么,在目前 意精确;区分度 计算机时代,电脑已成为现代社会须 拼音输入日益为人们所习用,笔画多寡已 爽不可离的工具。一般人使用电脑主要是 不再成为汉字输入障碍,字义微妙辨析和 用来进行汉字处理工作。然键盘敲过,键字 情感色彩表达精确已经成为第一需要的新 织文间,笔者时常遇到两个问题:一是一些 形势下,如果将这一原理运用于字库的更 活力汉字杏然无踪。如本想键入“晾望”,却 新和改造的话,收字原则就应该由过去的 跳出“了望”,“晾”字根本打不出来。“嘹 以字形简洁为重要原则转变为可以在一定 望” 岂能等于“了望”,了无指望?不禁兴 程度上忽视繁琐字形,而以精确微妙表达 味索然!二是一些早已为我们习用的固定 为第一旨归。 二,字库收字应由经济实用为第一原 词语却需要费时费力地去一一选字,才能 打出来。如:互联网、下载、博客、动漫、 则转变为以区分度大、字量足够丰富为重 酒吧、像素、空姐、世贸、与时俱进等等富 要标准 于时代内涵的新词新语的被迫肢解。第一 由于过去我国计算机技术还处于起步 个问题是囿于计算机给定字库的限制,第 阶段,计算机容量不够大,速度不够快,字 库收字只能以经济实用为原则,数量上尽 二个问题是属于汉字输入法的缺憾。 我们先谈第一个问题。一般电脑所配 量够用即可。我们在打字过程当中,时常会 装的通用字库都是国家标准总局发布, 遇到一些活力汉字打不出来的情况,比如:“具”,作为繁体字简化为“兴”,字库不收。 1981年5月1日实施的国家标准((GB23l2— 8 0信息交换用汉字编码字符集一一基本 “兵”本从同从舁,简化后的“兴”不属于 集》。[11该字库收入了6763个汉字,出于该 六书的任何一种,既无形也无声。世界上任 字库的汉字,既无法输入,也不能打印。在 何文字如不属于表意文字,则应当是表音 电脑日益普及的今天,显然,这并不能满足 文字,不管表音或表意都能加快认字的速 般工作的需要,更不要说满足特殊工作 度。既不表音也不表意的简体字应该不能 的需要了。时代在发展,社会在前进,已经 算是成功的简化字,这种做法破坏了汉字 一羹羹 下面再谈谈第二个问题,这显然是属 于汉字输入技术的问题 众所周知,每种汉 字输入软件为了提高输入速度,都会为固 定词语的输入设置一些快捷键。如“共产 党”一词,用拼音输入的话(拼音输入法的 弊端就在于一般字词的输入都需要费劲地 去一一选字,因为汉字同音字太多),只需 敲击“g、C、d”三键即可,不需键入全拼, 更不需一一选字。然而,笔者在输入当中, 却发现了一个和时代发展不相适应的情况, 比如:在智能AB C输入状态下,输入一个 上世纪六、七十年代风行的词语“牛鬼蛇 神”,只需敲击“n、g、S、S”四键即可,根 本不需选字;而输入一个今天为我们所习 用的词语“与时俱进”,却需要敲击“y、U、 S、h、i、j、u、j、i、n”十个键,并且要敲 击“+”键2次、退格键4次进行选字。再 如:我们只需键入全拼,不用选字就直接打 出了诸如“煤油、洋油、洋火、洋行、洋布、 洋车、生产队、又红又专、地主老财、的确 良、的卡”等现代社会已基本不用的词语; 相反,一些带着时代气息,与现代社会息息 相关,已进入现代汉语词汇的词语,像“手 机、社区、帐号、网站、点击、下载、互联 网、课件、激活、动漫、情结、情商、人气、 像素、酒吧、话吧、大吧、客户、空姐、淑 女、整合、原创、品牌、真丝、全棉、婚纱、 股市、奥运、世贸、传销、直销”等等,却 要瞪大眼睛,费时费力地去一一选字,“千 呼万唤始出来”。笔者还试过五笔字型、微 软拼音、紫光拼音等其他多种汉字输入法, 情况也是大同小异。这种一些已基本退出 历史舞台的词语能快捷输入,而一些现代 汉语高频词汇却遭冷遇,被残酷肢解的现 象,不能不引发我们思考。在计算机领跑科 技的今天,社会面貌日新月异,社会变革必 然引起语言的变革。新时代语言变革的显 著特征就是新词新语如潮涌般出现,[8】这些 词语应该要能方便快捷的输入才行。因此, 我们应该立足于现代用词的层面,以胸怀 全球、放眼未来的发展与前瞻的眼光来发 展汉字信息处理技术,改进汉字输入法。只 有这样,才能真正适应计算机时代对我们 的要求。 以笔者寡陋,上述只是几点浅见,希望 引发学界和民间思考,重新审视计算机时 代对文字信息处理的要求,对电脑通用字 库及汉字输入重新洗牌,联袂开出一张满 意的清单,剔除死寂字词以瘦身,请缨活力 字词以纳新,引导汉字向字义微妙辨析和 情感色彩精确的高级方向进化,方无愧于 通用了三十来年的电脑字库也应该与时俱 进才对。时下正值换发二代身份证之际,国 家相关部门研制开发了GB l 3000新字库,扩 大了国家标准字库的容量,含汉字达322 5 2 个,是当前计算机系统中所能支持的最大 的汉字库。【2]该字库作为办理居民身份证的 专用字库,以生冷僻字的收入为旨归,这对 于通用字库来说当然没有必要。那么,应如 何对电脑通用字库进行更新,使之更符合 般用户基本的用字需求呢?这是一项牵 发而动全身的浩大工程,须得大量专家 学者齐襄共举才行。这里,笔者不揣鄙陋, 冒昧就此提出一些思考,以起抛砖引玉之 一一的表意性,干扰了汉字的整个构形系统。 “茹”,作为繁体字兼并于“面”, 麴条、骊 功效。 字库收字原则应由过去的以字形简 洁为重要原则转变为以表意精确为第一旨归 受汉字简化必然趋势的影响以及过去 计算机输入技术的限制,现行电脑字库的 制定以字形简洁为重要原则,偏向于收入 些字形简洁,易识易写的汉字。因此,也 一 一在一定程度上造成了汉字分辨率的降低。【3】 如“己”、“已”、“ 巳”三字易混,尤其是 在电脑屏幕上看起来更是费劲,非得把眼 睛瞪大了不可,这是因为三字差别过于细 微所致。再比如,“风”(凰)和“凤”(胤) 不分,“戈 和“戋”(菱)相淆,“阴”(蓓) 和“阳”( )难辨,“设有”和“没有”几 乎肯定与否定颠倒。今天,随着各种拼音输 入法的发明,拼音输入越来越为人们所习 用。据统计,全国用户使用标准智能全拼输 包等颏食与面子、桌面、门面一锅煮。汉字 文化的魅力不知打了几多折扣! “醅”,作 为异体字兼并于“哲”。其实,双吉与双喜 样,本是中国特有的民俗文化现象,不宜 违拗民俗轻易扼杀之。再如生活中经常闹 出诸如“皇後”、“开鬟公司”、“理骚店”、“才 乾”之类的笑话,也是这个原因。文字进化 的一般规律应该由粗略模糊向精确微妙方 向行进。[6】诸如此类的汉字简化,无疑是一 种退化,直接影响到汉字的表现力,导致汉 字文化魅力削弱的结果。如今,科技昌达, 电脑技术突飞猛进,容量、速度都已不成问 题。计算机已日益取代纸笔成为人们最重 要的书写工具,用计算机进行文字处理也 应该由简略粗疏向表意精妙方向进化。根 盛世的呼唤。 据信息学理论,信息要能够表现差异才成 附注: 其为信息。[7】那么,为满足新时代表意精妙 ①高更生.电脑通用字库应当更新一~谈 的需要,电脑通用字库收字数量就应足够 “GB231 2--80”存在的问题.语文建 ̄J]2OO1(9)22 丰富,才能区分度大。《现代汉语通用字表》 ②为换:代身份证国家字库添新词.e法网? t%p://www.efa.w.cf1.2008—7—1 收字7000个,电脑通用字库收字仅6763个, h⑤李菡幽.关于汉字简化的回顾与思考.遵义 我们认为,字库收字应当达到或超过 现代 师范高等专科学校学报[J].2000(1 2)29 汉语通用字表》的字数,才能满足用户基本 ④潘丽敏.被兼并掉的汉字文化魅力——计算 的用字需求。因此,我们希望有关部门重新 机时代对汉字简化的反思.汉字文化[J]2006(5)88 ⑤钟舟海,高小艳.从信息学的角度看汉字的 审视计算机时代文字改革的方向,根据新 J].2006(1 0)90 时代汉字信息处理的要求,拯救大批活力 简化.江西理工大学学报[⑥同④.89 汉字于冷宫寒窑之中,不断充实更新电脑 ⑦同⑤.90 通用字库,使汉字文化的魅力在计算机时 ⑧刘海燕.网络语言[M].中国广播电视出版社. 20j 代熠熠生辉! 一l92
因篇幅问题不能全部显示,请点此查看更多更全内容