汉语拼音发展路径图 吴文超 面对国际单一罗马化书同文的前景, 中国语文需要改变范式(paradigm) 或通 盘设想,通过落实一语双文倡议来发展字母范式 字母符号系统 两千多年前在地中海东岸诞生的拼音文字已经为大多数语文所 采用。 拼音文字能够把形、音、意紧密结合起来,大大减轻学习负担。 符号数目小和封闭性的音素字母便利语文的学习、书写和机械处理。 字母系统是古代欧洲从地中海东岸引进的最伟大发明。字母文字孕育 出光辉灿烂的希腊和罗马文明。 优势语文促进政治、经济、文化的 发展, 使国家富强起来。历史上字母文字随着武力扩张而传播开来。 虽然迟了两千多年, 但字母文字终于进入中国这个硕果仅存的非字 母大国, 产生日益深远的影响。 语文挑战的回应 -- 范式的改变 世界众多语文都经历过字母化改革。尽管汉语简洁灵活,但非字母 汉字阻碍语文发展。环顾世界,字母文字社会不需要非字母文字, 而非 字母文字社会却需要字母的辅助。 例如字母辅助教学和语文信息处 理。 中国目前在语文领域的头痛医头办法是不足够的, 就像清末洋 务运动那样无济于事。 基于穷则变,变则通的道理, 回应字母文字挑 战有必要采用改变范式的办法。中国需要摆脱着重民族形式的纯洁语 文陷阱, 通过发展一语双文来建立强势的字母文字。 鉴于中国缺乏 字母传统, 有需要长期实行一语双文制,以便乘先启后,延续和发扬光 辉的传统文化。 十九世纪面对西方列强的侵略,中国的回应不足以抵御外敌。 经 过无数次失败后, 出现冷兵器让位于热兵器的范式改变。民族形式武 器逐渐消失,而传统的武术得以艺术形式保存下来。语文领域面对的 挑战也需要类似的变革。非字母文字像冷兵器,而字母文字则像热兵 器。中国成功改变语文范式后,洋文最终也会像洋枪、洋炮那样成为 历史名词。 我们可以利用先进科技来支撑汉语文的使用,但汉字编码却进一步增 加语文学习和使用的成本。中国盛唐时周围地区没有文字, 而今天却 被拼音文字包围。原来采用中文的韩国和越南已经改用字母文字。日 本的汉字使用也在收缩。英文成为科技领域的教学和科研语文,信息 技术方面尤其如此。 在开放性社会里, 似乎没有什么办法能够阻止 人们改用更有效的语文。汉语拼音已有半个世纪历史了。拼音发挥的 作用虽然因缺乏文化传统而受到限制,但其成果是有目共睹的。 拼音 的应用已经从注音识字扩大到包括辞典检索,中文输入处理,和人地名 转写等方面。 归根到底, 改用字母文字范式才是语文挑战的有效回 应。 为了促进语文范式的改变,本文探讨从汉语拼音到字母中文的发 展路径图,提出一些具体建议来克服发展进程中出现的困难。作者归 纳出的发展原则是: 汉语中心,结合英文,字母标调,一语双文。 这里结 合英文的考虑主要在于减低语文壁垒,增加双语的学用效益。盼望大 家能够取得共识,避免多走弯路,以便早日实现语文现代化。 世界语文新趋势 -- 单一罗马化 字母化是世界语文的共同发展方向。但在表音和表意之间往往出 现鱼与熊掌的取舍。英文虽然着重表音,但往往为了保存表意词根而 放弃更为简洁的拼音。例如night,knight; know,no;和two,too等都保 存了不发音部分。 保留外语词的独特拼式有保存词源信息的作用。 在今天的“战国”时代,使用罗马字母的语文采用的单一罗马转写法 其实应用了中国秦代的书同文语文规划原则--只求同形, 不求同音。 二十世纪70年代,联合国地理名词委员会通过决议,规定对非罗马文 字国家的地名采用名从主人的单一罗马转写式。从那时起, 西欧各语 文里,中国首都一律拼写为Beijing。单一罗马化的考虑是:信息技术 需要单一字符标签(地名标签),读音不在考虑之列。况且就算音译地 名,也不见得能读得准。这一点从中文音译外国地名中可以看出来。 虽然‘加拿大’和‘土耳其’的读音跟英文Canada 和Turkey 出入 颇大, 但却不妨碍它们在汉语中的使用。在诸如检索、自动化信息处 理、光学字符识别等领域, 迫切需要的是书同文而非语同音。当前罗 马文字书同文的应用已经扩大到包括人名、新词和标签等领域,以便 克服语文壁垒产生的困难。考虑到单一罗马化的趋势,中国语文现代 化的范式改变应该是字母化而非拼音化。 地名拼音 汉语拼音地名除了Shaanxi省采用字母标调之外一般不标调。由 于汉字信息量高,不标调也可以加以判读。 拼音地名却不同,很难把声 调读出来。幸而拼音地名经常跟汉字连用, 因此不存在读错的问题。 外国人把北京读作Bei1jing1问题不大,反正预计他们是读不准的。 不 过, 如果地名采用如Shaanxi式字母标调拼音, 除读音更明确外还能 把跟Shanxi省区别开来。 姓名拼音 由于单音节拼音对应多个汉字, 拼音姓名无法还原为中文。为了 避免混淆,香港身份证一贯附上姓名电报代码来作区分。笔者研制成 功与汉字一一对应的单码具有定音、定调和定字的特点。例如 武 wu32?伍wu35 (表示wu音,第3声, 和分别为第2和第5个字)。 我 们也可以利用单码来给汉字姓名排序, 把写法相同的同音汉字排在 一起, 也可以用单码向非汉字系统传送可读性高和能够还原为汉字 的姓名信息。 汉语拼音的网络应用 1958年第一届全国人民大会通过旨在辅助普通话教学的汉语拼 音方案,采用符号标调。汉语拼音比注音符号优越, 不仅因为它使用符 号少的罗马字母, 而且其音素制容许改变拼法来作区分,例如把‘文 字’和‘蚊子’分别拼写为‘wenzi’和‘wenz’。 不过, 拼音的标 调符号和字母ü不方便键盘处理,连中文打字机也没有标调符号。如 果汉语拼音能够彻底采用国际流行的字母, 效果肯定会好得多。 针对上述情况, 国家语言文字工作委员会的“汉语拼音方案的通 用键盘表示规范” 已于2001年6月1日生效。其中包括规定用 v 来替代ü, 用 ea 来表示 e?和用数字1、2、3、4、5来分别替代四个 声调及轻声。 这个规范作为注音和拼写普通话的键盘变通办法是有 好处的。 五十年代汉语拼音设计者们考虑到字母国际接轨问题,但可 能由于当时键盘尚未普及, 因此没有周详地考虑键盘的兼容问题。今 天在长期键盘使用实践基础上适当地修改拼音符号系统是合理的。 鉴于替代用法会形成习惯,有可能进一步成为未来的标准,我们应 该提出意见。笔者认为,v 在英文和方言中有不同于ü的发音。 我 们总不想把DVD读成DüD吧。 以ny替代ü的做法又因 y可能与 后面音节结合而不宜推行(例如:jinyu可以被读成jin-yu金鱼或ji-nyu 妓女)。 那么用eu来对应ü会好得多,金鱼和妓女分别为拼写为jinyu 和jineu。 至于1、2、3、4、5 的使用, 实际上混淆字母和数字两套 符号系统。 不但会因增加符号而减慢击键速度,而且不利于以后拟定 跟同音异写汉字对应的同音异拼。 从标原调改为标变调 汉语拼音的标原调规定似乎以原则上保持与汉字对应为理据。 但这样做却增加学习和记忆变调的负担。 改标变调更能发挥拼音准 确表达语音和声调的优势。 目前的标原调规定令语音合成技术无法 单靠标调拼音来进行变调,因为在处理''一''和''不''变调时,语音合成 输出变调与否取决于汉字而非标原调的拼音。 这样做导致增加语音 合成的复杂性和技术难度。如果规定标变调,还可以考虑增加前、后 半3声标调符号, 以便更好地反映声调的实际变化。 考虑到字母范 式并非纯拼音范式和字母化中文不需要标调符号,应该规定标调符号 只适用于教学和词典注音。 输入法 -- 分词连写,字母标调 不标调单音节平均有25个同音, 双音节减为1.7个, 三音节1.2 个而四音节则基本上没有同音。这也许是中文成语多为4音节的缘 故。 根据这项统计,分词连写大大减少同音。连写的拼音输入法除较 有效之外,还可以巩固分词习惯。 语言学家是为了更好地纪录多音节 汉语而主张分词连写的,而便利汉字输入只是附带好处而已。 如果要 让拼音与信息量高汉字更加匹配,就需要增加音节数目。加入声调信 息是增加音节数目的好办法,而字母标调有两个好处: 1.不增加符号, 仅靠改变或增加字母来标调,便利快速盲打。 2. 容许同音异拼,进一 步增加拼音信息量。 除非为区别多音节词所需,字母标调以多同音词 的单音节词為對象。无同音混淆的双音节词不必沿用单音节的标调, 而一种标调拼式也可以代表几个汉字。前者如:jjin 今,jintian今天; 后 者如: zhiishi指使; zongzhii宗旨。 字母标调拼式明确,例如: 使用, 适用, 实用, 试用,食用可分别拼写为shiyong,shxyong, shycyong, shxyong, shicyong, 这类词的稳定拼写式能更好地表达词义和词性。 电拼输入法对2000个单音节词进行字母标调定形,加上400多个不 标调预设词,取得覆盖99%现代汉语词的优秀成果。通过适度增加拼 音复杂性来取得表达语素功能对一语双文的发展是很有利的。 由于 电拼输入法可以发挥文字功能, 一语双文的初阶很可能是实现电拼 和汉字双轨制的网络双文, 即把汉字文本反向转换为其镜面电拼文 本。 就输入法而言, 不使用定形拼音也可以用挑选同音词方法输入 中文。 因此,电拼的学用有很大灵活性, 字词使用频率的巨大差别让 用户只需要掌握一两百个定形拼法就可以大幅度提升输入速度。汉字 利用同音异写来区分词义,例如: 兄, 凶; 进, 近; 室, 市等, 定形拼音 也可用同音异拼与之相匹配,例如:大兄, 大凶拼写为da xiongb, da xxiong; 走进学校,走近学校拼写为 zou jin xuexiao, zou jinn xuexiao; 茶室, 茶市拼写为char shif, char shik; 而香蕉, 橡胶则拼写为 xiangjiao,xiangjiaob。 同音异拼抽象地继承了汉字传统的分化同音词 方法。由于文字是千百万人经常使用的工具,很难规范其使用和发展。 语言学家研究中、英文语素的结果显示,这两个极不相同的成熟语文 都有大约7,000多个语素。 因此,就语素的数目而言,字母中文2,400 左右定形拼写式尚有很大的增长空间。 拼音中文、正词法和同音异拼 令中文处理成本大增的编码应该被看作为应急的暂行办法, 很难 想象长期使用下去。在优胜劣败的竞争下,文字的应用需要考虑成本 效益原则。在一个开放性社会里,人们自然会选择使用不需要编码的 语文。英文目前在这方面有巨大优势。因此,有效的回应强调创制高 效字母文字, 兼有明确和易学易用的特性。虽然无数人经常使用的文 字很难彻底改革,但电脑中文输入法提供千载难逢的机会。 因为符合 语言学原则的输入法能够发挥文字功能。它一方面辅助汉字信息处理, 另一方面又与汉字构成一语中的双文之一。 汉语拼音正词法基本规则 (中华人民共和国国家标准 GB/T 16159-1996) 提出分词连写的标准。 目前欠缺的是在正词法基 础上编制拼音词典。正词法句头大写的规定是有商榷余地的。鉴 于拼音音节只有四百多个, 跟英文的七、八千音节相差甚大。 如 果刚巧在句头的普通词被大写了, 例如背景(beijing) 、程度 (chengdu) 、伤害(shanghai) , 便会跟Beijing, Chengdu 和 Shanghai等地名混淆起来。 句头大写在英文偶然也出现歧义, 例如china 瓷器因大写而变为 China中国。 由于汉语一向没 有句头大写习惯,大写应只限于专名,而句头通名不必大写。 下表举例说明汉字、电拼和单码的关系: 名称 操作程序 例句 电拼 键盘输入 shan qiong shui jinx yys wur lu, liou anh hhua mirng yiu i cun 汉字 转换输出 山穷水尽疑无路, 柳暗花明又一村 单码 自动转换 $C shan11qiong21shui31jin426 yi22 wu213 lu41 vdw1 liu31an42hua11ming21 you41 yi11 cun11 对应中 文 单码反向转 换 山穷水尽疑无路,柳暗花明又一村 注意:字母标调的电拼不用数字,单码则用数字定调和定字。 语文国际接轨 因特网 (互联网)克服时空隔阂,加强全球化势头。 时空分隔导致 语文独立发展的条件不复存在。今天语文发展的大趋势是国际接轨和 减低语文壁垒。 人们直觉地感到全球村需要共同语。 就语文固有的 功效来说,高度逻辑化和规律化的世界语(Esperanto) 比英文更明确和 易学易用。 然而, 如果不通过设立世界语文组织来大力支援,世界语 很难跟拥有政治、经济、文化优势的英语竞争。 有人甚至认为,英语 已经取得世界共同语的地位。 无论如何, 汉语文有必要通过吸收英 语词汇来加强其生命力,并且让诸如字母读音、标点符号和拼音字体 等次级语文系统尽可能与英文兼容,以便减低语文壁垒, 为未来建立 全球化书同文创造条件。 语文国际接轨方面还可以考虑: 1. 采用英语字母读法。这也许会稍微增加教学困难,但字母读法单 一化很有好处。 况且采用音节直呼教学法也许不大计较字母的读 音。 事实上, 把 b, p, m, f 按照注音字母读法读成 bo、po、mo、 fo也无不可。 不过,采用英语字母读法有减少语文壁垒和字母读音 混淆的好处。 2. 直接引进外国人、地名和新词(落实罗马字书同文)。 表音不准 确的文字基本上发挥类似汉字的标签作用。 但使用汉字的成本却 高得多。我们只需要知道omelette是法式煎蛋,spaghetti是意大利 面条, salad是生菜冷盘,coffee是饮料, 即可以享用它们。 传统上, 中译外语词采取选用通名或音译办法, 例如gongdola译为(意大利 威尼斯的)凤尾船;或(载客上下山的)缆车。 我们可以不吃西餐,但 西药却往往非用不可,Aspirin, Motrin, Tyrenol, Ibuprofen, Acetomophin都是止痛药,药性不尽相同, 后两种药分别是第二和 第三专名的通名(generic name),售价比较便宜。 如果通通把它们翻 译为止痛药,会损害词的明确性和实用性。 英语通常音译专名, 例如chow mian为(有广东菜特色的)fry noodles, 而 gungfu 则是 (源于中国的)martial art武术。 把外来词改用拼音转写, 例如把 salad,coffee,Shangri-la拼成为shala, kafei, Xianggelila,会淡化外来 词的特色。 单一罗马化着重保存国际书写式,即salad, coffee和 Shangri-la。 至于读法,可以有英读和汉读两种,随着双语能力的提 高,可能越来越多人采用英读。 英国人读法语词也有这种情况, 例 如buffet(自助餐)在英国的火车服务员中就读作buf-fet而不是法语 的bufei。 汉语在引进外来词时最浪费的是为它们造新汉字: 例如 咖啡, 鸸鹋鸟(澳洲的emu鸟)。 今天看来, 也许把咖啡翻译成为 ‘卡非茶'' 更好些。 3. 采用国际兼容的标点符号。本来标点符号是二十世纪初才引进的, 没有固有的民族形式, 但现在中文标点符号比外文复杂。 标点符 号国际接轨是一个容易落实和有利无害的做法,对字母中文尤其如 此。 4. 对于非汉化系统,例如在国际班航的机票务系统,字母中文解决无 法使用汉字的困难。在任何没有中文字库的电脑系统里,字母中文 可以传达汉字信息。与汉字一一对应的单码更能准确地保存全部 汉字信息。 5. 拼音字母的字形应该接纳国际上流行的字体, 包括诸如Arial, Courier, Times New Roman等字体。 结束语 1958年颁布的汉语拼音在各领域中的应用不断在扩大。 回顾过去, 我们应该庆幸拼音的诞生。 如果今天不能用来拼写中国人地名; 用 来进行汉字文书处理;和便利拼音排序, 中国语文的处境更加不利。 为了摆脱汉语文的使用困难,新加坡和香港都沿用英语为工作语文。 目前人们普遍着重学习英文而轻视拼音,主要因为学英语可得到更多 好处。长此下去,汉字和拼音的使用势将收缩。值得深思的是语文是 否必须保持独特的民族形式? 是否必须维护语文的纯洁性? 如果能 够在语音稳定时代创制出高效的字母中文,不但可以与英文并驾齐驱, 而且其表音准确和语法简明的优点可使之后来居上,成为强势的世界 语文。 信息时代给中国语文拼音现代化开启一个短暂的机会窗口,一 旦人们都习惯使用英文后,这个窗口可能永远消失。到时也许会出现 能否保存核心语文的问题。希望大家和有关当局能够掌握时机,努力 为实现一语双文而奋斗,让中国不再重蹈清末洋务运动失败的覆辙,避 免语文出现全盘西化的厄运。 汉字作为传统文化载体,其艺术性必然会继续获得肯定和发扬光 大。情况恍如今天风靡世界的中国武术。汉字书法也肯定会在艺术舞 台上历久不衰。不过,在信息技术、人际和人机交际等领域,汉字的 应用正在收缩,目前众多中国学者在科研和学术领域中已经能够熟练 地使用英文,而这种趋势正在加强。语文习惯也会像穿衣服那样,人 们在习惯穿西装后,就很难再穿起传统的民族服装了。 * 本文提交中国语文现代化学会第六次学术会议暨中国语文现代 化学会成立十周年纪念大会于2004年10月23至25日在山东省 泰安市召开的题为“信息时代的中国语文现代化”会议。 作者:吴文超 前联合国资深翻译员,美洲中国文字改革促进会 执行干事,高威软件有限公司主席兼总裁 联系电邮: apollowu@gowell.com 电话: (852) 2730-7121 电传: (852)2730-7127 网址: www.wengai.com; www.gowell.com, www.gochinese.net 文改论坛和有关专题: www.wengai.com 电拼和单码(Dianpin & ASCII Chinese)详细资料, www.gowell.com 普通话网上通GoChinese教学软件: www.gochinese.net 7
|