请登录[¤ 阳光论坛 ¤]参与讨论


阳光宝宝
90

 □ 主题: 从“万码奔腾”中解放出来
 □ 内容: 1楼

      作者:周有光 
       
       不必记忆编码的中文信息处理 
        
       中文信息处理,从它的主要功能来说,就是在“语词处理机”(电脑或电子打字机)上,输入和输出汉字文件(书信、文章、资料等),对文件加工、贮存、检索和打印;联系激光排印机进行排版和印刷,联系远距离的语词处理机进行文件的传输。 
        
       实现这些功能的第一步,也是最关键的一步,是“输入”汉字,“输入”汉字的方法经历了三个发展阶段。 
        
       第一阶段:“速成字输入法”。通过“大键盘”或“大字表”,用手指击键或电笔点触,把汉字逐个输入。这种方法现在已经不用。 
        
       第二阶段:“拆字编码法”。把汉字拆开,成为“笔画”或者“部件”,称作“码元”;把“码元”编成“代码”,在通用的字母键盘上,输入“代码”,变成汉字。汉字的笔画和结构非常复杂,“拆字”有无穷的可能性,因此已经产生了了七百五十种以上的“编码”设计,据说现在超过了一千种。人们戏称为“万码奔腾”!这是汉字输入法的第二阶段。 
        
       第三阶段:“拼音变换法”。输入“拼音”,以“语词”(包括“词组、成语、语组”等)为单位,自动变换成为汉字,叫做“拼音汉字变换法”,简称“拼音变换法”。这种不用编码输入法是汉字输入法的第三阶段。 
        
       “编码”需要学习,“拼音”也需要学习。不同的是,“拼音”在中国大陆是小学的必修课,“编码”不是小学课程。联合国、外国华人聚居区、外国学校的汉语课,都利用“国际标准化组织”规定为国际标准的“拼音”(ISO7098)。
——
      
争分夺秒背单词 → toad  n.蟾蜍,癞蛤蟆
 □ 发帖时间:2010-12-8|16:45:27 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:从“万码奔腾”中解放出来
 □ 内容: 2楼

      输入拼音、自动输出汉字 
        
       “输入拼音、自动输出汉字”有高低两个层次: 
        
       低层次:以“汉字”为输入单位。例如:输入“中国”把“中国”分为:“中”和“国”两个“汉字”,在键盘上分别打“zhong”和“guo”,打“zhong”屏幕出现“中衷忠盅”等同音汉字,从中选择“中”字,打“guo”屏幕出现“馘国掴帼”等同音汉字,从中选择“国”字。这叫做“同音选择法”。这种方法费事而缓慢,应当尽少使用。 
        
       高层次:以“语词”为输入单位。例如:输入“中国”,不把它分为“中”和“国”两个汉字,而是把它作为一个“语词”整体,只要打zhongguo,屏幕就出现“中国”(没有同音词)。这叫做 “以词定字法”。 
        
       “词组、成语、语段”的利用。“以词定字”,除以“语词”作为输入单位外,还要以“词组、成语或语段”作为输入单位。 
        
       “词组”多半是两个语词的组合(例如“破除迷信”、“强迫命令”、“经营管理”、“经验教训”等),可以作为一个单位来输入,也可以作为两个单位来输入。机关、团体和事物的“名称”,一般是词组形式。常用的“名称”可以作为一个输入单位,不常用的“名称”可以分为若干语词单位。 
        
       “成语”大都是“四言成语”,这要作为一个单位来输入。“成语”常常是“文言”,其中有很多生僻汉字,作为一个单位来输入,可以自动输出正确的汉字,不会出现错别字。例如:“惩前毖后”、“姹紫嫣红”,其中“惩毖”、“姹嫣”等汉字很生僻,写起来容易错误,由拼音自动变换成为汉字,不会错误。 
        
       “语段”是不成完整意义的语言片段,辞书一般不收。“常用语段”(例如:“看来”、“而又”、“之一”、“有的”、“用于”、“不是”、“也是”、“不能不”、“能不能”、“不至于”、“不方便”、“越来越…”、“百分之…”等),在打字时候常常要用到。作为输入单位,可以大量减少同意汉字的选择,对提高输出效率有显著的作用。这是由实际应用得来的经验,值得重视。 
      
——
      
争分夺秒背单词 → locust  n.蝗虫;洋槐,刺槐
 □ 发帖时间:2010-12-8|16:45:51 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:从“万码奔腾”中解放出来
 □ 内容: 3楼

      高频先见和用过提前 
        
       以“语司”作为输入单位,仍旧会遇到“同音词”。为了减少在一组“同音词”中的选择麻烦,要利用语司的“使用频度”。一组“同音词”,往往一个常用,一个不常用。例如:“完善”和“纨扇”同音,“完善”比较常用。“纱厂”和“沙场”同音,“纱厂”比较常用。处理机要“记好”哪个常用,首先把它显示出来。这样可以减少选择,提高输出速度。这叫做“高频先见”。 
        
       有时需要的语词凑巧是一个不常用的。这时候就不能避免在“同音词”中进行选择。可是,只要选择一次,不要选择第二次。处理机已经知道用户的“需要”,下一次就立刻把“需要”的一个首先显示出来。这是一种“记忆功能”,叫做“用过提前”。 
        
       “高频先见”和“用过提前”使同音选择减少到最低限度。 
      
——
      
争分夺秒背单词 → interest  n.兴趣;利益;利息
 □ 发帖时间:2010-12-8|16:46:04 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:从“万码奔腾”中解放出来
 □ 内容: 4楼

      对打简拼和双打全拼 
        
       输入“拼音”的打字有两种打法。一种是“全拼”,另一种是“双拼”。 
        
       “全拼”是通俗说法。正确的说法是:“逐个字母打”。每个音节平均要打三下,如果标调,要打四下。 
        
       “双拼”也是通俗说法。正确的说法是:“声韵双打”。“声韵双打”又有两种方式: 
        
       一种是:“双打简拼”。例如:“中”的音节zhong,分为声母zh和韵母ong,用v作为“双字母zh”的简拼,用b作为“复韵母ong”的简拼,打两下,出现“vb”两个字母,代表“中”的音节。用户要记好什么字母代表什么“双字母”和“复韵母”。“双打简拼”实际是一种“缩略码”,使用不便。 
        
       另一种是:“双打全拼”。例如:打zhongguo(中国),第一下整个出现“zh”,第二下整个出现“ong”,第三下出现“g”,第四下整个出现“uo”,不用简拼。每字打两下,就出现完整的“zhongguo”。“双打全拼”要求把“双字母”和“复韵母”都刻印在字键上,一看即知,不用记忆。 
        
       “双打”的原理是:奇数(单数)击键是“声母”,偶数(双数)击键是“韵母”。没有声母(aoe开头)的音节,要补打一个“零声母”打(o)。 Y和W作为“声母”。“双打”的击键次数最少,每个音节只打两次。以“语词、词组、成语、语段”作为输入单位,没有必要打调号,这对方言区来说是个方便。 
        
       “拆字编码”和“拼音变换”都可以规定“最常用字”一键一字的输入法。“拆字编码”的一键一字,例如:“G一,R的,B了,T和,J是,O为等,字音跟字母没有联系,不便记忆。“拼音变换”的一键一字,例如:“Y一,D的,L了,H和,S是,W为”等,字音联系字母,容易记忆。 
      
——
      
争分夺秒背单词 → blush  vi.脸红,害臊 n.脸红
 □ 发帖时间:2010-12-8|16:46:18 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:从“万码奔腾”中解放出来
 □ 内容: 5楼

      看打、听打、想打 
        
       使用中文电脑或中文电子打字机,有三种使用方式:看打、听打和想打。 
        
       看打:看着已经写好的文稿来打字,叫做“看打”。这是职业打字员的工作方式。这种打字,可以用“拆字编码法”,也可以用“拼音变换法”。 
        
       听打:听着别人讲话,在处理机上打成文字,这叫“听打”。“听打”有速记的作用,这是开会记录、法院开庭等场合所需要的工作。在拼音文字的国家里,办公室写信,常常是一人口说,一人“听打”。“拆字编码法”不便使用于“听打”。使用“拼音变换法”来听打,比较方便。 
        
       想打:写作者在处理机上自己写信、写文章,一面想,一面打,没有预先写好的原稿,这叫做“想打”。在拼音文字的国家里,这是最普遍的打字方式。对“想打”来说,“拆字编码”是不方便的。因为,“想打”时候,想的是语言,不是汉字。要把语言变成汉字,再把汉字的形体变成“编码”,这种多转一个弯的输入法,会干扰“想打”的思路。使用“拼音输入”,可以把想到的语言,立即变成“拼音”,不必考虑汉字如何写,由处理机去自动转换成汉字,而且简体繁体都能自动变换。 
        
       设计速度和操作速度 
        
       “输入速度”有两种:“设计速度”和“操作速度”。两种速度不可“混而统之”称为“速度”。 
        
       “设计速度”:打一个汉字,不同的设计,按键次数不同。次数多,速度慢;次数少,速度快。这可以根据设计来计算。“拼音输入”,以“语词、词组、成语、语段”作为输入单位,用“双打全拼法”来输入,每个汉字平均只打两下,不用标调。这是最快的设计速度。 
        
       这里要说明一点:计算“设计速度”,要看基本设计,不能看“缩略法”。“缩略法”能提高速度。可是,“缩略法”是任何设计都可以使用的,不是某一种设计的特点。例如:任何设计都可以用一个汉字或一个字母代表一长串文字。这是“基本设计”之外的“附加设计”。 
        
       “操作速度”:“操作速度”决定于打字员操作技能的熟练程度。同样的输入设计,各人的“操作速度”不同。比赛“操作速度”要用同样的输入设计来测定。“设计水平”和“熟练程度”是两种不同的因素。用不同的设计来测定所谓“速度”,只能得到“设计水平”和“熟练程度”两种不同因素的“混合效果”,既不能完全说明“设计”的好坏,也不能完全说明“熟练”的程度。 
      
——
      
争分夺秒背单词 → sweater  n.厚运动衫,毛线衫
 □ 发帖时间:2010-12-8|16:46:37 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:从“万码奔腾”中解放出来
 □ 内容: 6楼

      机械化和电子化 
        
       “打字机”有两种:一种是“机械打字机”,另一种是“电子打字机”(处理机)。 
        
       “机械打字机”是“机械化”时代的产物,已经有一百年的历史。汉字字数太多,不便造成灵便的机械打字机,写作者无法在“中文机械打字机”上起稿打写书信和文章。中国的知识分子失去了一个“机械打字机”的时代。 
        
       “电子打字机”是“电子化”时代的产物。“电子打字机”实际是一台微型电脑。它能够处理“大字符集”的文字,包括中文、日文和朝鲜文。“大字符集”的文字,只能通过“媒介”(“编码”或“拼音”)来间接输入,不能用字母来直接输入。可是这也使中国、日本和朝鲜进入了“信息处理”的国际行列。如何使“中文电脑”或“中文电子打字机”成为使用便利、不用编码的现代化“想打”工具,是“中文信息处理”今后应当探讨的课题。“拼音变换法”可以兼容台湾通行的“注音符号”。 
        
       “拼音变换法”起源于日本。日本处理机经过了三个发展阶段:整字输入、编码输入和假名变换。80年代开始,假名变换(包括日语罗马字变换)占领了整个日本市场。日本已经进入“无编码”信息处理时代。中国应当向日本看齐,急起直追。 
        
       从“万码奔腾”中解放出来! 
        
       上文所谈是本文作者的实际经验和研究体会,谨供同好者参考,并请指正错误、提出疑问。 
        
       长期以来,本文作者试用过多种输入方法,自己在50年代就设计过编码。“拼音变换法”本身必须精益求精,不断改进。但是,改进的方法是增加智能化的功能,不是附加编码。在过去六个年头里,本文作者用“拼音变换法”每天写信、写文章、写书稿,没有一天间断。实践使我深信:从“拆字编码”到“拼音变换”是中文信息处理向前发展的必由之路。中文信息处理完全可能从“万码奔腾”中解放出来。
——
      
争分夺秒背单词 → strife  n.冲突,竞争
 □ 发帖时间:2010-12-8|16:47:27 |回复|返回|

 页次:1/1页 每页10  本主题贴数5 分页: 1


你还没有登录论坛,所以不能发表你的意见。你可以选择:

1、我已注册,我要

2、我还没注册,我要

3、太麻烦了,我还是

Go Top

Copyright by(C)2003-2015 http://abc.sy578.cn