中国科技术语

• 两岸词苑 • 上一篇    下一篇

海峡两岸信息技术术语异同与优化

王有志   

  • 收稿日期:1900-01-01 修回日期:1900-01-01 发布日期:2006-06-15

  • Received:1900-01-01 Revised:1900-01-01 Published:2006-06-15

摘要: 摘要 信息技术(Information Technology,IT)术语的数量十分庞大,但组合语所占比率很高,由各单词的含义“猜中”组合语的含义的比率更高。因此本文选出1000个基础术语元(素),经对比分析可知:两岸术语元完全相同的约占六成;加上虽有差别却不言自明的术语,“易交流度”约达七成;对于定名不同,但与概念一一对应的术语,经熟悉对方用语的短暂过程后,易交流度升至约八成。而对同名异“实”,会引起严重误导的术语,提出“直译首选”、“压缩多一对应”和“避让既占”三条规则并以此作了优化模拟,假如定名时都遵守这些规则,易交流度几乎达到九成。另根据影响易交流程度的同一量化方案,估计出IT术语在“英语圈”的易交流度为90%~92%。可见“华语圈”要达到这样的水平,绝非不可企及,问题在于协调和优化。
引言
信息技术(Information Technology,IT)无处不在,所用术语,浩如烟海。在专业英汉词汇与词库中,收录的术语量已达数万至二十余万条,“部头”大得赶上了中型乃至大型通用英汉词典。要想对两岸术语定名的异同逐一分析对比,犹如老虎吃天——一时无从下口(手)。
好在其中“组合语率”(combining-term ratio)颇高,据统计,在三四千条术语集(如参考文献[1],[2])中,约占75%;在数万条以上的术语集(如参考文献[3])中,则不低于90%。而由各单词的含义猜对各自组合语含义的“猜中率”(hit-it ratio)更高,据抽样,在85%~90%,即“十之八九”。当然,这里的“猜中”是指理解无误,并非一字不差。比如对star network,可猜成“星(形,状)网(络,路)”。其原因在于:由单词到组合语的语法,无论组合语是并列结构或偏正结构(包括修饰、主谓和动宾)结构,两岸之间几乎感觉不到有任何差异。
于是想到,可以从基本构词元素着手,先行探索。
一、基础术语组成与异同比率
组成:在ISO(国际标准化组织)IT术语集的系列标准[1]中,有定义且可比的单词(words)+固定短语(set phrases),共选出1000个广义单词。
这些广义单词是组成该术语集的基本构件,不妨称之为“术语元”(term element,缩略为termel)[4]
本文讨论的IT术语,其定义与英语拼写,以参考文献[1]为准;两岸用语则分别以参考文献[2]与[3]为准。
两岸用语分相同、相异和半同半异三种情况。
(一)相同词(汉字简繁体差异不计,下同),例如表1:

(二)相异词,例如表2:

(三)半同半异词,例如表3:

对1000基础术语异同比率汇总如表4:

二、相异词分类
按交流时由易到难的程度,可将相异词分成三类。
(一)“0”类(自明别名):易理解可交流。在不讲究用语的“规范”与“首选—又称”时,将其归入“相同词”未尝不可,因此称之为“0”类。例如表5:

(二)“1”类(同“实”异名):单义一一对应。乍听耳生,经简短熟悉过程之后,对沟通并无大碍。例如表6:

(三)“2”类(同名异“实”):会引起严重误导。例如表7:

相异词分类汇总如表8:

三、便利交流法的当前办法
(一)弄懂相异词,“一回生,二回熟”,使陌生的“1”类异名转为熟悉的“0”类别名。在日常交流中,一实双(多)名屡见不鲜:“草鱼”雅称“鲩鱼”,“芫荽”俗名“香菜”。这并未带来多大问题。在参考文献[1]的第1~28部分中,除2705条定义与首选术语(preferred term(s))外,另有648条允许的同义语(permitted synonymous term(s))和缩略语(abbreviation),即平均每四个概念中就有一个带有异名。
(二)专业群体实现“华语圈”口头或书面初级交流时,可采用以下的应急办法:预先浏览两遍“须知异名表”(Need-to-know alias list)中的近200个词;交流时避开“禁忌词表”(Taboo-word list)中的近100个词,遇到这种词时,以相应英语词语作为替代或括注说明。
四、对今后新词定名规则的建议
信息技术术语,归根结底,由使用者约定俗成,并随技术演变而沉浮。对于新涌现的术语,为提高两岸术语的易交流度,这里提出三项定名协调规则:
(一)对于占术语量总数约99%的译入语,强化“直译首选”(preference for literal translation),预防“过本地化”(over-localized)和“过个性化”(over-individualized),使“1”类词转化为“0”类词或完全相同词。
例如multicast,在参考文献[2]中定名为“组播”,其定义是“向选定的一组目的地传输同一数据”。不叫“多播”而叫“组播”,有“并非多次广播”的言外之意。在这里,“组”比“多”带有定义中的更多信息。但利中有弊:回译时易误作“group broadcast”;且在该参考文献中,以multi-作前缀的复合词共有27个,唯独此词开头以“组”代“多”,不免“过个性化”,即过于强调条目中的特定内容,以致失去了对应前缀multi-的共性。
又如volatile,在参考文献[3]中定名为“依电性”,是说一种存储器的“内容断电即失”特性,抓住了主因“依电”。但回译时多半会想到“power-dependent”,也有同样的美中不足——“过个性化”。
(二)在基础概念与术语的关系上,“压缩多一对应”(minimizing many-one correspondence),预防“欠本地化”(under-localized)和“欠个性化”(under-individualized)。会使“半同半异”词数骤减。
比如security,在参考文献[2]中定名为“安全(性)”,与常见的safety“同名”。虽则符合在该领域的使用习惯,但对未必通晓《计算机安全》英译的多数读者,多少“欠个性化”,往往难以把两者分清:应对黑客活动的“安全”该用security,应对异常事故的“安全”才用safety。
同样,horizontal和lateral在参考文献[3]中都定为“横向”,回译时因两者的定名一模一样,缺少个性,所以也不易辨别开来。
(三)及时了解不同地域的既定名称,试行“力避既占”(avoidance of the occupied),定名宁可相异,切忌交错复用,即力避“2”类词语。
五、易交流性与易互译性及其评测
对IT基础术语(集),在华语圈内,可进行“易交流性”(inter-communicability)评测;对英语圈,可进行“易互译性”(inter-translatability)评测。
这两种指标的定义如表9:

对单个术语易交流性的量化方案如表10:

←┄┄●压缩多一对应**
←┄┄●直译首选
←┄┄●避让既占
注*:±号的选择取决于是否熟悉“异名”。
**:表下首行箭头,表示“压缩多一对应”的目的,是将“半同半异词”转化为“别名”,甚至“相同词”;表下第二、三行的示意依此类推。
根据单个术语的易交流度和前述对1000个基础术语的分析,可算出对术语集的易交流度。
对不熟悉“异名”的群体为千分之
555×l+71×1/2+116×3/4+183×1/4+374×0=723.25,即72%。
对熟悉“异名”的群体为千分之
555×1+71×l/2+116×3/4+183×3/4+374×0=814.75,即81.5%。
六、对基础术语的优化模拟
前文中所述的三项定名协调规则,对提高易交流性能有多大潜力?尝试对两岸现有基础术语作一优化模拟,即对其中的相异词及半同半异词,按这三项规则作出选择:
(一)对“0”类词,按“更合直译”规则选择。例如probability(词根probable“大概的”),在“概率/机率”中选“概率”;又如private(词根privy“私人的”)在“专用/私用”中选“私用”;直译程度不分上下者存异。
(二)对“1”类词,作类似选择。例如trapdoor,在“陷门/暗门”中选“陷门”;又如burn-in,在“老化/烧入”中选“烧入”。
(三)对“2”类词,通过“直译首选”和“避让既占”,推定有六成术语转化为相同词或“0”类词。例如online,在“在线/连线”中选“在线”;又如pipeline,在“流水线/管线”中选“管线”。
(四)将“半同半异”词中的多对一,拆改为一对一。例如,将safety与security原来都对应“安全”,拆成分别对应“安全”与“保安”;又如,将horizontal与lateral原来都对应“横向”,拆成分别对应“横向”与“侧”。
基础术语“优化”前后类别与词数分布如表11:

由此表即可算出,对不熟悉“异名”的群体,易交流度升至86%,对熟悉“异名”的群体则高达91%。即分别提高14%与9.5%。
七、与英语圈IT基础术语易交流度的粗略比较
对比起来,英语也过于庞杂灵活,从其圈内的易交流度的角度看,并非理想中语言。拿IT基础英语术语来说:
(一)在1000个基础词中约有200个异名。如在参考文献[1]的“信息技术”部分,entropy(熵)又叫average information content(平均信息量)和negentropy(负熵)。究其原因,恐怕是出自不同学派、厂家或地域而尚未取得共识所致。这在易交流性上,要扣除200×1/4=50个千分点,即5%。
(二)其基础术语中,约有50个同形异义词。例如decimal既作“十进制(的)”,又作“(十进)小数”;又如key在“计算器”部分是“按键”,在“安全性”部分是“密钥”,在“数据库”部分是“键码”。这要再扣除50×1/2=25个千分点,即2.5%。值得注意的是,英语中的这种“多指”现象,造成连参考文献[1]这样的国际标准文本,也难免张冠李戴。而这些,在相应的汉语术语中,反倒区分得一清二楚。
(三)在其基础术语的定义与释义中,少数抽象概念与具体对象不分,硬件与软件莫辨,此类术语有20多个。例如management既作“管理”,又作“管理人员”;又如monitor既是“监视”,又是“监视器”或“监视程序”。这还要扣除其20×1/2=10个千分点,即1%。
单凭以上粗估,便知英语圈IT基础术语的易交流度,充其量在90%~92%。而汉语圈要达到这样的水平,绝非不可企及,问题在于需经过协调和“优化”。
结语
所有这些,都是为了提高华语圈内IT术语的易交流度,提高华语圈与英语圈之间IT术语的易互译度。这两种指标密不可分:假如以英语作“对接语言”(mating language),定名时各自提高对英语圈的易互译度,则有望全面提升华语圈自身的易交流度。
在协调与优化华语圈lT基础术语易交流度的过程中,关键是将“带异名率”(with-alias ratio)和“同形异义词率”(homograph ratio),降至英语圈的可比水平。
以上分析与初探,带有“模型化”性质,权作引玉之砖。