中国科技术语

• 论文 • 上一篇    下一篇

欧洲共同体委员会的术语数据库

周智佑   

  1. 中国科学技术情报研究所
  • 出版日期:1989-06-15 发布日期:1989-06-15

The Terminological Data Bank of the Commission of the European Communities(CEC)

Zhou Zhiyou   

  • Online:1989-06-15 Published:1989-06-15

摘要: 与联机检索文献相比,联机查用计算机化的词典(多语种或单语种术语数据库),在国内还是一个新事物。作者与中国科技情报所联机检索服务部的同事一道,于1988年8月下旬对欧洲共同体的术语数据库作了一次参观访问,现将所了解的情况介绍如下。
这一术语库简称EURODICAUTOM,意即欧洲自动化的词典。该库最早于1980年开始向公众提供联机检索,具体是通过欧洲主机组织(ECHO)提供服务的,ECHO的目的是利用其计算机内存贮的参考数据库与此种术语库向用户提供联机检索的。
用户状况
其用户主要是一些熟悉联机检索的机构,他们既查找一般数据库,也查找该术语数据库。在1981年8月在全部104家ECHO用户中就有95家要求查用此库,其用户包括大学、翻译部门、文献工作部门与出版商。与欧洲经济共同体联机网络(Euronet)的2000家用户相比,其用户尚少,这是因为它尚处于实验阶段,宣传推广不够。该委员会对此已有所觉察,正在改进之中。他们曾在1980年的英国专业图书馆与情报机构联合会机器辅助翻译者会议与“国际计算机通信与办公设备展览会”上,做过展览,并提供了培训,包括ECHO于1987年在中国科技情报研究所曾举办过一次培训班。
发展过程和专业范围
J.A.巴克拉克为欧洲煤钢联营的翻译工作者提供了一个有效的信息处理工具,并协助进行翻译。早在1963年他们就制定了自动词典(DICAUTOM)计划,几年后,计划执行一度中断,后于1973年重新实施,并改用现名。现在该委员会建立此多语种术语库,主要还是为了支持该委员会设在卢森堡的翻译处外语办公室的繁重翻译工作,因为大量欧洲共同体的官方文件需要尽快译成多语种的。具体来说,该库是为了给翻译特殊术语的术语专家、需要科技术语最新译名等项目服务的。并有助于提高翻译质量、节约时间,以及推广标准化术语。该库是由欧洲共同体委员会(CEC)术语与计算机应用专业部建立。除建库外,该部还对术语与文献领域的翻译工作提供服务,开发相应计算机化的系统,并开发SYSTRAN与EUROTRA自动翻译系统。编有二种出版物,(1)《术语学通报》,每年2-3期。(2)所有共同体机构所编词典简介。还通过使用该库103编辑一些专业词典。并拥有一个专业图书室,订有200种期刊,7500卷藏书。该部主任现为J格律恰尔斯基赫(Grotschalckux)先生,拥有25名术语学家与15名办事员。该库现包括欧洲共同体各种官方语言(希腊语除外)的科技术语,原文词组与缩写词,共收集了42万余个术语与原文词组。这对于要翻译特殊术语的术语学家和译者们是很有价值的。另外还有12万余个缩写词。现每月约更新2000条新词。
该库的专业范围涉及欧洲共同体下列活动领域的术语,包括农业、煤矿、炼钢、医学、职业卫生、核科学、运输、工业、纤维、玻璃、经济、共同体的条约与法规、预算、情报与文献学、数据处理、土木工程、电信、城市规划与管理、药物等。
术语记录
每一条记录上要给出主题词与分类号,其他术语数据单元包括:各语种的关键词(由短语中抽取,可用以编索引)、原文词组、参照项、复合术语的每一成份与其来源、语种指示符、记录号、概念号、记录日期、记录者、可靠性代码(指术语的一种质量标准,共分0-5级,指术语有否可靠出处,0——无任何出处,5——出自某种标准或类似文件)、术语来源的文献类型。还有各种语言的对应术语,同义词,缩写词,定义(注释),上下文等。在检索时每种语言皆可作为来源语言,其术语即为入口词,其他语言则为目标语言。术语主要提供者是卢森堡术语公司,它们提供带有上下文的术语,记录上的术语则是上下文中的关键词。部分术语来自加拿大蒙特利尔大学与魁北克的术语库。该库非常重视原文质量,原则上总是从第一手资料中吸取术语。约从100种期刊以及现代词书,手册中吸取,也从欧洲议会、国家术语办公室与专业团体输入术语。
检索方法
该库检索软件原为CEC内部软件,因不能很好满足各种用户要求,后改用GRIPS普通书目检索软件包,要求用户对该库的应用反映意见,以便能取得经验。用户经终端键入口令(以D结束,即以GRIPS软件查寻所有ECHO的数据库),再给出进入指令BAS-E EU85。此后,先要设置好四种参数:(1)一种来源语言SL;(2)一至数种目标语言TL,(3)字段F,可由指令DISPLAY(显示)或SHOW(展示)给出;(4)功能FU。设置参数可选择二方案:a)开始时设置四种参数。b)单独设置,可用下列指令:SL ca11 choice(调用选择),键入语种(有丹、荷、英、法、德、意、拉丁、葡、西等国语种):TL ca11 choice,键入语种;F call choice,有十种字段供选择,即BE、VE、AU、RF、AB、MC、PH、DF、PS、NT(详见表1);FU ca11 choi-ce,计有D、F、A三种功能,即A缩写词典、D标题词典、F自由文本检索供选用。
例如a)用户欲将EURODICAUTOM用作英法词典:系统接收BASE指令后,键入call choice,选定SL Engl,(回车);选定TL French;选定F VE(标题),若你需要定义与术语来源时,键入VE、DF(定义)、RF(术语来源);选定FU,键入D(标题词典功能)。系统于是准备好了,将可显示指令后键入的词按字顺显示一系列的词,并将提供所选目标语言的参数F的所有字段集合的有关信息。在此,你会发现使用截断与字符掩蔽是有用的。
b)用户要知道某些语言(如英、法、德语)的缩写,可选用下列两种方式之一:
1)在BASE指令后,开始先由用户键入ca11 choice,同样设置SL、TL;选定F,键入AB、DF(AB字段导致显示缩写本身),若需要缩写全称,还需要DF字段;选定FU,键入A
2)按方式a)去使用该系统,先改变TL,键入ca1l choice;TL=(French,Germ);改变输出字段F,键入ca11 choice,F=(AB、DF);改变功能,键入call choice,FU=A。另外,若用户临时有问题,有七种联机帮助(Help)指令供选用。

在表1中,除去BE、CF、CM外,所有字段都是多语种的。CM(学科代码),只在自动附加信息时,才是多语种的。注释1):在所用语言中的自由文本(freetext)中是可检的。注释2):在一种所用语言中直接可检,或在自由文本中可检。在前述三种可选择的功能中,自由文本检索功能F是以传统方式进行检索,系统在一次检索中,先答复所找到的命中数,再用指令Show(展示)按所需格式给出详细信息。而在功能A、D这两种显示方式中,用户将得到所需全部信息连同该“显示”(Display)方式中所要的术语,就不需要Show(展示)指令了。
如何按用户专门需求来准备该系统呢?如按下列参数来设置该系统。
SL Eng1
TL French Germ
F VE
FU D
D Farm Accounting
D Farm Accounting$
在此例中要注意D Farm Accounting与D Farm Accounting$的区别,前者是以字顺连续显示该词下接术语;后者是只显示某一个确切的术语的法、德语对应词,$是指检索语句终止符。
在一次检索中用户可随时改变上述任一个参数。
在缩写功能中,用户应该知道只在定义字段(DF)中才有某一缩写的全称,例如,若查IBM在德文、法文中的全称,应设置参数如下:SL=Engl,TL=Fren Germ,F=AB DF,FU=A(缩写词典功能)。
在自由文本检索中:用户要的一切信息,作为Display指令中的“辅助信息”给出。因此无需用Show(展示)或Find(发现)指令。
在被选的来源语言中,自由文本功能包括下列字段:VE(标题词)、MC(关键词)、PH(上下文同组)、DF(定义),如SL=Engl;TL=Fren Germ;F=VE RF;FU=F(来源语言自由文本检索功能)
F

F Farm
5.00 H TS(命中):331

F Farm/VE
6.00 HITS:243

F Fram/DF
7.00 HITS:89

F Farm/MC
8.00 HITS:4

简易的Show指令(Show或S)将给出来源语言与全部目标语言中所选全部输出字段中的术语信息。
通过用布尔算子、不同字段标记与语言前缀,可容易地限制或扩展某一检索。
如键入F Flower与Fren=Fleur/DF,即显示
10.00 HITS(命中):13

S而后即能够进行“多语种检索显示”,这是一个有力的特征。这里S即Show指令的简写,能在来源语言与目标语言中展示所选输出字段中的信息,如
10.00/000001 ECHO:-EURODICAUTOM/COPYRIGHTCEC
VE(ENGL)RECEPTIV1TY
VE(FREN)RECEPTIVIT
VE(GERM)REZEPTIVITAET
RF(ENGL)FORD-ROBERTSON,SOC AM FORESTERS
RF(FREN)METRO
RF(GERM)METRO
10.00/000002
VE(ENGL)POLLINATION
VE(FREN)POLLINISATION
VE(GERM)BESTAEUBUNG
RF(ENGL)FORD-ROBERTSON,SOC AM FORESTERS
RF(FREN)METRO
RF(GERM)METRO
MORE
若用户只要在来源语言中选择附加的字段,用一扩展的SHOW(S)指令即可满足。
例:若用户选择VE与RF作为正常输出字段。现在来源语言中只加字段DF.S F=STD;OF.指令SF=DF将导致只在来源语言中增加DF信息。用指令SF=VE;RF;DF将导致在来源语言中展示所需一切字段中的信息。
c)为获得来源语言与目标语言中的附加字段信息。通过改变系统中设置的参数F,即可实施此改变,指令call choice;F=(VE,RF,DF)。
表1中所列字段中给出了标志,内容说明,其中用括弧给出实例,它的可用于自由文本检索功能F文中,并假定英文为来源语言,当然在每一记录中不会包括一切字段。该库有下列三种方式来表示信息:
(1)记录带一标题词,加上定义或上下文,给出一个单词或语词或词组,它们由一定义说明,或置于上下文之中。
(2)带词间关系的记录。给出单词或词组,连同其他语种中的等意词。
(3)措词(Phraseological)记录。给出几个语种中词组句子的等意词。这些记录大多有MC关键词字段,它在其手册或词典中未以词组出现(如该字以复数出现,则用单数)。该库可联机或脱机存取,结果可显示在屏幕上或打印输出,也可输出在缩微胶片或卡片上。