摘要: 摘要 本体论已经成为跨学科的热门术语,并且成为多个学科的研究题目。探讨本体论的概念含义,本体论在不同的学科中的借用意义,特别是它与术语学的关系以及在术语学中的概念意义和中文的译名问题,对于把握当今术语学研究中的知识本体趋向有着重要的作用。
本体论这个词在哲学中有着悠久的历史,中文的译名很不一致,有译“本体论”“本体”“本体科学”“知识本体”“概念集”“本体模型”等,在技术文献中直接使用“ontology”的情况则更为常见,因为这个词在英文中使用已久,其含义是单一、清晰的,[1]为此,《科技术语研究》杂志在2004年第4期专门组织了相关领域的专家对“ontology”的概念定义及其译名问题展开了讨论。正如曹树金和马利霞所述,目前得到普遍认同的定义是:“本体是共享概念模型的明确的形式化说明(an ontology is an explicit specification of a conceptualization) 。”[2]这个定义出自美国学者汤姆·格鲁勃(Tom Gruber)。该定义包含了概念化、形式化、清晰化和共享四层含义,是从人工智能和知识表征方面来综合定义本体论的通常意义①。从形式上来讲,本体论是一种逻辑理论的表述。由客观世界某一领域的事物或现象的本质(即本体)到人们对这些事物或现象的本质通过认识活动所形成的认识结果(即概念体系),再从概念体系到人们用特定的符号系统或语言将某一概念体系做出明确的或形式化的表示或表达,这个定义总共涉及了三个层面的东西。[1]全如瑊建议将“ontology”译为“逻辑可操作概念系”(人工智能领域)。[3]笔者认为在术语学中译作“知识本体”①能够较好地说明其新的含义,因为知识本体已类似于词典或者术语表,它能够使电脑处理更多内容的细节及其结构。知识本体还包括将人们有兴趣的领域正规化为一套概念、关系和定理(axiom)。
可见,本体论已经由最初的哲学概念,经引入到信息科学与人工智能等领域后而被赋予了新的含义,例如:“给出构成相关领域词汇的基本术语和关系以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”[2]。笔者认为:要正确理解本体论的概念,需要把它放在信息技术、知识工程、语言工程、术语知识网络的环境中来认识。特别是近些年来,在国外,原来的术语库已经开始转向术语知识库(terminological knowledge bases,TKB)的开发上。术语知识库常被人们称之为知识本体库,即不仅要定义知识库中的知识类别或术语,而且要限定这些不同知识类别之间的关系,换言之,术语学科的研究范畴已经扩大至知识的表征、知识管理及语义网方面。例如:术语学和本体技术如何在多种环境中为新的语义网用户提供术语学的服务,术语管理又如何从信息技术和自然语言处理等研究成果中获益,具体来说,术语工作者如何用知识本体为不同的用户群体创造知识资源和构建术语管理体系。
二 本体论与术语学
首先来看一下术语学的定义。英文术语学(Terminology)除了指专业领域和学科的词汇意义外,主要是指在一个领域内,用专门语言系统组织概念和术语名称的学科,术语学也是一门认识知识组织体系与传播知识工程体系的符号科学。近年来,“术语管理中的一个发展趋势就是从原来对术语数据库(例如术语汇编类型的数据)的描述转为从知识工程体系对术语知识体系的描述”[4]。术语编撰人员一般采用术语库或者词典形式,包括电子或者纸张印刷形式,系统地描述专业领域的术语。术语词典学可以说是应用术语学的理论成果、方法和原则来系统描述术语数据的学科。萨格的关于术语学的三个词义中的第一个意义,即“用于收集,描述与展示术语的方法与做法”,以及近年来,“术语管理中的一个发展趋势就是从原来对术语数据库(例如术语汇编类型的数据)的描述转为从知识工程体系对术语知识体系的描述”[5],指的正是术语词典学的意思。术语词典编撰人员要记录术语数据,首先需要确定学科领域,使用者的组别,单一语种还是多语语种,包括术语词典的类别,与之相关的信息组合等,即进行范畴或类别单元的分析。然后再进行概念单元、语言单位、参照单位和身份确认等方面的分析。例如术语概念的确定,所属的概念体系和概念关系;术语的词形、句法、语义用法信息,术语的同义词方面的信息;术语的语境和文献信息;术语的编码、日期等信息。术语学与术语词典学的区别就如同词汇学与词典学的分别。术语词典与普通词典的不同在于,术语词典一般采用概念体系而非词义分析的方法,术语词典是针对专家而非一般普通人的词典,术语产品可以是电子网络形式,如术语库,也可以是纸张的印刷形式。术语词典按照系统分类编辑,其特定专业的学科知识来自知识库,它重在描述概念和术语,包括概念体系中术语的各种概念关系(如属种关系,层次与非层次的关系等)。术语词典一般不记录一词多义现象,即一个概念对应一个术语,但是可以一个概念有若干个同义术语。
其次是本体论与术语学的关系。术语词典(包括术语库)与本体论的相似之处在于:两者都是在知识库中把概念、术语定义及其概念间的关系加以明确限定,只不过人工智能意义上的本体论,是使计算机在处理词汇内容方面,更加有序,更加全面翔尽。本体论也热衷于描述专业领域,也有一整套的概念、原则、关系和方法,例如构建一些模型来帮助计算机处理复杂而零散的信息,促进知识共享。
布丁认为:术语学与本体论分别在以下几个方面近似和有差异。相同之处:(1)都出自传统的逻辑,都用亚里士多德的分类说和概念的层次划分;(2)作用相同,都对信息、数据、知识、专业内容进行组织管理;(3)目标都是对某一个领域达成共识,分享知识,让知识清晰化,特别是把人们一些不清晰的知识在计算机里变得清晰化一些;(4)两个学科都为相关的专业领域构建知识,都是在大脑思维中进行组织,都通过提供充分必要的定义而达到无歧义的交流。不同之处:(1)两者形式化和清晰化的程度不同;(2)本体论的形式化包括使用逻辑推理规则(如上层的第一顺序逻辑、框架逻辑、描述逻辑等表现体系)及限制条件;(3)针对的对象有所不同,本体论的对象是软件的代理程序(agents),而术语针对的对象是人;(4)术语学局限于特定专业领域的概念和命名,注重专业领域的语言和交际功能,注重跨文化的相对性和跨语言层次的许多不对称的东西,注重多语言的分析,术语学可以用有控制的自然语言描述,来服务于知识本体构建。①从以上术语学与知识本体的关系,我们不难看到两者相融合的趋势,特别是术语词典学中出现的本体论趋向和电子数据化的趋向,其目标无非就是促进信息知识的互通,方便信息的查询与检索,完成自动推理和自然语言的处理。
最后来看知识本体的类型。知识本体分为以下几种类型:(1)形式化本体(构建世界通识知识基础),用“形式化”的语言来表示所模拟的概念和概念关系;(2)语言本体(构建词汇知识基础),例如:构成语义词汇网的Word Net(词网),由普林斯顿(Princeton)大学开发②;(3)多语种本体,比如欧盟开发的Euro Word Net;(4)术语知识本体,比如欧盟的FFPOIROT(译为“用知识本体技术预防金融欺诈的信息资源”)③,就是一个涉及英语、法语、荷兰语和意大利语的术语知识库。中国开发的知网④和中国台湾中央研究院完成的中英双语知识本体词网的建设,也代表着这方面的成果与方向。实际上,术语本体是未完全形式化、规律化的知识本体,或者说术语未完全形式化,现今一些大型与特定领域的资源都是这种术语本体类型,在自然科学、医学领域、术语与知识组织系统是部分的形式化,例如由词库系统、层次类别系统、命名系统、分类系统、文档系统等组成术语知识系统,把术语概念体系中相关的概念或者不同的概念真正地连接起来。经过几十年的发展,术语库网络体系已经在欧美、亚洲、非洲和拉丁美洲地区建立起来,国际跨地区的术语网,地区、国家和各级组织机构与部门的术语网也正在或者已经建立。虽然各术语库网络之间还没有形成一体化的组织体系,有时还互相忽略对方的存在,还缺少实际的接触和合作,但是术语学在人类知识工程体系和知识管理中的重要性早已凸显出来。电子信息技术在术语知识管理中的应用已经出现了模拟与表现术语知识的新方法和新的研究工具。术语资源管理中新方法和新工具的使用会产生新的术语交换格式,术语界和人们关注的术语资源的互通互换由此正在成为现实。术语网不仅会连接起来,而且会成为一个富有意义的语义网,术语管理在人类知识传播与交流的过程中将会发挥日益重要的作用。虽然有多少种不同的术语资源和术语知识库便会有多少不同的用户,但是不同的术语资源至少有一个共同的特征,即由于对用于特定知识领域的词汇的描述要组织得有序、有条理,术语的描述就会根据使用者(人还是机器)及所描述的专业领域不同而不同。现用表格形式来简要说明术语学与本体论的异同:
三 本体论的中文翻译问题
哲学意义的“本体论”概念早已随着信息技术、知识管理等学科的发展要求而有了跨学科的借代意义,即本体论的概念在不同的学科有了不同的概念意义,本体论作为一个跨学科的时髦词,并成为不同学科研究人员感兴趣的研究题目,其目标就是利用本体技术和以术语学为基础对网络的信息材料进行内容的描述,构建语义网。由于推动本体论研究发展的驱动力主要来自知识工程学和知识管理学科,笔者认为应该按照学科的概念来翻译本体论。在哲学学科中,一部分学者认为还是应该继续保持中文的译名“本体论”或“本体”,因为作为哲学的、原始的定义,“ontology”(哲学上的本体论)是哲学的一个分支,研究自然存在以及现实的组成结构。它试图回答“什么是存在”“存在的性质是什么”等等。本体论依然指关于存在的研究,关于现实存在的属性和组织方式等,哲学本体论这个术语的定义及其中文译名在当今的用法中仍然具有普遍的意义并指导着其他的学科。然而,诚如邹诗鹏所指出的那样:在学界“问题仍然集中于如何理解和翻译ontology,大多数的意见认为应当放弃‘本体’及‘本体论’,而选择‘存在’及‘存在论’,或者干脆就是‘是’及‘是论’”[6]。而从哲学意义的本体论被引入到其他新的学科的情况来看,保留中文“本体论”的译名还是有必要的,因为其他学科还是借用了“ontology”在哲学上的基本概念意义,只不过是随着当今信息技术的发展而延伸与发展出了新的意义。另外,在哲学的意思中,英文“ontology”是个不可数(或不具备数的概念)名词,并无复数形式,但是引入到其他学科中后,现今英文的“ontology”在实际的用法中,早已有了复数的、可数的名词形式“ontologies”,这从前文知识本体的不同类型以及英文文献中都可以找到证明。
在计算机科学领域与信息系统中,人们普遍接受的定义依然是汤姆·格鲁勃关于“本体是概念化的清楚详细的说明”(an ontology is a specification of a conceptualization )的简要回答。本体论指通过一种本体语言(例如RDFS)来对概念化的东西进行编码的结果。可见,计算机科学与信息系统中的“本体论”的概念,虽然源自哲学的概念,但是有了新的含义,不妨根据语境的情况,分别翻译为“概念集”“本体模拟”或者“本体科学”“本体技术”等。在术语学领域,由于知识工程学和知识管理的推动,本体论的概念在术语学科也有了新的发展,本体论是用来定义某一领域的知识主体,所以不妨把“ontology”翻译为“知识本体”。如果要对“本体论”这个术语应用到其他“新”学科的中文译名加以规范的话,指除哲学之外应用在术语学、人工智能、语言学、包括信息技术等不同领域中,以知识管理和构建语义网为目标,笔者提议不妨统一为“知识本体”的译名。中文译名要完全与英文的概念意义等值有着一定的难度,原因是这个跨学科的名词应用到不同的学科领域已有着不同的含义,即使在同一个学科中,人们对于本体论的定义及应用范围也还没有达成一个统一的认识,加之英文“ontology”本身就是一个多义词。笔者就这个术语的探讨难免有理解偏差的地方,希望能够引起人们对这个问题的思考。
对“ontology”中文翻译问题的讨论,再次说明了本来属于某一学科或某一理论的术语,也可能转而成为另一学科或另一理论的术语,这叫“术语转移”(transterminologization)。这种现象可能发生在单个术语身上,也可能是系统中某一“术语块”的整体转移。isomorphism(同形,同构)就是一个从数学转向化学,进而又转向语言学的一个术语。郑述谱认为,不同的学科,对看似由相同的词素或词构成的术语所指称的概念,往往会有不同的定义。这些术语应该看做是同音异义(homonymy)术语。他举例说,同样都说“言语”,在心理学或生理学中所指的概念,与语言学,特别是索绪尔的语言学理论所指的概念,那是不一样的。具体来说,心理学中的“言语”主要是指言语活动的过程。而语言学中,“言语”也兼指言语活动的产物。在索绪尔笔下,“言语”则是与“语言”严格对立的概念。他的结论是:“虽然都说成是‘言语’,但它们并不是同一个术语,而是分属不同学科、不同理论的不同术语。即使在同一学科内,不同的理论,对看似相同的术语,也可能下不同的定义。从另一方面说,科学理论的创新,也常常是从对现有术语背后的概念提出置疑、修正直至提出全新的术语开始的”[7]。总之,术语既是对已有科学认识的固定,也可能成为新认识的生长点,特别是在跨学科术语相互借用、内涵不断增多和学科发展不断重叠交错的情况下。术语学这门跨学科的发展以及它的指导意义也就在于此。
-----------------------------
第13页
① 详见Gruber,T.R.What is an Ontology?http://www-ksl.Stanford.edu/kst/What-is-an-ontology.html.
------------------------------
第14页
① 此处用“知识本体”的译名是笔者在讨论本体论概念用于术语学中的个人看法,鉴于本体论在我国还没有统一译名,人们一般接受“本体论”,所以笔者在文章中有时用“本体论”,有时用“知识本体”,即把它们作为可以互换“通用”的词语。
------------------------------
第15页
① 参见Budin,Gerhard.在西安电子业务和元数据标准化国际论坛上的论文“Terminologies,Lexicons,and Ontologies—Standardizing toward Semantic Interoperability and Metadata Federation for E-Learning,Knowledge Management and Content Development”.http://www.cnis.gov.cn/openforum.2004-05-19.
② 详见WordNet:http://www.cogsci.princeton.edu/cgi-bin/webwn.
③ 详见FFPOIROT Project:http://www.ffpoirot.org.
④ 关于中国知网(How Net Knowledge Database)的介绍及其发展现状,读者可详细阅读董振东和董强关于知网——中文信息结构库http://www.keenage.com的文章。关于中国台湾的中英双语知识本体词:English-Chinese Ontology/WordNet Interface.http://ckip.iis.sinica.edu.tw/CKIP /ontology/.