中国科技术语

• 热点词\难点词 • 上一篇    下一篇

ontology含义及中文翻译探讨

王惠临   

  1. 中国科学技术信息研究所
  • 出版日期:2004-12-15 发布日期:2004-12-15

Ontology,Its Concept and Chinese Translations

Wang Huilin   

  • Online:2004-12-15 Published:2004-12-15

摘要: 编者按 随着信息科学技术的发展,ontology成为科技研究热点,然而其中文译名很不一致,有“本体论”、“本体”、“本体科学”、“知识本体”、“概念集”、“本体模型”等,在技术文献中直接使用ontology的情况则更为常见。在全国科技名词委公布的《计算机科学技术名词》(第二版,2002年)中,将人工智能领域的ontology定名为“本体论”。为更深入理解该词的科技内涵、源流,以求明白何种汉语称谓对于该词更加科学、贴切,本刊组织了专家从技术领域、哲学领域、语言学领域等方面对ontology作进一步探究。
当前,对ontology的研究正日益兴旺。国内对这一研究的关注和介绍也日益增多。但在论及ontology的中文文章中,对该英文词的中文翻译及使用存在着很大的混乱。不少文章只是直接使用ontology,而不作翻译。其他文章虽然用了中文译名,但翻译方法也很多,如“本体论”、“本体”、“知识本体”、“概念集”、“本体模型”等,十分不一致。因此,对ontology一词的含义,特别是这一词在当前技术文献中的使用和含义进行探究,以确定该词准确的中文翻译,笔者认为很有必要。尤其是考虑到当前国内外对ontology的研究,有可能对计算机科学、软件技术,特别是智能信息处理技术,蕴含着巨大的潜在影响。
ontology一词在英文中使用已久,但其含义一直是单一、清楚的,是指西方哲学中的一个分支,一般翻译成中文“本体论”。在收集了这个词的众多英汉词典中,包括权威的英汉词典,给出的译名都是“本体论”和“实体论”。但在中文的哲学书刊中,一般还是使用“本体论”。英文ontology是由源自古希腊文的两个语素组成的,一个是“on”或“ontos”,意思是“存在”,英文是“being”;另一个是“logos”,意思是“科学”,所以ontology的意思就是“研究存在的科学”,英文就是“the science of being”。不过,需要注意的是,being这个词虽然可以翻成中文的“存在”,但其真正的含义不是指世界上那一件件具体存在的事物,而是指世界一切事物的本质或本原,译成中文就是“本体”。所以本体论可以说就是“研究本体的科学”,而本体就是世界上一切事物的本质或本原。当然,对本体的解释各种哲学派别是大不一样的。“马克思主义哲学一般不使用‘本体论’这一术语,但有时也把它当做关于存在发展的最一般规律的学说的同义词来加以使用”[1]
对ontology在哲学上的使用与含义做一简单的介绍,有助于下面我们对当前技术领域所使用的ontology含义的理解。虽然ontology在当前技术领域的使用和含义与哲学上的含义有区别,但也存在着联系。
当前在技术领域对ontology的研究开始于上世纪90年代初。1991年,R.Neches(尼彻斯)等在完成美国DARPA(国防高级研究计划局)的一个有关知识共享的项目中,对智能系统的构建方法提出了革命性的新思想。他们认为:构建基于知识的系统时总是要一步步从头建立一个个新的知识库。因此,有必要通过建立一些可重用的组件(reusable components),让人们在建立知识库时只是将这些可重用组件装配起来就行了。经过研究,确定出必须有两类组件,即ontologies和PSMs(问题求解方法,Problem Solving Methods)[2]。ontologies涉及某一个领域或多个领域所共有的静态知识或知识结构,而PSMs涉及在相应的领域进行推理的动态知识。这里的ontologies可以说是人工智能中的知识库的核心,是同一领域多个知识库的通用部分。有人说,知识库 = ontology + axioms (公里系统)。因此,这样的ontology或ontologies是一种人工制品,是可数的,英文中是可以有单复数的。笔者认为,当前在技术领域这样使用的ontology或ontologies可以只翻译成中文的“本体”二字。下面,来分析一下这样翻译的理由。
首先,从专家们对技术上的ontologies的定义来理解。在技术领域,有关ontologies的定义迄今已有多种,但大家公认的比较标准的是1993年由T.R.Gruber(格鲁勃)给出的,即“An ontology is an explicit specification of a conceptualization”,译成中文是:一个本体就是某一概念体系的一种明确的规范表示[3]。1997年,W.N.Borst对Gruber的定义略加修改,变为“Ontologies are defined as a formal specification of a shared conceptualization”,译成中文是:本体可定义为某一群体所共有的概念体系的一种形式化的表示。其中“某一群体”四个字是原文中没有,外加上的[4]。1998年,R.Studer等人又对这两个定义作了进一步的阐释。依据他们的解释,上述两定义中有两个关键的词语需进一步说明,即“概念体系”(conceptualization)和“规范表示”(specification)。“概念体系”是指人们对世界上某一领域的事物或现象的本质经过认识活动所形成的一套系统的概念以及这些概念之间的关系,因此是属于心理范畴的东西。“规范表示”就是表达或描述,而且是严谨一致直至标准化的描述。这就是说,技术上所构建的ontologies是一套用符号或语言表现出来的东西,这些符号或语言描述或表示的是某一种概念体系。另外,定义中的“明确的”(explicit)是说对概念体系中的概念及对这些概念的约束都要作出明确的定义;“形式化的”(formal)是说描述的明确程度要达到计算机可读的水平;“共有的”(shared)是说所描述的概念体系不属于某一个个人,而是某一群体共同拥有的一致化的概念体系[5]
从上述的定义和说明,可以看到,由客观世界某一领域的事物或现象的本质(即本体)到人们对这些事物或现象的本质通过认识活动所形成的认识结果(即概念体系),再从概念体系到人们用特定的符号系统或语言将某一概念体系作出明确的或形式化的表示或表达,总共涉及了三个层面的东西。这三个层面的东西彼此相互联系、相互一致,这应该是无疑问的。这三个层面之间的关系,涉及了哲学等学科的知识,这里不多作解释。本文只是从技术上考虑它们之间的关系,并探讨这三个层面的东西是否都可以称为“本体”。笔者认为是可以的,因为这三者之间具有联系,应该具有一致性或统一性,可以统称为“本体”。有人将技术领域用人工方法构建的本体称为“知识本体”,其实,一定要在“本体”前加个修饰词以区别哲学上所研究的本体,不如称技术领域的本体为“符号本体”、“本体模型”或“人工本体”。因为技术上的本体都必须用一个符号系统表达出来,所以可称为“符号本体”;其所表达的是人类头脑中的概念体系或概念上的本体,从而间接表达了客观事物的本质或本体,所以可称为“本体模型”;又因为技术上的本体必定是用人工的方法构建出来的,所以也可以称为“人工本体”。不过,笔者建议只简单称其为“本体”。
将技术领域的ontology或ontologies译成“本体”,除了上边所说的三个层面的本体应具有一致性或统一性这样一个理由,还有下边三方面的原因:
其一是哲学和技术两个领域对本体的研究虽然有所区别,但毕竟在各自的范围内进行,一般不会混淆,更何况两个领域所研究的对象还有相通性。其二是在英文文献中尚未在ontology之前加上任何修饰性的词语。其三,也是很重要的一个理由,这就是由ontology及其派生词ontological所组成的复合术语已经很多,为了保持一致,还是译成“本体”为宜,例如:
ontology sharing 本体共享,ontology fusion 本体融合,ontology translation 本体翻译,ontology library 本体资源中心(本体图书馆),ontology based machine translation 基于本体的机器翻译,ontologydriven information system 本体驱动的信息系统,ontology aware IS 本体敏感的信息系统,ontological engineering 本体工程,ontological commitment 本体付托(本体承诺),ontological adequacy 本体适度性,等等。
上述这些复合术语中,如果在“本体”二字前加上修饰词,那么就全部要加上。不过,为了术语表达的简洁和一致,还是不加为好。
关于ontology的中文翻译,还有一个问题应当提出来商榷,这就是在哲学本体论中有一个从数理逻辑角度研究本体问题的分支,英文是formal ontology,这一分支对当前技术上的本体研究仍然在起着一个理论基础的作用。formal ontology似乎译成“形式本体学”为好,而不是译成“形式本体论”,究竟如何,总的来说好像应当与哲学上的ontology究竟译成“本体论”还是“本体学”一致起来才好。这个问题最好有哲学界的专家来定夺。
对ontology的中文翻译问题,笔者在这里只是作了一个初步的探讨。希望对此展开讨论,特别是希望能有哲学界和语文学界的专家学者参与。例如对“本”和“体”这两个字以及“本体”这个词作一些语源学上的探讨应该很有益处。