中国科技术语

• 热点词\难点词 • 上一篇    下一篇

ontology科技译名

史忠植   

  1. 中国科学院计算技术研究所
  • 出版日期:2004-12-15 发布日期:2004-12-15

Shi Zhongzhi   

  • Online:2004-12-15 Published:2004-12-15

摘要: 近些年来,随着信息技术的发展和互联网的广泛应用,经常遇到ontology一词。目前该词的中文译名较多,如“本体论”、“本体”、“存在论”、“知识本体”、“概念集”、“本体模型”等,十分不一致。因此,对ontology一词的含义,特别是这一词在当前技术文献中的使用和含义进行探究,以确定该词准确的科技译名,有助于学术交流和信息共享。
1.ontology的词源
关于ontology的译名已经成为学术界讨论的一个热点。英文的ontology,以及德文的Ontologie,法文的Ontologie,最早均来自拉丁文Ontologia。而拉丁文又源自希腊文,就希腊文的字面意思说,它是指关于on的logos。据考证[1],在西方哲学文献中,Ontologia 一词最早见于德意志哲学家郭克兰纽(R.Goclenius)用拉丁文编撰的《哲学辞典》(1613)中。莱布尼茨(G.von Leibniz)及其继承者沃尔夫(C.Wolff)试图通过纯粹抽象的途径建立一套完整的、关于一般存在物和世界本质的形而上学,即独立的本体论体系。
ontology一词在英文中使用已久,但其含义一直是单一、清楚的,是指西方哲学中的一个分支,一般翻译成中文“本体论”。在众多英汉词典中,给出的译名都是“本体论”和“实体论”。但在中文的哲学书刊中,一般还是使用“本体论”。我国哲学界对ontology一词的最通常译名曾是“本体论”,近年来又流行一个新的译名“存在论”,对这两个通行译名的准确性又一直有着不同的看法。
2.ontology的定义
据我所知,在技术领域对ontology的研究开始于20世纪80年代。1984年莱纳特(D.B.Lenat)研究大规模知识系统Cyc,采用ontology作为知识表示方法[2]。1991年,尼彻斯(R.Neches)等在完成美国DARPA(Defense Advanced Research Projects Agency,国防高级研究计划局)的一个有关知识共享的项目中,对智能系统的构建方法提出了新思想,即构建ontologies和PSMs可重用的组件。这里的ontologies是知识库的核心,是同一领域多个知识库的通用部分。尼彻斯等人将ontology定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”[3]
1993年,格鲁勃(T.R.Gruber)给出了ontology的另一个的定义,即“ontology是概念化的显式规范说明”(An ontology is an explicit specification of a conceptualization)[4]。在此基础上,1997年Borst(博斯特)将ontology定义为:“ontology是共享概念化的形式化规范说明”(ontologies are defined as a formal specification of a shared conceptualization )[5]。Studer(施图德)等对上述两个定义进行了深入的研究,认为ontology是共享概念化的显式形式化规范说明[6]。“概念化”是指人们对世界上某一领域的事物或现象的本质经过认识活动所形成的一套系统的概念,以及这些概念之间的关系。“显式”(explicit)指所使用的概念及使用这些概念的约束都有明确的定义。“形式化的”(formal)是说描述的程度要达到计算机可读的水平;“共享的”(shared)是指共同认可的知识,反映的是相关领域中公认的概念集。ontologies提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化给出这些词汇(术语)和词汇间相互关系的明确定义。
3.ontology的使用
ontology的本质是概念化,表达的是概念及概念之间的关系。目前己有一些ontology系统,由于具体问题领域和具体工程的考虑,构造ontologies的过程也是各不相同的。为了构建ontology库,不少研究人员从实践出发,提出了不少构造ontology的标准,其中最有影响的是Gruber于1995年在文献[7]中提出的5条规则[8]
(1)明确性和客观性: 即ontology应该用自然语言对所定义术语给出明确的、客观的语义定义。
(2)完全性: 即所给出的定义是完整的,完全能表达所描述术语的含义。
(3)一致性: 即由术语得出的推论与术语本身的含义是相容的,不会产生矛盾。
(4)最大单调可扩展性: 即向ontology中添加通用或专用的术语时,不需要修改其已有的内容。
(5)最小承诺: 即对待概念化对象给出尽可能少的约束。
目前ontology使用最普遍的描述方法有ontolingua[9]、CycL[10]、OWL(Web Ontology Language,Web本体语言)[11]等。ontolingua是一种基于KIF(Knowledge Interchange Format,知识交换格式)的,提供统一的规范格式来构建ontology的语言。ontolingua主要是作为ontology服务器上提供的,用于创建ontology的语言。
Cycl是CYC系统的描述语言,它是一种体系庞大而非常灵活的知识描述语言。该语言在一阶谓词演算的基础上,扩充了等价推理、缺省推理等功能,而且具备一些二阶谓词演算的能力。在该语言的环境中配有功能很强的可进行逻辑推理的推理机。
国际万维网论坛W3C在2004年2月10日正式宣布OWL为推荐标准。OWL是语义网的关键技术,OWL旨在用于那些需要由应用程序而不是由人类来处理文档中的信息的情形。OWL可被用来明确表示词汇表中术语的含义以及术语间的关系。如此表示的术语及术语间的关系的表示被称为本体(ontology)。在表达含义和语义方面,OWL比XML(Extensible Markup Language,扩充标识语言)、RDF(Resource Description Framework,资源描述架构)和RDF-S(RDF Schema)有更多的表达手段,因此在Web上表达机器可理解内容的能力也比这些语言强。OWL是DAML(DARPA Agent Markup Language)+OIL(Ontology Inference Layer ) Web本体语言的修改版,并吸取了在DAML+OIL的设计和应用中得到的经验教训[11]
4.ontology的科技译名
随着互联网的广泛使用,知识共享和知识运用的普及,ontology在科技文献中出现的频度愈来愈高。从上述ontology的定义和使用可以看到,ontology的本质是概念化,表达的是概念及概念之间的关系,即术语及术语间的关系的表示被称为ontology。因此,将ontology的科技译名定为本体较好。