中国科技术语 ›› 2017, Vol. 19 ›› Issue (3): 10-13.doi: 10.3969/j.issn.1673-8578.2017.03.002

• 术语学研究 • 上一篇    下一篇

三词型术语抽取研究

那日松1, 刘青2   

  1. 1.杭州师范大学,浙江杭州 311121
    2.全国科学技术名词审定委员会,北京 100717
  • 收稿日期:2016-08-15 修回日期:2017-01-16 出版日期:2017-06-25 发布日期:2017-07-07
  • 作者简介:那日松(1980—),女,博士,杭州师范大学应用语言学研究中心助理研究员,研究方向为计算语言学、术语学等。通信方式:narsujin@163.com。|刘青(1954—),男,全国科学技术名词审定委员会原副主任,中国辞书学会副会长,国家语委咨询委员会委员,研究方向为机电工程、工商经济管理、汉语言文字学、术语学、编辑学等。通信方式:liuq@cnctst.cn。
  • 基金资助:
    国家自然科学基金项目“基于语料库的术语自动处理关键技术研究”(J1025001)

Research on Tri-word Term Extraction

Na Risong1, LIU Qing2   

  • Received:2016-08-15 Revised:2017-01-16 Online:2017-06-25 Published:2017-07-07

摘要:

主要讨论了由三个词组成的术语的抽取问题。首先从实验语料中抽取了三个词组成的词串,利用语法规则剔除了不符合要求的三词串,最后对剩下的三词串进行了人工判别,判断其是否为术语。研究发现:1)由三个词组成的术语数量相对较少;2)所获得术语中被赋予新含义的术语占多数;3)同一领域术语间的流通性不同;4)三个以上的词组成的术语仍然存在,只是数量直线下降。

关键词: 三词型术语, 术语抽取, 法律术语

Abstract:

This paper mainly discussed the topic of tri-word term extraction. We extracted all the linguistic strings formed by three words from the corpus, and filtered those illegal phrases based on the rule of grammar, and judge whether the rest of tri-word linguistic strings could be identified as terms. Our conclusions are: 1) there are a relatively small number of tri-word terms in the corpus; 2) many tri-word terms have been given new meanings; 3) terms in the same field have different negotiability; 4) there are terms formed by more than three words in the corpus, but the number of this kind term is falling sharply.

Key words: tri-word term, term extraction, legal term

中图分类号: