中国科技术语 ›› 2025, Vol. 27 ›› Issue (1): 102-110.doi: 10.12339/j.issn.1673-8578.2025.01.016

• 数据挖掘 • 上一篇    下一篇

基于依存句法分析的术语提取方法与传统方法的实证对比

郝韵涵(), 李华东*(), 王朝莹, 张嘉   

  1. 上海海事大学外国语学院,上海 201306
  • 收稿日期:2024-02-02 修回日期:2024-04-15 出版日期:2025-01-07 发布日期:2025-01-07
  • 通讯作者:
    * 李华东(1970—),男,上海海事大学外国语学院教授,博士生导师。现任中国逻辑学会文体学专业委员会常务理事。研究方向为海事语言及应用、教材开发、语言测试、语用学等。通信方式:
  • 作者简介:

    郝韵涵(1998—),女,上海海事大学外国语学院在读博士研究生。研究方向为海事语言及应用,专门用途英语。通信方式:

  • 基金资助:
    2017年国家社会科学基金一般项目“基于语料库的大学英语教材与学术词汇覆盖率研究”(17BYY103); 2021年国家社会科学基金一般项目“海洋强国视域下海事语言标准化及国际海事话语研究”(21BYY017); 2023年国家建设高水平大学公派研究生项目(202308310262)

Empirical Comparison of Term Extraction Methods Based on Dependency Syntactic Analysis with Traditional Methods

HAO Yunhan(), LI Huadong*(), WANG Zhaoying, ZHANG Jia   

  • Received:2024-02-02 Revised:2024-04-15 Online:2025-01-07 Published:2025-01-07

摘要:

文章讨论了基于依存句法分析的术语提取方法,以英文海事文本为语料,对比了该方法与传统的n元模式和基于主题性的提取方法的提取效果,以探索可供非专业术语提取者利用的综合效果最佳的术语提取方法或方法组合。研究结果表明,三种术语提取方法可互为补充,基于依存句法分析的术语提取效果最佳。对于非专业术语提取者而言,基于依存句法与基于主题性的术语抽取方法相结合,能在术语提取的效率、范围和准确性三者间取得最佳平衡。

关键词: 依存句法分析, 术语提取, 英文海事文本

Abstract:

This paper introduces a terminology extraction method based on dependency parsing. An empirical study was conducted by using an English maritime text to compare this method with two traditional methods, namely the n-gram pattern method and the keyness analysis method. Our aim is to explore the most useful term extraction method or combination thereof for non-expert term extractors. The results indicate that the three methods complement each other, with the dependency parsing method showing the best performance. For non-expert term extractors, a combination of dependency parsing and keyness analysis achieves the optimal balance between efficiency, scope, and accuracy.

Key words: dependency parsing, terminology extraction, English maritime texts