摘要:
当前主流计算机辅助翻译系统(CAT)借助翻译记忆(TM)和术语库(TB)提高翻译效率。翻译记忆以自然句为主要匹配单位,需要整句相似或重复,匹配难度大。与之相比,术语库以词块为匹配单位,较为灵活,可弥补翻译记忆的缺陷。术语库的构建涉及术语自动提取,需要参考特定文本类型中高频语块的词性规则。文章使用n-gram提取英语民航规章文本的复现语块,探究不同词项长度和复现频数下高频语块的词性组合特征;并将其与文学文本进行对比。研究发现,在英语民航规章文本中,适用于计算机辅助翻译系统术语库的复现语块以名词短语为主,与文学文本存在显著差异。
中图分类号:
王坤. 面向计算机辅助翻译的民航规章术语库词性规则研究[J]. 中国科技术语, 2022, 24(2): 65-69.
WANG Kun. Analysis on POS Configuration for Civil Aviation Regulations Termbase based on CAT System[J]. China Terminology, 2022, 24(2): 65-69.