中国科技术语 ›› 2014, Vol. 16 ›› Issue (5): 10-14.doi: 10.3969/j.issn.1673-8578.2014.05.002
刘剑1,2, 唐慧丰1, 刘伍颖1
LIU Jian1,2, TANG Huifeng1, LIU Wuying1
摘要: 中文术语识别与抽取是中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。文章以互信息和信息熵理论为基础,提出一种基于统计技术的中文术语半自动抽取方法,并且以互联网新闻话题数据为对象进行了实验验证,结果表明所提方法能够有效支持中文术语的抽取。
中图分类号: