中医常采用自然语言描述疾病症状,导致症状命名不统一,影响数据挖掘分析和临床疗效评价结果。该研究主要以中医临床专病诊疗数据为研究对象,示范性地探索和整理了临床诊疗数据中术语该如何规范化的问题,从语义分析的角度来规范化整理症状术语,在首选术语制定过程中引入术语属性和术语间关系的概念,解决了症状间多词一义、多义一词的问题。参照ICD-11中文版整理了疾病诊断术语;参照《中国药典》规范了中药药名;按照“治愈”“好转”“未愈”分类整理疗效评价术语。最终整理获得症状术语558条,其中首选术语164条,同义术语394条;诊断术语23条;疗效评价术语21条,规范后的数据可用于数据挖掘分析。