China Terminology ›› 2024, Vol. 26 ›› Issue (3): 84-92.doi: 10.12339/j.issn.1673-8578.2024.03.010
• Practical Applications • Previous Articles Next Articles
GAO Song1(), QIAN Long2(
), DING Qian3(
)
Received:
2023-10-18
Revised:
2024-04-28
Online:
2024-07-05
Published:
2024-07-05
GAO Song, QIAN Long, DING Qian. Developing and Validating a Chinese Academic Vocabulary List (CAVL): A Corpus-Driven Approach[J]. China Terminology, 2024, 26(3): 84-92.
Add to citation manager EndNote|Ris|BibTeX
URL: https://www.term.org.cn/EN/10.12339/j.issn.1673-8578.2024.03.010
序号 | 学术词汇 | 词频 | 频率比 | 超过20%期望 频次的子库数 | Julliand’s D值 | 学科指数值 |
---|---|---|---|---|---|---|
24 | 结构 | 4452 | 9.93 | 10 | 0.86 | 1.89 |
25 | 采用 | 4400 | 7.12 | 10 | 0.82 | 1.83 |
26 | 作用 | 4327 | 5.96 | 10 | 0.88 | 1.81 |
27 | 环境 | 4317 | 4.47 | 10 | 0.88 | 1.48 |
28 | 相关 | 4259 | 4.68 | 10 | 0.91 | 1.38 |
序号 | 学术词汇 | 词频 | 频率比 | 超过20%期望 频次的子库数 | Julliand’s D值 | 学科指数值 |
---|---|---|---|---|---|---|
24 | 结构 | 4452 | 9.93 | 10 | 0.86 | 1.89 |
25 | 采用 | 4400 | 7.12 | 10 | 0.82 | 1.83 |
26 | 作用 | 4327 | 5.96 | 10 | 0.88 | 1.81 |
27 | 环境 | 4317 | 4.47 | 10 | 0.88 | 1.48 |
28 | 相关 | 4259 | 4.68 | 10 | 0.91 | 1.38 |
词频排序 | 词型 | 词频排序 | 词型 |
---|---|---|---|
1 | 研究 | 16 | 社会 |
2 | 进行 | 17 | 具有 |
3 | 发展 | 18 | 经济 |
4 | 技术 | 19 | 如 |
5 | 数据 | 20 | 结果 |
6 | 影响 | 21 | 值 |
7 | 分析 | 22 | 文化 |
8 | 通过 | 23 | 特征 |
9 | 模型 | 24 | 结构 |
10 | 不同 | 25 | 采用 |
11 | 主要 | 26 | 作用 |
12 | 方法 | 27 | 环境 |
13 | 系统 | 28 | 相关 |
14 | 信息 | 29 | 存在 |
15 | 过程 | 30 | 基于 |
词频排序 | 词型 | 词频排序 | 词型 |
---|---|---|---|
1 | 研究 | 16 | 社会 |
2 | 进行 | 17 | 具有 |
3 | 发展 | 18 | 经济 |
4 | 技术 | 19 | 如 |
5 | 数据 | 20 | 结果 |
6 | 影响 | 21 | 值 |
7 | 分析 | 22 | 文化 |
8 | 通过 | 23 | 特征 |
9 | 模型 | 24 | 结构 |
10 | 不同 | 25 | 采用 |
11 | 主要 | 26 | 作用 |
12 | 方法 | 27 | 环境 |
13 | 系统 | 28 | 相关 |
14 | 信息 | 29 | 存在 |
15 | 过程 | 30 | 基于 |
语料库 | CAC | BCC | LCMC | ||||||
---|---|---|---|---|---|---|---|---|---|
语料类型 | 语料规模 | 覆盖 词汇量 | 覆盖率 (%) | 语料规模 | 覆盖 词汇量 | 覆盖率 (%) | 语料规模 | 覆盖 词汇量 | 覆盖率 (%) |
学术、科技 | 3 533 018 | 914 343 | 25.88 | 2 061 587 624 | 388 588 524 | 18.85 | 135 212 | 32 267 | 23.86 |
新闻 | — | — | — | 1 533 155 467 | 155 236 408 | 10.13 | 120 365 | 12 059 | 10.02 |
文学 | — | — | — | 1 658 525 368 | 45 866 446 | 2.77 | 248 705 | 6 811 | 2.74 |
微博 | — | — | — | 4 255 762 243 | 122 536 869 | 2.88 | — | — | — |
语料库 | CAC | BCC | LCMC | ||||||
---|---|---|---|---|---|---|---|---|---|
语料类型 | 语料规模 | 覆盖 词汇量 | 覆盖率 (%) | 语料规模 | 覆盖 词汇量 | 覆盖率 (%) | 语料规模 | 覆盖 词汇量 | 覆盖率 (%) |
学术、科技 | 3 533 018 | 914 343 | 25.88 | 2 061 587 624 | 388 588 524 | 18.85 | 135 212 | 32 267 | 23.86 |
新闻 | — | — | — | 1 533 155 467 | 155 236 408 | 10.13 | 120 365 | 12 059 | 10.02 |
文学 | — | — | — | 1 658 525 368 | 45 866 446 | 2.77 | 248 705 | 6 811 | 2.74 |
微博 | — | — | — | 4 255 762 243 | 122 536 869 | 2.88 | — | — | — |
子语料库 | 覆盖率(%) | 子语料库 | 覆盖率(%) |
---|---|---|---|
经济与管理科学库 | 31.97 | 农业科技库 | 25.69 |
信息科技库 | 30.90 | 社会科学Ⅰ库 | 23.42 |
工程科技Ⅱ库 | 30.57 | 工程科技Ⅰ库 | 23.16 |
基础科学库 | 27.36 | 医药卫生科技 | 21.50 |
社会科学Ⅱ库 | 26.53 | 哲学与人文科学库 | 17.46 |
子语料库 | 覆盖率(%) | 子语料库 | 覆盖率(%) |
---|---|---|---|
经济与管理科学库 | 31.97 | 农业科技库 | 25.69 |
信息科技库 | 30.90 | 社会科学Ⅰ库 | 23.42 |
工程科技Ⅱ库 | 30.57 | 工程科技Ⅰ库 | 23.16 |
基础科学库 | 27.36 | 医药卫生科技 | 21.50 |
社会科学Ⅱ库 | 26.53 | 哲学与人文科学库 | 17.46 |
语料库 | CAC | BCC(科技) | LCMC(学术) | |||
---|---|---|---|---|---|---|
词表 | 覆盖词汇量 | 覆盖率(%) | 覆盖词汇量 | 覆盖率(%) | 覆盖词汇量 | 覆盖率(%) |
预科《基础汉语常用词汇表》 | 2 300 331 | 65.11 | 1 266 632 672 | 61.44 | 96 149 | 71.11 |
预科《基础汉语常用词汇表》 合并《通用汉语学术词表》 | 2 652 319 | 75.07 | 1 376 435 880 | 66.77 | 104 433 | 77.24 |
语料库 | CAC | BCC(科技) | LCMC(学术) | |||
---|---|---|---|---|---|---|
词表 | 覆盖词汇量 | 覆盖率(%) | 覆盖词汇量 | 覆盖率(%) | 覆盖词汇量 | 覆盖率(%) |
预科《基础汉语常用词汇表》 | 2 300 331 | 65.11 | 1 266 632 672 | 61.44 | 96 149 | 71.11 |
预科《基础汉语常用词汇表》 合并《通用汉语学术词表》 | 2 652 319 | 75.07 | 1 376 435 880 | 66.77 | 104 433 | 77.24 |
[1] |
|
[2] |
|
[3] |
刘迪麟, 雷蕾. 学术词表研究综述[J]. 外语教学, 2020(2):34-37.
|
[4] |
刘宇红, 殷铭. 语言学语域的学术词汇表与术语词汇表[J]. 中国科技术语, 2022, 24(2):47-54.
doi: 10.12339/j.issn.1673-8578.2022.02.007 |
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
薛蕾. 基于汉语语言学论文语料库的学术汉语词汇析取及特征研究[D]. 昆明: 云南师范大学, 2017.
|
[10] |
王笑然, 王佶旻. 经贸类本科专业学术汉语词表研究[J]. 语言教学与研究, 2022,(4):9-19.
|
[11] |
钱隆, 袁亮杰, 王治敏. 学科融合视域下医学汉语学术词表的构建[J]. 云南师范大学学报(对外汉语教学与研究版), 2023, 21(3):31-40.
|
[12] |
朱明玉. 通用学术汉语词表研究[D]. 昆明: 云南大学, 2020.
|
[13] |
|
[14] |
李泉. 论专门用途汉语教学[J]. 语言文字应用, 2011(3):110-117.
|
[15] |
张黎. 专门用途汉语教学[M]. 北京: 北京语言大学出版社, 2016:1-10.
|
[16] |
单韵鸣. 专门用途汉语教材的编写问题:以《科技汉语阅读教程》系列教材为例[J]. 暨南大学华文学院学报, 2008(2):31-37.
|
[17] |
高增霞, 刘福英. 论学术汉语在对外汉语教学中的重要性[J]. 云南师范大学学报(对外汉语教学与研究版), 2016(2):44-51.
|
[18] |
王佶旻. 来华留学预科教育的汉语能力标准[J]. 语言教学与研究, 2021(2):26-34.
|
[19] |
张秀菊, 罗煜宁,
|
[20] |
李海燕, 张文贤, 辛平. 本科留学生学术汉语写作课需求调查与课程建设:以北京大学本科留学生学术汉语写作通选课为例[J]. 国际汉语教育(中英文), 2020(1):51-60.
|
[21] |
肖珊, 廖雅璐, 徐成慧. “一带一路”背景下高校留学生专门用途汉语能力需求分析模型及发展探讨[J]. 语言产业研究, 2021(3):198-206.
|
[22] |
鲁洲. 来华留学生专业学习的现状与问题[J]. 外国留学生工作研究, 2014(3):54-59.
|
[23] |
张博. 学术汉语词汇的主要特点及教学策略[J]. 世界汉语教学, 2022(4):517-530.
|
[24] |
|
[25] |
|
[26] |
|
[27] |
桂诗春. 多视角下的英语词汇教学[M]. 上海: 上海外语教育出版社, 2013:165-166.
|
[28] |
卫乃兴. 语料库语言学的方法论及相关理念[J]. 外语研究, 2009(5):36-42.
|
[29] |
郭曙纶. 汉语语料库应用教程[M]. 上海: 上海交通大学出版社, 2013:9-11.
|
[30] |
崔维霞, 王均松. 基于语料库的词表创建原则及方法研究[J]. 中国科技术语, 2013, 15(2):15-19.
doi: 10.3969/j.issn.1673-8578.2013.02.004 |
[31] |
尹斌庸, 方世增. 词频统计的新概念和新方法[J]. 语言文字应用, 1994(2):69-75.
|
[32] |
|
[33] |
|
Viewed | ||||||
Full text |
|
|||||
Abstract |
|
|||||