CMB

中文医学综合基准测试（Comprehensive Medical Benchmark in Chinese，CMB）由香港中文大学（深圳）研究团队于2023年推出。该数据集旨在为大型语言模型（Large Language Models，LLMs）在医学领域的表现提供标准化评估平台。其子集CMB-Exam汇集了大量公开的模拟试题、课程练习题和常见易错题，主要来源于中国医学题库。研究团队在获得官方数据使用授权后公开了这些资料。相比CMB-Exam的传统题型，另一个子集CMB-Clin则更具趣味性，它基于教材中的74个真实案例，这些案例比单纯的考题更为复杂且具有挑战性，更接近专业医生的问诊场景，用于评估LLMs的推理能力。

xianweichengxiang

可视化图片

CMB_0.png

CMB_1.webp

CMB_2.webp

数据集元信息

模态	other
任务类型	other
解剖结构	全身
解剖区域	全身
类别数	280
数据量	269,359+
文件格式	.json

文件结构

CMB-Clin
|———— CMB-Clin-qa.json

图像尺寸统计

统计类型	间距 (mm)	尺寸
最小值	`-`	`-`
中位值	`-`	`-`
最大值	`-`	`-`

引用

@article{wang2023cmb,
  title={CMB: A Comprehensive Medical Benchmark in Chinese},
  author={Wang, Xidong and Chen, Guiming Hardy and Song, Dingjie and Zhang, Zhiyi and Chen, Zhihong and Xiao, Qingying and Jiang, Feng and Li, Jianquan and Wan, Xiang and Wang, Benyou and others},
  journal={arXiv preprint arXiv:2308.08833},
  year={2023}
}

来源信息

官方网站：
访问官网

下载链接：

下载数据

公开下载，无需权限

相关论文：
查看论文

发布日期： 2023-08

统计信息

创建时间： 2025-09-10 10:20

更新时间： 2025-09-11 04:49