CMB

中文医学综合基准测试(Comprehensive Medical Benchmark in Chinese,CMB)由香港中文大学(深圳)研究团队于2023年推出。该数据集旨在为大型语言模型(Large Language Models,LLMs)在医学领域的表现提供标准化评估平台。其子集CMB-Exam汇集了大量公开的模拟试题、课程练习题和常见易错题,主要来源于中国医学题库。研究团队在获得官方数据使用授权后公开了这些资料。相比CMB-Exam的传统题型,另一个子集CMB-Clin则更具趣味性,它基于教材中的74个真实案例,这些案例比单纯的考题更为复杂且具有挑战性,更接近专业医生的问诊场景,用于评估LLMs的推理能力。

xianweichengxiang
可视化图片
CMB_0.png
CMB_0.png
CMB_1.webp
CMB_1.webp
CMB_2.webp
CMB_2.webp
数据集元信息
模态other
任务类型other
解剖结构全身
解剖区域全身
类别数280
数据量269,359+
文件格式.json
文件结构
CMB-Clin
|———— CMB-Clin-qa.json
图像尺寸统计
统计类型 间距 (mm) 尺寸
最小值 - -
中位值 - -
最大值 - -
引用
@article{wang2023cmb,
  title={CMB: A Comprehensive Medical Benchmark in Chinese},
  author={Wang, Xidong and Chen, Guiming Hardy and Song, Dingjie and Zhang, Zhiyi and Chen, Zhihong and Xiao, Qingying and Jiang, Feng and Li, Jianquan and Wan, Xiang and Wang, Benyou and others},
  journal={arXiv preprint arXiv:2308.08833},
  year={2023}
}
来源信息

官方网站:
访问官网

下载链接:

登录后下载
需要登录并获得知识星球权限

相关论文:
查看论文

发布日期: 2023-08

统计信息

创建时间: 2025-09-10 10:20

更新时间: 2025-09-11 04:49