中文医学综合基准测试(Comprehensive Medical Benchmark in Chinese,CMB)由香港中文大学(深圳)研究团队于2023年推出。该数据集旨在为大型语言模型(Large Language Models,LLMs)在医学领域的表现提供标准化评估平台。其子集CMB-Exam汇集了大量公开的模拟试题、课程练习题和常见易错题,主要来源于中国医学题库。研究团队在获得官方数据使用授权后公开了这些资料。相比CMB-Exam的传统题型,另一个子集CMB-Clin则更具趣味性,它基于教材中的74个真实案例,这些案例比单纯的考题更为复杂且具有挑战性,更接近专业医生的问诊场景,用于评估LLMs的推理能力。
xianweichengxiang模态 | other |
任务类型 | other |
解剖结构 | 全身 |
解剖区域 | 全身 |
类别数 | 280 |
数据量 | 269,359+ |
文件格式 | .json |
CMB-Clin
|———— CMB-Clin-qa.json
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
- |
中位值 | - |
- |
最大值 | - |
- |
@article{wang2023cmb,
title={CMB: A Comprehensive Medical Benchmark in Chinese},
author={Wang, Xidong and Chen, Guiming Hardy and Song, Dingjie and Zhang, Zhiyi and Chen, Zhihong and Xiao, Qingying and Jiang, Feng and Li, Jianquan and Wan, Xiang and Wang, Benyou and others},
journal={arXiv preprint arXiv:2308.08833},
year={2023}
}