MedBench

MedBench是一个大规模、高质量的中文医疗大模型评估数据集。基于权威医疗标准，MedBench设立了医学语言理解、医学语言生成、医学知识问答、复杂医学推理和医疗安全伦理5大维度，包含15项任务、20个数据集和30万道题目，为中文医疗大模型提供客观科学的性能评估参考。MedBench基于8个公开数据集和12个自建数据集构建，涵盖医学考试、医疗问答、患者服务、医学咨询、病历分析、病历生成和辅助诊断等场景，覆盖57个临床科室。

xianweichengxiang

可视化图片

MedBench_0.png

MedBench_1.webp

MedBench_2.webp

数据集元信息

模态	other
任务类型	other
解剖结构	全身
解剖区域	全身
数据量	300,000
文件格式	.json

文件结构

MedBench
├── CHIP-CDEE
│   ├── CHIP-CDEE_test.jsonl
│   └── 提交结果示例.jsonl
├── CHIP-CDN
│   ├── CHIP-CDN_test.jsonl
│   └── 提交结果示例.jsonl
├── CHIP-CTC
│   ├── CHIP-CTC_test.jsonl
│   └── 提交结果示例.jsonl
├── CMB-Clin
│   ├── CMB-Clin_test.jsonl
│   └── 提交结果示例.jsonl
├── CMeEE
│   ├── CMeEE_test.jsonl
│   └── 提交结果示例.jsonl
├── CMeIE
│   ├── CMeIE_test.jsonl
│   └── 提交结果示例.jsonl
├── DBMHG
│   ├── DBMHG_test.jsonl
│   └── 提交结果示例.jsonl
├── DDx-advanced
│   ├── DDx-advanced_test.jsonl
│   └── 提交结果示例.jsonl
├── DDx-basic
│   ├── DDx-basic_test.jsonl
│   └── 提交结果示例.jsonl
├── DrugCA
│   ├── DrugCA_test.jsonl
│   └── 提交结果示例.jsonl
├── IMCS-V2-MRG
│   ├── IMCS-V2-MRG_test.jsonl
│   └── 提交结果示例.jsonl
├── Med-Exam
│   ├── Med-Exam_test.jsonl
│   └── 提交结果示例.jsonl
├── MedDG
│   ├── MedDG_test.jsonl
│   └── 提交结果示例.jsonl
├── MedHC
│   ├── MedHC_test.jsonl
│   └── 提交结果示例.jsonl
├── MedHG
│   ├── MedHG_test.jsonl
│   └── 提交结果示例.jsonl
├── MedMC
│   ├── MedMC_test.jsonl
│   └── 提交结果示例.jsonl
├── MedSafety
│   ├── MedSafety_test.jsonl
│   └── 提交结果示例.jsonl
├── MedSpeQA
│   ├── MedSpeQA_test.jsonl
│   └── 提交结果示例.jsonl
├── MedTreat
│   ├── MedTreat_test.jsonl
│   └── 提交结果示例.jsonl
└── SMDoc
    ├── SMDoc_test.jsonl
    └── 提交结果示例.jsonl

图像尺寸统计

统计类型	间距 (mm)	尺寸
最小值	`-`	`-`
中位值	`-`	`-`
最大值	`-`	`-`

引用

TBD

来源信息

官方网站：
访问官网

下载链接：

下载数据

公开下载，无需权限

相关论文：
TBD

发布日期： 2023-12

统计信息

创建时间： 2025-09-10 10:21

更新时间： 2025-09-12 17:54