MedBench

MedBench是一个大规模、高质量的中文医疗大模型评估数据集。基于权威医疗标准,MedBench设立了医学语言理解、医学语言生成、医学知识问答、复杂医学推理和医疗安全伦理5大维度,包含15项任务、20个数据集和30万道题目,为中文医疗大模型提供客观科学的性能评估参考。MedBench基于8个公开数据集和12个自建数据集构建,涵盖医学考试、医疗问答、患者服务、医学咨询、病历分析、病历生成和辅助诊断等场景,覆盖57个临床科室。

xianweichengxiang
可视化图片
MedBench_0.png
MedBench_0.png
MedBench_1.webp
MedBench_1.webp
MedBench_2.webp
MedBench_2.webp
数据集元信息
模态other
任务类型other
解剖结构全身
解剖区域全身
数据量300,000
文件格式.json
文件结构
MedBench
├── CHIP-CDEE
│   ├── CHIP-CDEE_test.jsonl
│   └── 提交结果示例.jsonl
├── CHIP-CDN
│   ├── CHIP-CDN_test.jsonl
│   └── 提交结果示例.jsonl
├── CHIP-CTC
│   ├── CHIP-CTC_test.jsonl
│   └── 提交结果示例.jsonl
├── CMB-Clin
│   ├── CMB-Clin_test.jsonl
│   └── 提交结果示例.jsonl
├── CMeEE
│   ├── CMeEE_test.jsonl
│   └── 提交结果示例.jsonl
├── CMeIE
│   ├── CMeIE_test.jsonl
│   └── 提交结果示例.jsonl
├── DBMHG
│   ├── DBMHG_test.jsonl
│   └── 提交结果示例.jsonl
├── DDx-advanced
│   ├── DDx-advanced_test.jsonl
│   └── 提交结果示例.jsonl
├── DDx-basic
│   ├── DDx-basic_test.jsonl
│   └── 提交结果示例.jsonl
├── DrugCA
│   ├── DrugCA_test.jsonl
│   └── 提交结果示例.jsonl
├── IMCS-V2-MRG
│   ├── IMCS-V2-MRG_test.jsonl
│   └── 提交结果示例.jsonl
├── Med-Exam
│   ├── Med-Exam_test.jsonl
│   └── 提交结果示例.jsonl
├── MedDG
│   ├── MedDG_test.jsonl
│   └── 提交结果示例.jsonl
├── MedHC
│   ├── MedHC_test.jsonl
│   └── 提交结果示例.jsonl
├── MedHG
│   ├── MedHG_test.jsonl
│   └── 提交结果示例.jsonl
├── MedMC
│   ├── MedMC_test.jsonl
│   └── 提交结果示例.jsonl
├── MedSafety
│   ├── MedSafety_test.jsonl
│   └── 提交结果示例.jsonl
├── MedSpeQA
│   ├── MedSpeQA_test.jsonl
│   └── 提交结果示例.jsonl
├── MedTreat
│   ├── MedTreat_test.jsonl
│   └── 提交结果示例.jsonl
└── SMDoc
    ├── SMDoc_test.jsonl
    └── 提交结果示例.jsonl
图像尺寸统计
统计类型 间距 (mm) 尺寸
最小值 - -
中位值 - -
最大值 - -
引用
TBD
来源信息

官方网站:
访问官网

下载链接:

登录后下载
需要登录并获得知识星球权限

相关论文:
TBD

发布日期: 2023-12

统计信息

创建时间: 2025-09-10 10:21

更新时间: 2025-09-12 17:54