SLAKE是一个专门为医学视觉问答(Med-VQA)系统设计的英汉双语数据集,包含642张图像和14,028个问答对。该数据集不仅促进了医学图像的自动解读,还通过问答形式增强了机器对医学图像内容的理解和推理能力。
xianweichengxiang维度 | 2D |
模态 | other |
任务类型 | other |
解剖结构 | 多器官 |
解剖区域 | 全身 |
数据量 | 642张图像 |
文件格式 | .txt, .json, .png, .jpg |
.
├── imgs
│ ├── xmlab0
│ │ ├── detection.json
│ │ ├── mask.png
│ │ ├── question.json
│ │ └── source.jpg
│ ├── xmlab1
│ ├── xmlab10
│ └── ...
├── KG
│ ├── disease.csv
│ ├── en_disease.csv
│ ├── en_organ.csv
│ ├── en_organ_rel.csv
│ ├── organ.csv
│ └── organ_rel.csv
├── mask.txt
├── test.json
├── train.json
└── validate.json
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | 未提供 |
未提供 |
中位值 | 未提供 |
未提供 |
最大值 | 未提供 |
未提供 |
@inproceedings{liu2021slake,
title={Slake: A semantically-labeled knowledge-enhanced dataset for medical visual question answering},
author={Liu, Bo and Zhan, Li-Ming and Xu, Li and Ma, Lin and Yang, Yan and Wu, Xiao-Ming},
booktitle={2021 IEEE 18th International Symposium on Biomedical Imaging (ISBI)},
pages={1650--1654},
year={2021},
organization={IEEE}
}