PMC-VQA数据集是一个用于医学视觉问答(Medical Visual Question Answering,MedVQA)任务的大规模多模态数据集。该数据集包含22.7万个与14.9万张医学图像相关联的视觉问答问题,涵盖多种医学影像模态和疾病类型。其测试集包含5万张图像-文本对(称为PMC-VQA-test);此外,数据集还提供了一个高质量人工标注的小规模测试集(包含2000对数据,称为PMC-VQA-test-clean),保留了PMC-VQA-test中超过80%的数据内容。PMC-VQA涵盖超过20种影像数据类型,包括从放射学到病理学乃至显微镜检查等多种成像模态。问题选项主要包含位置描述、成像模态和特定解剖区域,以全面评估模型识别医学数据的能力。
xianweichengxiang模态 | other |
任务类型 | other |
解剖结构 | 多种 |
解剖区域 | 全身 |
数据量 | 227K图像-问题对 |
文件格式 | .csv, .jpg |
PMC-VQA
│
├── images
│ └── figures
│ ├── PMC479042_pbio-0020244-g007_164.jpg
│ ├── PMC509297_pbio-0020225-g003_255.jpg
│ └── ...
├── images_2
│ └── figures
│ ├── PMC1065321_F6.jpg
│ ├── PMC1079854_F10.jpg
│ └── ...
├── test.csv
│
├── test_2.csv
│
├── test_clean.csv
│
├── train.csv
│
└── train_2.csv
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
- |
中位值 | - |
- |
最大值 | - |
- |
@article{zhang2023pmc,
title={Pmc-vqa: Visual instruction tuning for medical visual question answering},
author={Zhang, Xiaoman and Wu, Chaoyi and Zhao, Ziheng and Lin, Weixiong and Zhang, Ya and Wang, Yanfeng and Xie, Weidi},
journal={arXiv preprint arXiv:2305.10415},
year={2023}
}