PMC-VQA

PMC-VQA数据集是一个用于医学视觉问答（Medical Visual Question Answering，MedVQA）任务的大规模多模态数据集。该数据集包含22.7万个与14.9万张医学图像相关联的视觉问答问题，涵盖多种医学影像模态和疾病类型。其测试集包含5万张图像-文本对（称为PMC-VQA-test）；此外，数据集还提供了一个高质量人工标注的小规模测试集（包含2000对数据，称为PMC-VQA-test-clean），保留了PMC-VQA-test中超过80%的数据内容。PMC-VQA涵盖超过20种影像数据类型，包括从放射学到病理学乃至显微镜检查等多种成像模态。问题选项主要包含位置描述、成像模态和特定解剖区域，以全面评估模型识别医学数据的能力。

xianweichengxiang

可视化图片

PMC-VQA_0.png

PMC-VQA_1.webp

PMC-VQA_2.webp

PMC-VQA_3.webp

PMC-VQA_4.webp

数据集元信息

模态	other
任务类型	other
解剖结构	多种
解剖区域	全身
数据量	227K图像-问题对
文件格式	.csv, .jpg

文件结构

PMC-VQA
│
├── images
│   └── figures
│       ├── PMC479042_pbio-0020244-g007_164.jpg
│       ├── PMC509297_pbio-0020225-g003_255.jpg
│       └── ...
├── images_2
│   └── figures
│       ├── PMC1065321_F6.jpg
│       ├── PMC1079854_F10.jpg
│       └── ...
├── test.csv
│
├── test_2.csv
│
├── test_clean.csv
│
├── train.csv
│
└── train_2.csv

图像尺寸统计

统计类型	间距 (mm)	尺寸
最小值	`-`	`-`
中位值	`-`	`-`
最大值	`-`	`-`

引用

@article{zhang2023pmc,
  title={Pmc-vqa: Visual instruction tuning for medical visual question answering},
  author={Zhang, Xiaoman and Wu, Chaoyi and Zhao, Ziheng and Lin, Weixiong and Zhang, Ya and Wang, Yanfeng and Xie, Weidi},
  journal={arXiv preprint arXiv:2305.10415},
  year={2023}
}

来源信息

官方网站：
访问官网

下载链接：

下载数据

公开下载，无需权限

相关论文：
查看论文

发布日期： 2023-05

统计信息

创建时间： 2025-09-10 10:21

更新时间： 2025-09-13 06:27