PMC-VQA

PMC-VQA数据集是一个用于医学视觉问答(Medical Visual Question Answering,MedVQA)任务的大规模多模态数据集。该数据集包含22.7万个与14.9万张医学图像相关联的视觉问答问题,涵盖多种医学影像模态和疾病类型。其测试集包含5万张图像-文本对(称为PMC-VQA-test);此外,数据集还提供了一个高质量人工标注的小规模测试集(包含2000对数据,称为PMC-VQA-test-clean),保留了PMC-VQA-test中超过80%的数据内容。PMC-VQA涵盖超过20种影像数据类型,包括从放射学到病理学乃至显微镜检查等多种成像模态。问题选项主要包含位置描述、成像模态和特定解剖区域,以全面评估模型识别医学数据的能力。

xianweichengxiang
可视化图片
PMC-VQA_0.png
PMC-VQA_0.png
PMC-VQA_1.webp
PMC-VQA_1.webp
PMC-VQA_2.webp
PMC-VQA_2.webp
PMC-VQA_3.webp
PMC-VQA_3.webp
PMC-VQA_4.webp
PMC-VQA_4.webp
数据集元信息
模态other
任务类型other
解剖结构多种
解剖区域全身
数据量227K图像-问题对
文件格式.csv, .jpg
文件结构
PMC-VQA
│
├── images
│   └── figures
│       ├── PMC479042_pbio-0020244-g007_164.jpg
│       ├── PMC509297_pbio-0020225-g003_255.jpg
│       └── ...
├── images_2
│   └── figures
│       ├── PMC1065321_F6.jpg
│       ├── PMC1079854_F10.jpg
│       └── ...
├── test.csv
│
├── test_2.csv
│
├── test_clean.csv
│
├── train.csv
│
└── train_2.csv
图像尺寸统计
统计类型 间距 (mm) 尺寸
最小值 - -
中位值 - -
最大值 - -
引用
@article{zhang2023pmc,
  title={Pmc-vqa: Visual instruction tuning for medical visual question answering},
  author={Zhang, Xiaoman and Wu, Chaoyi and Zhao, Ziheng and Lin, Weixiong and Zhang, Ya and Wang, Yanfeng and Xie, Weidi},
  journal={arXiv preprint arXiv:2305.10415},
  year={2023}
}
来源信息

官方网站:
访问官网

下载链接:

登录后下载
需要登录并获得知识星球权限

相关论文:
查看论文

发布日期: 2023-05

统计信息

创建时间: 2025-09-10 10:21

更新时间: 2025-09-13 06:27