PathVQA

PathVQA是一个专门为病理学视觉问答任务设计的数据集，收集了来自两本病理学教科书和PEIR数字图书馆的4,998张病理图像，生成了32,799个问答对。该数据集中每张图像平均生成6.6个问题，问题数量从1到14不等，问题平均字数为9.5，答案平均字数为2.5。问题被分为七种类型，其中50.2%为开放式问题。PathVQA的意义在于为病理图像的自动解析和理解提供了实际的问答案例，这对于AI驱动的医疗诊断系统的发展至关重要。通过这些多样化和复杂的问答，可以更全面和深入地训练AI模型，从而提高其在临床应用中的效果。

xianweichengxiang

可视化图片

PathVQA_0.png

PathVQA_1.webp

PathVQA_2.webp

PathVQA_3.webp

PathVQA_4.webp

数据集元信息

维度	2D
模态	other
任务类型	other
解剖结构	病理组织
解剖区域	全身
类别数	7
数据量	32,799
文件格式	.json, .pkl

文件结构

.               
├── Baselines # 相关代码
├── QA-pairs.json
└── split
    ├── glove_pvqa_300d.npy
    ├── images
    │   ├── test
    │   ├── train
    │   └── val
    ├── pvqa_dictionary.pkl
    ├── qas
    │   ├── ans2label.pkl
    │   ├── pvqa_trainval_ans.json
    │   ├── q2a.pkl
    │   ├── qid2a.pkl
    │   ├── qid2q.pkl
    │   ├── test
    │   ├── test_vqa.pkl
    │   ├── train
    │   ├── trainval_ans2label.pkl
    │   ├── trainval_label2ans.pkl
    │   ├── train_vqa.pkl
    │   ├── val
    │   └── val_vqa.pkl
    ├── test_img_id2idx.pkl
    ├── train_img_id2idx.pkl
    └── val_img_id2idx.pkl

图像尺寸统计

统计类型	间距 (mm)	尺寸
最小值	`-`	`-`
中位值	`-`	`-`
最大值	`-`	`-`

引用

@article{he2020pathvqa,
  title={PathVQA: 30000+ Questions for Medical Visual Question Answering},
  author={He, Xuehai and Zhang, Yichen and Mou, Luntian and Xing, Eric and Xie, Pengtao},
  journal={arXiv preprint arXiv:2003.10286},
  year={2020}
}

来源信息

官方网站：
访问官网

下载链接：

下载数据

公开下载，无需权限

相关论文：
查看论文

发布日期： 2020.3.7

统计信息

创建时间： 2025-09-10 10:21

更新时间： 2025-09-13 06:22