PathVQA是一个专门为病理学视觉问答任务设计的数据集,收集了来自两本病理学教科书和PEIR数字图书馆的4,998张病理图像,生成了32,799个问答对。该数据集中每张图像平均生成6.6个问题,问题数量从1到14不等,问题平均字数为9.5,答案平均字数为2.5。问题被分为七种类型,其中50.2%为开放式问题。PathVQA的意义在于为病理图像的自动解析和理解提供了实际的问答案例,这对于AI驱动的医疗诊断系统的发展至关重要。通过这些多样化和复杂的问答,可以更全面和深入地训练AI模型,从而提高其在临床应用中的效果。
xianweichengxiang维度 | 2D |
模态 | other |
任务类型 | other |
解剖结构 | 病理组织 |
解剖区域 | 全身 |
类别数 | 7 |
数据量 | 32,799 |
文件格式 | .json, .pkl |
.
├── Baselines # 相关代码
├── QA-pairs.json
└── split
├── glove_pvqa_300d.npy
├── images
│ ├── test
│ ├── train
│ └── val
├── pvqa_dictionary.pkl
├── qas
│ ├── ans2label.pkl
│ ├── pvqa_trainval_ans.json
│ ├── q2a.pkl
│ ├── qid2a.pkl
│ ├── qid2q.pkl
│ ├── test
│ ├── test_vqa.pkl
│ ├── train
│ ├── trainval_ans2label.pkl
│ ├── trainval_label2ans.pkl
│ ├── train_vqa.pkl
│ ├── val
│ └── val_vqa.pkl
├── test_img_id2idx.pkl
├── train_img_id2idx.pkl
└── val_img_id2idx.pkl
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
- |
中位值 | - |
- |
最大值 | - |
- |
@article{he2020pathvqa,
title={PathVQA: 30000+ Questions for Medical Visual Question Answering},
author={He, Xuehai and Zhang, Yichen and Mou, Luntian and Xing, Eric and Xie, Pengtao},
journal={arXiv preprint arXiv:2003.10286},
year={2020}
}