PathVQA

PathVQA是一个专门为病理学视觉问答任务设计的数据集,收集了来自两本病理学教科书和PEIR数字图书馆的4,998张病理图像,生成了32,799个问答对。该数据集中每张图像平均生成6.6个问题,问题数量从1到14不等,问题平均字数为9.5,答案平均字数为2.5。问题被分为七种类型,其中50.2%为开放式问题。PathVQA的意义在于为病理图像的自动解析和理解提供了实际的问答案例,这对于AI驱动的医疗诊断系统的发展至关重要。通过这些多样化和复杂的问答,可以更全面和深入地训练AI模型,从而提高其在临床应用中的效果。

xianweichengxiang
可视化图片
PathVQA_0.png
PathVQA_0.png
PathVQA_1.webp
PathVQA_1.webp
PathVQA_2.webp
PathVQA_2.webp
PathVQA_3.webp
PathVQA_3.webp
PathVQA_4.webp
PathVQA_4.webp
数据集元信息
维度2D
模态other
任务类型other
解剖结构病理组织
解剖区域全身
类别数7
数据量32,799
文件格式.json, .pkl
文件结构
.               
├── Baselines # 相关代码
├── QA-pairs.json
└── split
    ├── glove_pvqa_300d.npy
    ├── images
    │   ├── test
    │   ├── train
    │   └── val
    ├── pvqa_dictionary.pkl
    ├── qas
    │   ├── ans2label.pkl
    │   ├── pvqa_trainval_ans.json
    │   ├── q2a.pkl
    │   ├── qid2a.pkl
    │   ├── qid2q.pkl
    │   ├── test
    │   ├── test_vqa.pkl
    │   ├── train
    │   ├── trainval_ans2label.pkl
    │   ├── trainval_label2ans.pkl
    │   ├── train_vqa.pkl
    │   ├── val
    │   └── val_vqa.pkl
    ├── test_img_id2idx.pkl
    ├── train_img_id2idx.pkl
    └── val_img_id2idx.pkl
图像尺寸统计
统计类型 间距 (mm) 尺寸
最小值 - -
中位值 - -
最大值 - -
引用
@article{he2020pathvqa,
  title={PathVQA: 30000+ Questions for Medical Visual Question Answering},
  author={He, Xuehai and Zhang, Yichen and Mou, Luntian and Xing, Eric and Xie, Pengtao},
  journal={arXiv preprint arXiv:2003.10286},
  year={2020}
}
来源信息

官方网站:
访问官网

下载链接:

登录后下载
需要登录并获得知识星球权限

相关论文:
查看论文

发布日期: 2020.3.7

统计信息

创建时间: 2025-09-10 10:21

更新时间: 2025-09-13 06:22