WSI-VQA是一个专为病理全切片图像(WSI)视觉问答任务设计的数据集,包含977个全切片图像和8672个问答对。该数据集基于公开的TCGA-BRCA病理报告和临床信息,在大语言模型的辅助下生成,涵盖了各种与全切片图像相关的任务。每个WSI平均关联8.9个问答对,其中封闭式问答对有4535个,开放式问答对有4137个。数据集中的问题展示了多样性,从识别边缘状态到WSI的免疫组化分级等。数据集涵盖了不同类别的问题,主要以“what”问题为主,占80%。此外,还有其他类型的问题,如13.2%的“yes/no”问题,1.4%的“where”问题和3%的“which”问题。
xianweichengxiang维度 | 2D |
模态 | other |
任务类型 | other |
解剖结构 | 乳腺组织 |
解剖区域 | 乳腺 |
数据量 | 977张WSI, 8672个QA对 |
文件格式 | .json |
.
├── WsiVQAQA.json
├── dataset
├── split.csv
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | 未提供 |
未提供 |
中位值 | 未提供 |
未提供 |
最大值 | 未提供 |
未提供 |
@misc{chen2024wsivqainterpretingslideimages,
title={WSI-VQA: Interpreting Whole Slide Images by Generative Visual Question Answering},
author={Pingyi Chen and Chenglu Zhu and Sunyi Zheng and Honglin Li and Lin Yang},
year={2024},
eprint={2407.05603},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2407.05603},
}