WSI-VQA

WSI-VQA是一个专为病理全切片图像（WSI）视觉问答任务设计的数据集，包含977个全切片图像和8672个问答对。该数据集基于公开的TCGA-BRCA病理报告和临床信息，在大语言模型的辅助下生成，涵盖了各种与全切片图像相关的任务。每个WSI平均关联8.9个问答对，其中封闭式问答对有4535个，开放式问答对有4137个。数据集中的问题展示了多样性，从识别边缘状态到WSI的免疫组化分级等。数据集涵盖了不同类别的问题，主要以“what”问题为主，占80%。此外，还有其他类型的问题，如13.2%的“yes/no”问题，1.4%的“where”问题和3%的“which”问题。

xianweichengxiang

可视化图片

WSI-VQA_0.png

WSI-VQA_1.webp

数据集元信息

维度	2D
模态	other
任务类型	other
解剖结构	乳腺组织
解剖区域	乳腺
数据量	977张WSI, 8672个QA对
文件格式	.json

文件结构

.               
├── WsiVQAQA.json
├── dataset
    ├── split.csv

图像尺寸统计

统计类型	间距 (mm)	尺寸
最小值	`未提供`	`未提供`
中位值	`未提供`	`未提供`
最大值	`未提供`	`未提供`

引用

@misc{chen2024wsivqainterpretingslideimages,
      title={WSI-VQA: Interpreting Whole Slide Images by Generative Visual Question Answering}, 
      author={Pingyi Chen and Chenglu Zhu and Sunyi Zheng and Honglin Li and Lin Yang},
      year={2024},
      eprint={2407.05603},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2407.05603}, 
}

来源信息

官方网站：
访问官网

下载链接：

下载数据

公开下载，无需权限

相关论文：
查看论文

发布日期： 2024-07

统计信息

创建时间： 2025-09-10 10:21

更新时间： 2025-09-12 12:50