Quilt-VQA是一个专为病理图像视觉问答(VQA)任务设计的数据集,包含1283对基于病理图像的问题和答案。这些问答对分为不同的类别,数据集中共有985张相关的图像,并且这些问题被分为开放式(940对)和封闭式(343对)问题。除了医学知识之外,Quilt-VQA还评估了模型在多模态对话中遵循指令的能力。为此,额外构建了326个问题,其中包括256个对话类问题和70个详细描述类问题。
xianweichengxiang维度 | 2D |
模态 | other |
任务类型 | other |
解剖结构 | 组织 |
解剖区域 | 全身 |
数据量 | 1283 |
文件格式 | .json |
.
├──quilt_vqa.zip
├──quiltvqa_test_w_ans.json
├──quiltvqa_test_wo_ans.jsonl
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | 不适用 |
不适用 |
中位值 | 不适用 |
不适用 |
最大值 | 不适用 |
不适用 |
@inproceedings{seyfioglu2024quilt,
title={Quilt-LLaVA: Visual Instruction Tuning by Extracting Localized Narratives from Open-Source Histopathology Videos},
author={Seyfioglu, Mehmet Saygin and Ikezogwo, Wisdom O and Ghezloo, Fatemeh and Krishna, Ranjay and Shapiro, Linda},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
pages={13183--13192},
year={2024}
}