PathMMU是一个专业级基准数据集,旨在评估大型多模态模型(LMMs)在病理学图像解读中的理解和推理能力。该数据集包含33,428个问答对和24,067张病理学图像,数据来源于PubMed科学文献、病理学教科书中的图谱和指南、病理学专家在Twitter上的发帖、常见病理学分类数据集以及YouTube教程视频等高质量领域。
xianweichengxiang维度 | 2D |
模态 | other |
任务类型 | other |
解剖结构 | 多器官系统 |
解剖区域 | 全身 |
数据量 | 33,428问答对 |
文件格式 | .json |
.
├── data.json
├── images.zip
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | 未提供 |
451x494 |
中位值 | 未提供 |
692x650 |
最大值 | 未提供 |
1573x888 |
@misc{chen2024wsivqainterpretingslideimages,
title={WSI-VQA: Interpreting Whole Slide Images by Generative Visual Question Answering},
author={Pingyi Chen and Chenglu Zhu and Sunyi Zheng and Honglin Li and Lin Yang},
year={2024},
eprint={2407.05603},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2407.05603},
}