MedICaT

MedICaT是一个包含医学图像、图像说明文字、子图-子标题标注和内联引用的数据集。子图-子标题标注指复合图像中每个部分及其对应解释,而内联引用表示文本中提及图像的位置和内容。该数据集中的图像和说明文字提取自PubMed Central的开放获取生物医学论文,对应引文文本源自S2ORC。

xianweichengxiang
可视化图片
MedICaT_0.png
MedICaT_0.png
MedICaT_1.webp
MedICaT_1.webp
数据集元信息
维度2D
模态other
任务类型other
解剖结构多器官
解剖区域全身
数据量217,060张
文件格式.png,.json
文件结构
medicat
├── images
│   ├── {pdf_hash}_{fig_uri}.png
│   ├── ...
├── report.json
图像尺寸统计
统计类型 间距 (mm) 尺寸
最小值 - -
中位值 - -
最大值 - -
引用
@article{subramanian2020medicat,
  title={Medicat: A dataset of medical images, captions, and textual references},
  author={Subramanian, Sanjay and Wang, Lucy Lu and Mehta, Sachin and Bogin, Ben and van Zuylen, Madeleine and Parasa, Sravanthi and Singh, Sameer and Gardner, Matt and Hajishirzi, Hannaneh},
  journal={arXiv preprint arXiv:2010.06000},
  year={2020}
}
来源信息

官方网站:
访问官网

下载链接:

登录后下载
需要登录并获得知识星球权限

相关论文:
查看论文

发布日期: 2020.12.12

统计信息

创建时间: 2025-09-10 10:21

更新时间: 2025-09-12 17:59