ROCOV2

ROCOv2（医学影像上下文对象数据集第二版）是一个创新的多模态医学影像数据集，整合了放射影像与相关医学概念及描述。该数据集包含从PubMed开放获取子集中提取的80,080张放射影像，每张影像均附带医学概念、描述、关键词，以及来自统一医学语言系统（UMLS，Unified Medical Language System）的唯一标识符和语义类型。作为2018年发布的ROCO数据集的升级版，ROCOv2新增了自2018年以来从PubMed获取的35,852张影像，并包含人工标注的临床模式、解剖区域（针对X光片）和方位信息（针对X光片）。本数据集已应用于2023年ImageCLEF医学概念检测与描述预测任务。研究者在签署用户协议后，可获取训练集和验证集用于相关科研实验。该数据集特别适合基于图像-描述对训练图像标注模型，或使用提供的UMLS概念进行多标签图像分类，有助于构建结构化医学报告支持系统。

xianweichengxiang

可视化图片

ROCOV2_0.png

ROCOV2_1.webp

数据集元信息

维度	2D
模态	multimodal
任务类型	other
解剖结构	多器官
解剖区域	全身
数据量	80,080
文件格式	.csv, .jpg

文件结构

.
├── cui_mapping.csv
├── license_information.csv
├── test_captions.csv
├── test_concepts.csv
├── test_concepts_manual.csv
├── test_images.zip
├── train_captions.csv
├── train_concepts.csv
├── train_concepts_manual.csv
├── train_images.zip
├── valid_captions.csv
├── valid_concepts.csv
├── valid_concepts_manual.csv
└── valid_images.zip

图像尺寸统计

统计类型	间距 (mm)	尺寸
最小值	`-`	`-`
中位值	`-`	`-`
最大值	`-`	`-`

引用

@inproceedings{pelka2018radiology,
  title={Radiology Objects in COntext (ROCO): a multimodal image dataset},
  author={Pelka, Obioma and Koitka, Sven and R{\"u}ckert, Johannes and Nensa, Felix and Friedrich, Christoph M},
  booktitle={Intravascular Imaging and Computer Assisted Stenting and Large-Scale Annotation of Biomedical Data and Expert Label Synthesis: 7th Joint International Workshop, CVII-STENT 2018 and Third International Workshop, LABELS 2018, Held in Conjunction with MICCAI 2018, Granada, Spain, September 16, 2018, Proceedings 3},
  pages={180--189},
  year={2018},
  organization={Springer}
}

来源信息

官方网站：
访问官网

下载链接：

下载数据

公开下载，无需权限

相关论文：
查看论文

发布日期： 2023-11-10

统计信息

创建时间： 2025-09-10 10:21

更新时间： 2025-09-13 06:35