ROCOv2(医学影像上下文对象数据集第二版)是一个创新的多模态医学影像数据集,整合了放射影像与相关医学概念及描述。该数据集包含从PubMed开放获取子集中提取的80,080张放射影像,每张影像均附带医学概念、描述、关键词,以及来自统一医学语言系统(UMLS,Unified Medical Language System)的唯一标识符和语义类型。作为2018年发布的ROCO数据集的升级版,ROCOv2新增了自2018年以来从PubMed获取的35,852张影像,并包含人工标注的临床模式、解剖区域(针对X光片)和方位信息(针对X光片)。本数据集已应用于2023年ImageCLEF医学概念检测与描述预测任务。研究者在签署用户协议后,可获取训练集和验证集用于相关科研实验。该数据集特别适合基于图像-描述对训练图像标注模型,或使用提供的UMLS概念进行多标签图像分类,有助于构建结构化医学报告支持系统。
xianweichengxiang维度 | 2D |
模态 | multimodal |
任务类型 | other |
解剖结构 | 多器官 |
解剖区域 | 全身 |
数据量 | 80,080 |
文件格式 | .csv, .jpg |
.
├── cui_mapping.csv
├── license_information.csv
├── test_captions.csv
├── test_concepts.csv
├── test_concepts_manual.csv
├── test_images.zip
├── train_captions.csv
├── train_concepts.csv
├── train_concepts_manual.csv
├── train_images.zip
├── valid_captions.csv
├── valid_concepts.csv
├── valid_concepts_manual.csv
└── valid_images.zip
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
- |
中位值 | - |
- |
最大值 | - |
- |
@inproceedings{pelka2018radiology,
title={Radiology Objects in COntext (ROCO): a multimodal image dataset},
author={Pelka, Obioma and Koitka, Sven and R{\"u}ckert, Johannes and Nensa, Felix and Friedrich, Christoph M},
booktitle={Intravascular Imaging and Computer Assisted Stenting and Large-Scale Annotation of Biomedical Data and Expert Label Synthesis: 7th Joint International Workshop, CVII-STENT 2018 and Third International Workshop, LABELS 2018, Held in Conjunction with MICCAI 2018, Granada, Spain, September 16, 2018, Proceedings 3},
pages={180--189},
year={2018},
organization={Springer}
}