基础模型(Foundation models)通常通过大规模数据进行训练,并在各种视觉和语言应用中取得了巨大成功。最新进展进一步使这些模型能够高效适应下游任务,即使在训练样本有限的情况下(例如小样本学习场景)。然而,这种学习范式在医学图像分析中的应用仍然有限,主要原因是缺乏公开可用的数据和基准测试。作者旨在探索适用于医学图像分类(classification)的基础模型,并引入新的数据集和评估基准,专门用于测试大规模基础模型在适应多样化真实临床任务时的整体表现。作者从多家机构收集了五组医学影像数据,针对不同的真实临床任务(总计22,349张图像),包括:胸部X光疾病筛查、病理病变组织筛查、内窥镜图像病变检测(detection)、新生儿黄疸评估和糖尿病视网膜病变分级。基于提出的数据集,从准确性和成本效益角度展示了各种基线方法的结果。
全身维度 | 2D |
模态 | multimodal |
任务类型 | classification |
解剖结构 | 胸部、结肠、头部、面部、胸部、眼底 |
解剖区域 | 胸部、结肠、头部、面部、胸部、眼底 |
类别数 | 1922425 |
数据量 | 22,349 |
文件格式 | png |
data
├── ChestDR
├── Endo
├── NeoJaudice
├── ColonPath
├── Retino
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
(567, 567) |
中位值 | - |
(1280, 1024) |
最大值 | - |
(2953, 2965) |
@article{wang2023real,
title={A real-world dataset and benchmark for foundation model adaptation in medical image classification},
author={Wang, Dequan and Wang, Xiaosong and Wang, Lilong and Li, Mengzhang and Da, Qian and Liu, Xiaoqiang and Gao, Xiangyu and Shen, Jun and He, Junjun and Shen, Tian and others},
journal={Scientific Data},
volume={10},
number={1},
pages={574},
year={2023},
publisher={Nature Publishing Group UK London}
}