AbdomenAtlas 3.0 是目前公开的最大规模腹部CT图像-文本配对数据集,旨在解决医学影像中的肿瘤检测与报告生成难题。该数据集包含9,262例3D CT扫描,来源于88家医疗机构,覆盖19个国家,并且是首个提供逐像素(per-voxel)标注、详细肿瘤报告以及肿瘤分期信息的公开数据集。这些CT扫描数据通过标准医学影像格式(NIfTI和DICOM)存储,具备体素间距及HU值等临床信息。
腹部任务类型 | diagnosis |
数据量 | train:9262;test:4500 (OOD测试集) |
AbdomenAtlas_3.0/
├── images/
│ ├── nifti/
│ │ ├── case_00001.nii.gz
│ │ ├── case_00002.nii.gz
│ │ └── ...
│ └── dicom/
│ ├── case_00001/
│ │ ├── 1.dcm
│ │ ├── 2.dcm
│ │ └── ...
│ └── ...
├── annotations/
│ ├── masks/
│ │ ├── case_00001.nii.gz
│ │ ├── case_00002.nii.gz
│ │ └── ...
│ └── reports/
│ ├── structured/
│ │ ├── case_00001.json
│ │ ├── case_00002.json
│ │ └── ...
│ ├── narrative/
│ │ ├── case_00001.txt
│ │ ├── case_00002.txt
│ │ └── ...
│ └── human_ai_fusion/
│ ├── case_00001.txt
│ ├── case_00002.txt
│ └── ...
└── metadata.json
@article{bassi2025radgpt,
title={RadGPT: Constructing 3D Image-Text Tumor Datasets},
author={Bassi, Pedro RAS and Yavuz, Mehmet Can and Wang, Kang and Chen, Xiaoxi and Li, Wenxuan and Decherchi, Sergio and Cavalli, Andrea and Yang, Yang and Yuille, Alan and Zhou, Zongwei},
journal={arXiv preprint arXiv:2501.04678},
year={2025}
}
创建时间: 2025-08-31 09:47
更新时间: 2025-09-17 08:39