朝阳医院(Chaoyang)数据集是一个用于分类的病理图像数据集,专注于结直肠癌的诊断。该数据集包含来自首都医科大学附属北京朝阳医院的结肠切片图像,采用20倍物镜扫描。涵盖多种病变类别,包括正常组织、锯齿状病变(serrated lesions)、腺癌(adenocarcinomas)和腺瘤(adenomas)。数据集共包含6,160张图像,其中训练集4,021张,测试集2,139张。该数据集包含真实场景中常见的标注噪声,可增强模型处理实际数据的鲁棒性。此外,测试集由三位病理学家统一标注,确保标签的可靠性。数据集包含多种结直肠病变类型,提供了多类别分类挑战,有助于提升病理模型在细粒度分类任务中的表现。
xianweichengxiang维度 | 2D |
模态 | pathology |
任务类型 | classification |
解剖结构 | 结肠(Colon) |
解剖区域 | 结肠(Colon) |
类别数 | 4 |
数据量 | 6160 |
文件格式 | JPG |
chaoyang-dataset
│
├── train
│ ├── image1
│ ├── image2
│ └── ...
├── test
│ ├── image1
│ ├── image2
│ └── ...
├── train.json
├── test.json
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
(512, 512) |
中位值 | - |
(512, 512) |
最大值 | - |
(512, 512) |
@article{zhu2021hard,
title={Hard sample aware noise robust learning for histopathology image classification},
author={Zhu, Chuang and Chen, Wenkai and Peng, Ting and Wang, Ying and Jin, Mulan},
journal={IEEE transactions on medical imaging},
volume={41},
number={4},
pages={881--894},
year={2021},
publisher={IEEE}
}