PANDA数据集是从前列腺活检样本的显微镜扫描图像中对前列腺癌的严重程度进行分类。与大多数比赛不同,本问题有两个不寻常的特点。首先,单个图像的尺寸相当大,参赛者需要提出有效策略来定位并放大关注区域以提高处理效率。其次,标签并不完美。由于病理学领域的挑战性,即使是经验丰富的病理学专家,也未必能就载玻片的解读达成一致。这使得训练模型变得更加困难,但也增加了构建强大模型以提供一致评级的潜在医疗价值。所有私有测试集图像和大多数公共测试集图像由多名病理学家进行评分,但由于成本原因,这种多专家评分方式并未应用于训练集。
腹部维度 | 2D |
模态 | pathology |
任务类型 | classification |
解剖结构 | Prostate |
解剖区域 | Prostate |
类别数 | 5 |
数据量 | 331 |
文件格式 | .JPG |
Gleason
├── image
│ ├── train
│ │ ├── xxx.jpg
│ │ ├── xxx.jpg
│ │ ├── xxx.jpg
│ │ ├── xxx.jpg
│ │ └── ...
│ └── val
│ │ ├── xxx.jpg
│ │ ├── xxx.jpg
│ │ ├── xxx.jpg
│ │ ├── xxx.jpg
│ │ └── ...
├── train.txt
└── val.txt
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
(4608, 4608) |
中位值 | - |
(5096, 5004) |
最大值 | - |
(5632, 5632) |
@article{nir2018automatic,
title={Automatic grading of prostate cancer in digitized histopathology images: Learning from multiple experts},
author={Nir, Guy and Hor, Soheil and Karimi, Davood and Fazli, Ladan and Skinnider, Brian F and Tavassoli, Peyman and Turbin, Dmitry and Villamil, Carlos F and Wang, Gang and Wilson, R Storey and others},
journal={Medical image analysis},
volume={50},
pages={167--180},
year={2018},
publisher={Elsevier}
}