LC25000(肺与结肠)数据集包含25,000张组织病理学图像,所有图像尺寸均为768×768像素。该数据集分为5个类别:结肠腺癌(colon adenocarcinoma)、良性结肠组织(benign colon tissue)、肺腺癌(lung adenocarcinoma)、肺鳞状细胞癌(lung squamous cell carcinoma)和良性肺组织(benign lung tissue),每个类别包含5,000张图像。以深度学习算法为代表的人工智能技术正在积极推动医学影像的发展,但此类技术需要大量临床数据支持。肺癌和结肠癌是临床常见的两种癌症类型,然而该领域研究者可公开获取的影像数据极为匮乏。因此,在James A. Haley退伍军人医院的支持与协助下,作者完成了本数据集的图像采集与标注工作,并允许所有人免费下载,以促进人工智能技术在该领域的创新应用。
xianweichengxiang维度 | 2D |
模态 | pathology |
任务类型 | classification |
解剖结构 | 组织 |
解剖区域 | 组织 |
类别数 | 5 |
数据量 | 25000 |
文件格式 | .jpeg |
LC25000 Dataset
├── colon_image_sets
│ ├── colon_aca
│ │ ├── colonca1.jpeg
│ │ ├── colonca2.jpeg
│ │ ...
│ ├── colon_n
│ │ ├── colonn1.jpeg
│ │ ├── colonn2.jpeg
│ ├── ...
├── lung_image_sets
│ ├── lung_aca
│ │ ├── lungaca1.jpeg
│ │ ├── lungaca2.jpeg
│ │ ├── ...
│ ├── lung_n
│ │ ├── lungn1.jpeg
│ │ ├── lungn2.jpeg
│ │ ├── ...
│ ├── lung_scc
│ │ ├── lungscc1.jpeg
│ │ ├── lungscc2.jpeg
│ │ ├── ...
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
[768,768] |
中位值 | - |
[768,768] |
最大值 | - |
[768,768] |
@article{borkowski2019lung,
title={Lung and colon cancer histopathological image dataset (lc25000)},
author={Borkowski, Andrew A and Bui, Marilyn M and Thomas, L Brannon and Wilson, Catherine P and DeLand, Lauren A and Mastorides, Stephen M},
journal={arXiv preprint arXiv:1912.12142},
year={2019}
}