Fitzpatrick 17k数据集包含16,577张皮肤病学图像,按照Fitzpatrick皮肤类型系统进行分类,图像来源于开源皮肤病学图集DermaA最小值(皮肤病图谱)和Atlas Dermatologico(皮肤病学图集)。该数据集涵盖114种不同的皮肤病症,每种病症至少有53张图像,最多达653张图像。数据集开发者指出,现有皮肤病学数据集和分析算法在肤色方面存在显著偏差。Fitzpatrick皮肤类型系统将人类皮肤分为1至6共六个等级,数字越大代表肤色越深。通过为这些图像提供详细的Fitzpatrick分类标签,该数据集不仅推动了皮肤病学研究,还在提高机器学习模型诊断皮肤病的准确性和公平性方面发挥关键作用。此外,该数据集还用于评估算法在不同皮肤类型间的公平性,旨在减少偏见并提升对不同人群的诊断效果。
pifu
| 维度 | 2D |
| 模态 | dermoscopy |
| 任务类型 | classification |
| 类别数 | 6 |
| 数据量 | 16577 |
| 文件格式 | .jpg |
Fitzpatrick
├── image
│ ├── xxx.jpg
│ ├── xxx.jpg
│ │ ...
│ ├── xxx.jpg
│ ├── xxx.jpg
│ │ ...
├── train.txt
├── val.txt
| 统计类型 | 尺寸 |
|---|---|
| 最小值 | 66x130 |
| 中位值 | 470x541 |
| 最大值 | 1380x2449 |
@inproceedings{groh2021evaluating,
title={Evaluating deep neural networks trained on clinical images in dermatology with the fitzpatrick 17k dataset},
author={Groh, Matthew and Harris, Caleb and Soenksen, Luis and Lau, Felix and Han, Rachel and Kim, Aerin and Koochek, Arash and Badri, Omar},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
pages={1820--1828},
year={2021}
}
@article{groh2022towards,
title={Towards transparency in dermatology image datasets with skin tone annotations by experts, crowds, and an algorithm},
author={Groh, Matthew and Harris, Caleb and Daneshjou, Roxana and Badri, Omar and Koochek, Arash},
journal={Proceedings of the ACM on Human-Computer Interaction},
volume={6},
number={CSCW2},
pages={1--26},
year={2022},
publisher={ACM New York, NY, USA}
}