HEST-1k是一个新型多模态数据集,包含1,108个空间转录组学(Spatial Transcriptomics,ST)样本,每个样本都配有苏木精-伊红(Hematoxylin and Eosin,H&E)染色的全切片图像(Whole Slide Image,WSI)和相关元数据。该数据集由HEST-Library从131个公开和内部队列中精心整理而成,涵盖25个器官、两个物种(人类和小鼠),并包含25种癌症亚型的320个癌症样本。经过处理,研究人员已识别出150万个表达-形态配对和6000万个细胞核,使HEST-1k成为同类数据集中最全面的之一。与早期的多模态数据集相比,HEST-1k独特地将丰富的病理图像与详细的基因表达数据整合在一起,同时利用H&E染色切片更广泛地揭示组织形态学及其与分子特征的关系。
xianweichengxiang维度 | 2D |
模态 | other |
任务类型 | other |
解剖结构 | 多器官 |
解剖区域 | 全身 |
类别数 | 25 |
数据量 | 1108 |
文件格式 | .json |
.
├──cellvit_seg
├──metadata
├──patches
├──patches_vis
├──pixel_size_vits
├──spatial_plots
├──st
├──thumbnails
├──tissue_seg
├──transcripts
├──wsis
├──xenium_seg
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
- |
中位值 | - |
- |
最大值 | - |
- |
@article{jaume2024hest,
title={Hest-1k: A dataset for spatial transcriptomics and histology image analysis},
author={Jaume, Guillaume and Doucet, Paul and Song, Andrew H and Lu, Ming Y and Almagro-P{\'e}rez, Cristina and Wagner, Sophia J and Vaidya, Anurag J and Chen, Richard J and Williamson, Drew FK and Kim, Ahrong and others},
journal={arXiv preprint arXiv:2406.16192},
year={2024}
}