ColonINST是一个专为结肠镜多模态分析设计的大规模指令调优数据集。该数据集包含303,001张结肠镜图像,汇集自19个公开可用的子数据集源。通过采用GPT-4V驱动的半自动化流程,我们生成了128,620条详细医学描述,增强了数据集在AI模型训练中的实用性。最终我们重构了450,724组视觉对话,用于指导AI模型完成四项下游任务:图像分类(CLS)、指代表达生成(REG)、指代表达理解(REC)和描述生成(CAP),这些任务对多模态医疗AI应用至关重要。
xianweichengxiang维度 | 2D |
模态 | other |
任务类型 | other |
解剖结构 | 结肠 |
解剖区域 | 腹部 |
类别数 | 2 |
数据量 | 450,724 |
文件格式 | .json, .jpg, .png |
├──cache
├──ColonINST
├──Json-file
├──train
├──ColonINST-train.json
├──val
├──ColonINST-val-cls.json
|...
├──test
├──ColonINST-test-cls.json
|...
├──Positive-images
├──CPC-Paired
├──Train
├──polyp
|──image_name.jpg
|...
├──Val
├──polyp
|──image_name.jpg
|...
├──Test
├──polyp
|──image_name.jpg
|...
|...
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
- |
中位值 | - |
- |
最大值 | - |
- |
@article{ji2024frontiers
author = {Ji, Ge-Peng and Liu, Jingyi and Xu, Peng and Barnes, Nick and Khan, Fahad Shahbaz and Khan, Salman and Fan, Deng-Ping},
title = {Frontiers in Intelligent Colonoscopy},
journal = {arXiv preprint arXiv:2410.17241},
year = {2024}
}