通过视频感知手术场景对于推进机器人手术、远程手术和AI辅助手术至关重要,特别是在眼科领域。然而,缺乏多样化和丰富标注的视频数据集阻碍了用于手术工作流分析的智能系统发展。现有数据集面临诸多挑战,如规模小、手术和阶段类别缺乏多样性,以及缺少时间定位标注。这些限制阻碍了在复杂多样真实手术场景中验证动作理解和模型泛化能力。
yanjing维度 | 2D |
模态 | microscopy |
任务类型 | classification |
解剖结构 | 眼部 |
解剖区域 | 眼部 |
类别数 | 66 |
数据量 | 2278 |
文件格式 | .mp4 |
OphNet
├── Annotation Files
│ ├── all
│ ├── task1_primary_surgery_recognition
│ ├── task2_phase_recognition
│ ├── task3_operation_recognition
│ ├── task4_phase_localization
│ ├── task5_phase_anticipation
├── Original Video Files
├── Processed Video Files
├── Trimmed Video Files
@article{hu2024ophnet,
title={OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding},
author={Hu, Ming and Xia, Peng and Wang, Lin and Yan, Siyuan and Tang, Feilong and Xu, Zhongxing and Luo, Yimin and Song, Kaimin and Leitner, Jurgen and Cheng, Xuelian and others},
journal={arXiv preprint arXiv:2406.07471},
year={2024}
}