OphNet

通过视频感知手术场景对于推进机器人手术、远程手术和AI辅助手术至关重要,特别是在眼科领域。然而,缺乏多样化和丰富标注的视频数据集阻碍了用于手术工作流分析的智能系统发展。现有数据集面临诸多挑战,如规模小、手术和阶段类别缺乏多样性,以及缺少时间定位标注。这些限制阻碍了在复杂多样真实手术场景中验证动作理解和模型泛化能力。

yanjing
可视化图片
OphNet_1.webp
OphNet_1.webp
OphNet_3.webp
OphNet_3.webp
OphNet_0.webp
OphNet_0.webp
OphNet_2.webp
OphNet_2.webp
数据集元信息
维度2D
模态microscopy
任务类型classification
解剖结构眼部
解剖区域眼部
类别数66
数据量2278
文件格式.mp4
文件结构
OphNet
├── Annotation Files
│   ├── all
│   ├── task1_primary_surgery_recognition
│   ├── task2_phase_recognition
│   ├── task3_operation_recognition
│   ├── task4_phase_localization
│   ├── task5_phase_anticipation
├── Original Video Files
├── Processed Video Files
├── Trimmed Video Files
引用
@article{hu2024ophnet,
  title={OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding},
  author={Hu, Ming and Xia, Peng and Wang, Lin and Yan, Siyuan and Tang, Feilong and Xu, Zhongxing and Luo, Yimin and Song, Kaimin and Leitner, Jurgen and Cheng, Xuelian and others},
  journal={arXiv preprint arXiv:2406.07471},
  year={2024}
}
来源信息

官方网站:
访问官网

下载链接:

登录后下载
需要登录并获得知识星球权限

相关论文:
查看论文

发布日期: 2024-07

统计信息

创建时间: 2025-09-15 15:16

更新时间: 2025-09-15 15:25