ColonINST是一个专为结肠镜多模态分析设计的大规模指令调优数据集。该数据集包含303,001张结肠镜图像,汇集自19个公开可用的子数据集源。通过采用GPT-4V驱动的半自动化流程,我们生成了128,620条详细医学描述,增强了数据集在...
CoCaHis(结肠癌组织学数据集)是一个公开可用的数据集,包含82张冰冻切片的苏木精-伊红(H&E)染色图像。这些图像采集自19例肝转移性结肠癌患者。该数据集不仅包含原始染色图像,还包括经过染色标准化的两组图像。此外,数据集还提供了由七位...
医学考试题目是评估NLP模型的重要数据来源,但现有医学考试数据集存在一些局限性,主要体现为:数据来源不公平且不充分;选项信息不足,缺乏与选项相关的解释说明。CMExam是NIPS23会议上发布的中文医学考试数据集,源自中国国家医学资格考试。...
cMedQA v2.0是一个针对中文医疗问答任务设计的数据集,旨在支持和推动自动问答系统在医疗健康领域的研究。这个数据集通过更新和扩充,提供了大量医疗相关的问题和答案对,覆盖了多种疾病、症状、治疗方法等医疗健康领域的知识。cMedQA v2...
中文医学综合基准测试(Comprehensive Medical Benchmark in Chinese,CMB)由香港中文大学(深圳)研究团队于2023年推出。该数据集旨在为大型语言模型(Large Language Models,LL...
Chinese medical dialogue data 数据集由792,099个问答对组成,覆盖了男科、内科、妇产科、肿瘤科、儿科和外科等六个主要医疗专业。这一数据集的细致分类和丰富内容为研究人员提供了一个深度探索中文医疗对话处理技术的...
ChineseEEG 是一个包含高密度脑电图(electroencephalography,EEG)数据与同步采集的眼动追踪数据的医学数据集。该数据集记录了10名参与者在默读约13小时中文文本时的大脑活动。阅读材料选自两部著名小说的中文译本...
CheXpert和CheXpertPlus是由斯坦福大学发布的两个大规模多模态胸部X光影像与医学报告数据集,旨在推动医学影像分析和人工智能研究的发展。
朝阳医院(Chaoyang)数据集是一个用于分类的病理图像数据集,专注于结直肠癌的诊断。该数据集包含来自首都医科大学附属北京朝阳医院的结肠切片图像,采用20倍物镜扫描。涵盖多种病变类别,包括正常组织、锯齿状病变(serrated lesio...
巴氏细胞学涂片分析在医学诊断中具有关键作用,是检测和分级宫颈癌前病变及癌症阶段的重要环节。该过程不仅需要高超的专业技能,还涉及复杂的细胞学图像处理技术。其中,细胞核与重叠细胞的精确分割是细胞学图像处理的核心环节,对后续诊断分析至关重要。为推...
BRACS数据集专为乳腺癌亚型分类设计,包含大量H&E(苏木精-伊红)染色的病理图像。该数据集涵盖547张全切片图像(Whole Slide Images, WSIs)及从中提取的4,539个感兴趣区域(Regions of Interes...
Bone Marrow Cytomorphology MLL Helmholtz Fraunhofer 数据集是一个专注于骨髓细胞形态学的数据集。该数据集包含来自945名患者的骨髓涂片图像,采用May-Grünwald-Giemsa/Pap...