MitoEM Challenge: Large-scale 3D Mitochondria Instance Segmentation(MitoEM2021 )数据集是一个组织病理学模态中分割线粒体的数据集。是Grand Challenge...
MIST数据集是一个与乳腺癌诊断相关的IHC染色转换数据集,该数据集包含对齐的H&E-IHC图像,涵盖了乳腺癌诊断中至关重要的四种生物标志物:HER2、Ki67、ER和PR的染色结果。具体来说,MIST数据集为每种生物标志物的IHC...
MIDOG++ 数据集是一个用于图像分类的病理学数据集,是MIDOG 2021和2022挑战赛数据集的扩展版本。该数据集包含来自503个组织标本的感兴趣区域图像,涵盖7种不同肿瘤类型,总计11,937张有丝分裂图像和14,351张非有丝分裂...
MHIST数据集是一个基于H&E染色(苏木精-伊红染色)的结肠息肉分类数据集,包含3,152张图像。每张图像均经过七位病理学家的专业标注。该数据集分为两部分:训练集包含2,162张图像,验证集包含990张图像。数据集涵盖两种结肠息肉类型:增...
MedQA 是一种采用多项选择题格式的医学文本问答数据集,其问题选自美国、中国大陆及中国台湾医学委员会的考试。这些考试旨在考查医生的专业知识及临床决策能力。试题内容丰富多样,答题通常需要对相关医学概念有深刻的理解。该数据集一共包含 61,0...
MedPromptX-VQA源自一个统一的多模态数据集HAIM-MIMIC-MM。该数据集整合了来自MIMIC-IV和MIMIC-CXR-JPG数据库的信息,经过精心筛选仅包含至少接受过一次胸部X光检查的患者数据。HAIM-MIMIC-MM...
MedMCQA数据集是一个大规模医学多选题库,专为真实世界医学入学考试设计,汇总了来自印度全印医学科学研究所(AIIMS)和国家资格暨入学考试(NEET PG)的超过194,000道精选试题。这些题目不仅涵盖2,400多个医疗主题和21个医...
MedICaT是一个包含医学图像、图像说明文字、子图-子标题标注和内联引用的数据集。子图-子标题标注指复合图像中每个部分及其对应解释,而内联引用表示文本中提及图像的位置和内容。该数据集中的图像和说明文字提取自PubMed Central的开...
医学视觉问答(Medical Visual Question Answering,VQA)是医学多模态大语言模型(LLMs)中的关键任务,旨在回答与输入医学图像相关的临床问题。该技术有望提高医疗专业人员的工作效率,同时减轻公共卫生系统的负担...
MedDialog-CN是一个专为中文医疗对话研究设计的大规模数据集,它包含了超过1.1百万次的对话和400万条发言。这些原始对话来源于好大夫在线(http://haodf.com)。所有数据的版权归好大夫在线所有。这一数据集涵盖了从常见疾...
MedConceptsQA是一个专用于医学概念问答的开源基准测试集。该基准包含跨不同医学词汇体系(诊断、操作和药物)的多层次医学概念问题。问题按难度分为三个等级:简单、中等和困难。我们使用多种大语言模型对该基准进行了评估。本基准测试集为评估...
MedBench是一个大规模、高质量的中文医疗大模型评估数据集。基于权威医疗标准,MedBench设立了医学语言理解、医学语言生成、医学知识问答、复杂医学推理和医疗安全伦理5大维度,包含15项任务、20个数据集和30万道题目,为中文医疗大模...