MedDialog-CN

MedDialog-CN是一个专为中文医疗对话研究设计的大规模数据集，它包含了超过1.1百万次的对话和400万条发言。这些原始对话来源于好大夫在线（http://haodf.com）。所有数据的版权归好大夫在线所有。这一数据集涵盖了从常见疾病咨询到专业医疗建议的广泛话题，旨在支持和推动医疗对话系统的开发，这些系统有望通过提供自动化的健康咨询和支持，来改善医疗服务的可达性和质量。 MedDialog-CN数据集的价值在于它为人工智能和机器学习领域的研究者提供了一个宝贵的资源，使他们能够开发和测试先进的自然语言处理算法。这些算法旨在理解和生成人类般的医疗对话，从而为患者提供准确、及时的医疗信息，有助于缓解医生的工作压力，并提高医疗系统的整体效率

xianweichengxiang

可视化图片

MedDialog-CN_0.png

MedDialog-CN_1.webp

MedDialog-CN_2.webp

数据集元信息

模态	other
任务类型	other
解剖结构	全身
解剖区域	全身
类别数	172
数据量	1.1M
文件格式	.txt

文件结构

.
|
├── 2010.txt
├── 2011.txt
├── ...
└── 2020.txt

图像尺寸统计

统计类型	间距 (mm)	尺寸
最小值	`-`	`-`
中位值	`-`	`-`
最大值	`-`	`-`

引用

@article{chen2020meddiag,
  title={MedDialog: a large-scale medical dialogue dataset},
  author={Chen, Shu and Ju, Zeqian and Dong, Xiangyu and Fang, Hongchao and Wang, Sicheng and Yang, Yue and Zeng, Jiaqi and Zhang, Ruisi and Zhang, Ruoyu and Zhou, Meng and Zhu, Penghui and Xie, Pengtao},
  journal={arXiv preprint arXiv:2004.03329}, 
  year={2020}
}

来源信息

官方网站：
访问官网

下载链接：

下载数据

公开下载，无需权限

相关论文：
查看论文

发布日期： 2020.7

统计信息

创建时间： 2025-09-10 10:21

更新时间： 2025-09-12 18:04