MedDialog-CN是一个专为中文医疗对话研究设计的大规模数据集,它包含了超过1.1百万次的对话和400万条发言。这些原始对话来源于好大夫在线(http://haodf.com)。所有数据的版权归好大夫在线所有。这一数据集涵盖了从常见疾病咨询到专业医疗建议的广泛话题,旨在支持和推动医疗对话系统的开发,这些系统有望通过提供自动化的健康咨询和支持,来改善医疗服务的可达性和质量。 MedDialog-CN数据集的价值在于它为人工智能和机器学习领域的研究者提供了一个宝贵的资源,使他们能够开发和测试先进的自然语言处理算法。这些算法旨在理解和生成人类般的医疗对话,从而为患者提供准确、及时的医疗信息,有助于缓解医生的工作压力,并提高医疗系统的整体效率
xianweichengxiang模态 | other |
任务类型 | other |
解剖结构 | 全身 |
解剖区域 | 全身 |
类别数 | 172 |
数据量 | 1.1M |
文件格式 | .txt |
.
|
├── 2010.txt
├── 2011.txt
├── ...
└── 2020.txt
统计类型 | 间距 (mm) | 尺寸 |
---|---|---|
最小值 | - |
- |
中位值 | - |
- |
最大值 | - |
- |
@article{chen2020meddiag,
title={MedDialog: a large-scale medical dialogue dataset},
author={Chen, Shu and Ju, Zeqian and Dong, Xiangyu and Fang, Hongchao and Wang, Sicheng and Yang, Yue and Zeng, Jiaqi and Zhang, Ruisi and Zhang, Ruoyu and Zhou, Meng and Zhu, Penghui and Xie, Pengtao},
journal={arXiv preprint arXiv:2004.03329},
year={2020}
}