发布信息

一种基于医患交互数据驱动的智能医生推荐方法

作者:admin      2022-07-30 16:59:28     776



医药医疗技术的改进;医疗器械制造及应用技术1.本发明涉及医学领域,具体涉及一种基于医患交互数据驱动的智能医生推荐方法。背景技术:2.现有文献中,对于我国在线医疗智能导诊的研究并不多见,一是由于我国医疗数据难以获取、给大多学者和业界人员研究带来一定困难;二是目前大多医院仍然没有进行数字化变革以及智慧医院建设推广较为缓慢,多数医院仍然主要以人工导诊为主,这导致智能导诊发展较为缓慢。3.随着我国人口的增加,医院中的就诊患者逐步增加,此时,海量的患者使得医院人工导诊服务成本增高,医院单一依靠人工服务难以满足患者日益增长的就诊需求。此外,随着自然语言处理模型以及机器学习模型的不断发展,基于于医患交互数据驱动的智能医生推荐方法逐渐成为一种可能。因此,本发明针对患者“知症不知医”,医院导诊压力大等行业痛点,提出了一种基于医患交互数据驱动的智能医生推荐方法。技术实现要素:4.本发明的目的是提供一种基于医患交互数据驱动的智能医生推荐方法,需要解决的技术问题是:如何为线下和线上患者就诊时,根据患者的主诉信息为患者推荐合适的医生。5.为了实现上述目的,本发明提供如下技术方案:一种基于医患交互数据驱动的智能医生推荐方法,通过利用自然语言处理方法word2vec,tf-idf 以及余弦相似性算法,基于好大夫在线医疗平台中的患者主诉数据构建了一种基于相似患者和相似医生的混合推荐医生算法,该算法在一定参数条件下,推荐效果具有一定优势,实现了对医生进行智能推荐的目的。具体步骤如下:6.步骤一、利用八爪鱼软件在好大夫在线医疗网站收集已完成就诊目标的患者的主诉数据和科室信息。7.步骤二、对数据清洗及处理:原始数据中有部分如空格、标点符号等噪音,这会影响数据的质量,利用python软件对数据进行空格和标点符号的预处理。对处理好的数据进一步进行jieba分词和去除停用词。8.具体为:在数据清洗阶段,利用python软件对主诉数据中的空字符和标点进行去除,对处理好的患者主诉数据利用python软件jieba算法进行分词,将一句话切分为多个词,并利用哈工大停用词表对分词后的停用词进行过滤。9.步骤三、词向量模型预训练与主诉文本向量化表达:10.利用python中的gensim包进行词向量模型的预训练,挑选出词向量模型,进一步对处理好的主诉数据进行向量化表达。11.具体为:训练词向量模型:利用python软件中的gensim包中的skip-gram 模型,结合多种医学书籍,训练多个不同维度的词向量模型,挑选出效果最好的一个词向量模型;主诉文本向量化表达:利用该词向量模型对预处理后的患者主诉文本进行向量化表达,将患者主诉文本转化为高维的向量。12.步骤四、相似度计算与排序:13.对患者主诉数据进行向量化表达之后,利用余弦相似性对患者的症状与医生已经诊疗过得患者的主诉文本进行余弦相似性计算,获取排名前10的医生。14.具体为:利用tf-idf算法对同一医生诊疗的患者主诉文本进行重要关键词提取,用以表征该医生的特征,通过对重要关键词和患者主诉文本向量化表达之后,进而分别计算医生和患者的余弦相似性,在给定相似性阈值下,找出符合相似性条件的医生,进行排序,获取最终推荐的前10名医生。基于患者相似性大小,获得被推荐医生排名列表,进一步根据医生相似性大小,对基于患者相似性构建的医生列表进行进一步排序,保证在相似患者的基础上,获得最终基于相似患者和相似医生混合的推荐列表,取排名前10的医生作为最终的推荐医生集。15.余弦相似度计算公式如下:[0016][0017]其中,u和v分别表示患者u和v,n(u)和n(v)分别表示患者u和v的词向量集合。[0018]步骤五,推荐医生:获得医生推荐列表之后,进一步设置推荐效果指标,该指标由推荐准确率和推荐服务质量线性加权构成,其中推荐服务质量由文本服务质量和语音服务质量构成,被推荐的医生利用文本和语音媒介对患者进行反馈的信息越多,则该患者服务质量越好。利用该指标对模型的推荐性能进行评价,不仅可以实现为患者推荐一个与其疾病症状相类似的医生,而且还可以为患者推荐一个服务质量好的医生,实现了既推的准,又推的好的目标。[0019]在推荐准确率上,若被推荐医生与目标患者相似的被咨询文本数占被推荐医生咨询文本数的80%及以上(具体参数可更改),则视为推荐成功。[0020]文本服务质量和语音服务质量根据医生的文本信息量长度和语音信息量长度进行判断,计算本文数据集中的63位医生的平均文本长度和语音长度,之后将推荐的10位医生的文本长度和语音长度与总体平均长度进行比较,若大于平均长度,表明推荐的医生文本服务质量良好,计为1;若小于平均长度,表明推荐的医生文本服务质量一般,计为0,由此可得出推荐的10位医生中文本和语音的服务质量比例,将该值作为文本和语音服务质量指标。[0021][0022]步骤六、模型效果评估:[0023]在模型效果评估时,为了便于表示,设置相似度阈值计为β,被推荐成功比例计为γ,其中λ设置为0.8,利用上述指标对基于相似患者的推荐方法、基于相似医生的推荐方法和基于相似患者和相似医生的混合推荐方法的推荐效果进行对比分析,测试结果表明,在一定参数条件下,本发明模型的性能较其余两种方法具有一定优势。[0024]在上述技术方案中,本发明提供的技术效果和优点:[0025]1、本发明的方法在自然语言处理工具基础上,考虑现实需求和患者就诊主诉数据特征,构建了一种医患交互数据驱动的智能医生推荐方法,该方法包含三个推荐模型,基于相似患者的医生推荐方法,基于相似医生的推荐方法,基于相似患者和相似医生的混合推荐方法,在一定参数设置下,基于相似患者和相似医生的混合推荐方法推荐效果最好,能够实现为患者智能推荐医生的目标。[0026]2、本发明提出的基于医患交互数据驱动的智能医生推荐方法,不仅可以用于线上医生导诊,对线下医生导诊均具有一定实用价值,可以同时为线下和线上推荐医生提供现实经验,对建设智能医生推荐系统,破解医患信息不对称,患者“知病不知医”的现实困境,提高医患资源匹配效率具有一定作用,该方法具有泛化能力强,操作简单,实用性强等优势。附图说明[0027]为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。[0028]图1为本发明的流程图;[0029]图2为本发明的不同词语的词向量表达(40维度)图。具体实施方式[0030]为了使本领域的技术人员更好地理解本发明的技术方案,下面将结合附图对本发明作进一步的详细介绍。[0031]本发明提供了如图1所示的一种基于医患交互数据驱动的智能医生推荐方法:[0032]流程1[0033]从好大夫在线网站获取大量患者问诊数据信息。[0034]表1:医生及被咨询文本[0035][0036][0037][0038]表2:患者咨询文本[0039][0040][0041]流程2[0042]对患者主诉数据进行清洗与预处理。将患者主诉数据进行jieba分词和去除停用词之后,将患者的每一句话转换为多个词语。[0043]流程3[0044]训练词向量模型并将患者主诉文本进行向量化表达。利用python软件中的gensim包训练多个不同维度的词向量模型,从中选取向量化表达效果较好的一个词向量模型,本发明选取了256维度的skip词向量模型,如图2所示。[0045]流程4[0046]相似度计算与排序。以120号患者为例,为120号患者推荐医生。表3 为120号患者与其他患者的余弦相似度。[0047]表3:基于相似患者的120号目标患者的相似患者及医生[0048][0049][0050]表4:基于相似医生的120号目标患者推荐结果[0051][0052][0053]表5:基于相似患者和相似医生的120号目标患者推荐结果[0054][0055]流程5[0056]本发明方法的推荐医生结果。[0057]表6:120号目标患者的推荐结果[0058][0059][0060]如表6所示,对120号目标患者推荐的医生中,医生们大都诊断过与120 号目标患者类似的病情,如36号医生苏开明医生诊疗过类似“呼吸不通畅”,“鼻子堵塞3/4”;42号王旻医生同样诊疗过“鼻子经常不通气”,“经常鼻塞”等患者,这些患者与120号目标患者的病情极为类似,目标患者120号患者的主诉文本为“今年9月份给孩子鼻内镜检查,发现堵塞4分之3,孩子晚上睡觉张嘴呼吸,偶尔的打呼噜!”,在该患者的主诉文本中,鼻子堵塞4分之3,张嘴呼吸,打呼噜等都是该患者的主要症状。因此,推荐结果较为准确。[0061]流程6[0062]利用线性加权方法对推荐准确率,推荐文本服务质量和推荐语音服务质量进行线性加权,形成最终推荐效果指标。其中相似度阈值计为β,被推荐成功比例计为γ,推荐准确率权重为λ。[0063]表7:不同参数下三种推荐模型的推荐效果[0064][0065][0066]从表7可以看出,在推荐准确率、文本服务质量、语音服务质量权重为 0.8、0.1和0.1的情形下,三种推荐方法均有一定优良性能。总体而言,基于相似患者的推荐模型和基于相似患者和相似医生混合推荐方法在推荐效果方面相差不大。在特定参数条件下,如β=0.6,γ=0.5,γ=0.6,γ=0.7,γ=0.8;β=0.7,γ=0.5;β=0.8,γ=0.5时,基于相似患者和相似医生的混合推荐算法较基于相似患者的推荐方法具有一定优势。[0067]以上只通过说明的方式描述了本发明的某些示范性实施例,毋庸置疑,对于本领域的普通技术人员,在不偏离本发明的精神和范围的情况下,可以用各种不同的方式对所描述的实施例进行修正。因此,上述附图和描述在本质上是说明性的,不应理解为对本发明权利要求保护范围的限制。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部