计算;推算;计数设备的制造及其应用技术1.本发明属于人工智能技术领域,具体涉及基于排版和图文关联融合分析的文章质量评价方法及装置。背景技术:2.随着现代医学的飞速发展,对患者的治疗越来越倾向于以人为本,不再是问诊开药这一单一路径,对患者的心理健康和诊后康复越来越重视。其中,健康宣教就是其中一种重要的手段。有效的健康宣教不仅能够告知患者对疾病的正确认识,也能让患者学会正确的康复和预防手段。同时,良好的健康宣教也能帮助建立良好的医患关系,是病人积极配合治疗的基础。但是,随着宣教文章数量的爆发性增长,其中也参杂了很多低质量的文章。例如,排版编排混乱的剽窃文,或图文不匹配的广告推荐文等。低质量的文章往往会让患者对医院的第一印象变差,从而滋生不信任的心理,影响后续的诊断治疗。因此,为了提高宣教文章的整体质量,但又不依赖大量人工的逐一排查,亟需一种能对宣教文章进行自动质量评价的方法。3.相关专利文献,“一种文章评分方法及系统”,201610427512.5,该专利主要描述了一种文章评分方法及系统,该方法基于预先定义的特征模版,提取对应的文章特征,包括:词汇特征和/文采特征、立意特征、篇章结构特征、词汇级语义特征等。再将提取到的特征输入到支持向量回归模型得到具体地评分。但该方法仅提出一种针对纯文字编排的篇章的分析方法,并不适用于图文搭配的宣教文章评分。技术实现要素:4.为解决现有技术的不足,实现剔除排版混乱和图文不匹配的宣教文章的目的,本发明采用如下的技术方案:5.基于排版和图文关联融合分析的文章质量评价方法,包括如下步骤:6.步骤s1:构建图文关联性分析模型,对输入的图片和文字进行关联性分析;7.步骤s2:生成文章布局特征,对文章的布局进行结构化解析,生成结构化的文本数据,基于文本数据,通过特征模版,生成文章区块特征;当相邻文章区块分别为文字和图片时,基于图文关联性分析模型,将图片和文字的关联性作为相应文章区块的特征;8.步骤s3:构建文章质量评价模型,根据文章各区块特征及区块序列,通过时序循环神经网络,得到基于时序的最终语义向量,通过最终语义向量,对文章质量进行评价。9.进一步地,所述步骤s1包括如下步骤:10.步骤s1.1:规整训练数据,从现有文章中提取图片数据,并为图片添加相应的描述性话术,作为正样本数据;11.步骤s1.2:图文匹配模型训练,获取对应的图文数据进行融合,基于融合向量得到是否匹配的预测结果,通过比较预测结果和真实的匹配结果,训练图文匹配模型;12.步骤s1.3:存储最佳的图文匹配模型。13.进一步地,所述步骤s1.2中,训练的损失函数为交叉熵损失函数,用于衡量模型输出的概率分布与实际标签之间的差异,具体地,对于基于图文数据的融合向量,其标签为y,即匹配程度,模型输出的概率分布向量为p,交叉熵损失函数的计算方式如下:[0014][0015]其中,n表示类别的数量,yi表示实际标签中第i类匹配程度的概率,pi表示模型输出的概率分布中第i类匹配程度的概率,该损失函数是可导的,故可以直接用梯度下降法不断优化和迭代,得到一个最佳的模型mbest并保存。[0016]进一步地,所述步骤s1的图文关联性分析模块包括特征向量提取模块和特征向量分析模块,特征向量提取模块用于提取原始数据的特征向量,包括图片特征提取模型和语义向量提取模型,特征向量分析模块包括图文匹配模型,该模型的输入为特征向量提取模块的输出;[0017]所述步骤s2中的特征模版包括如下维度:[0018]维度1:针对当前区块的内容类型,构建离散特征,当前区块内容类型包括文字、图片;[0019]维度11:针对当前区块的内容与前置区块的关联度,构建离散特征;[0020]若当前区块没有前置区块,则维度11的值为0;[0021]若当前区块的内容为文字,且前置区块的内容为文字,则通过语义向量提取模型,生成两段文字的特征向量,并计算两者的余弦相似度,作为维度11的值;[0022]若当前区块的内容为图片,且前置区块的内容为图片,则通过图片特征提取模型,生成两幅图片的特征向量,并计算两者的余弦相似度,作为维度11的值;[0023]若当前区块的内容为文字,且前置区块的内容为图片,或当前区块的内容为图片,且前置区块的内容为文字,则通过图文匹配模型,计算两者的关联性分数作为维度11的值。[0024]进一步地,所述步骤s1的图文关联性分析模块包括特征向量提取模块和特征向量分析模块,特征向量提取模块用于提取原始数据的特征向量,包括图片特征提取模型和语义向量提取模型,特征向量分析模块包括图文匹配模型,该模型的输入为特征向量提取模块的输出;[0025]所述步骤s2中的特征模版包括如下维度:[0026]维度1:针对当前区块的内容类型,构建离散特征,当前区块内容类型包括文字、图片;[0027]维度12:针对当前区块的内容与后置区块的关联度,构建离散特征;[0028]若当前区块没有后置区块,则维度12的值为0;[0029]若当前区块的内容为文字,且后置区块的内容为文字,则通过语义向量提取模型,生成两段文字的特征向量,并计算两者的余弦相似度,作为维度12的值;[0030]若当前区块的内容为图片,且后置区块的内容为图片,则通过图片特征提取模型,生成两幅图片的特征向量,并计算两者的余弦相似度,作为维度12的值;[0031]若当前区块的内容为文字,且后置区块的内容为图片,或当前区块的内容为图片,且后置区块的内容为文字,则通过图文匹配模型,计算两者的关联性分数作为维度12的值。[0032]进一步地,所述步骤s2中的维度11,若当前区块的内容为文字,并包含加粗字体的文本,则使用加粗字体的文本生成特征向量。一段文本中的加粗字体,则可以理解为特别能够代表作者对这段文本想要表达的含义,因此仅用加粗的几句文本去做语义的特征匹配,会比全段落的文本做语义的特征匹配效果更好。[0033]进一步地,所述步骤s2中的特征模版的维度包括:[0034]维度2至4:针对当前区块的位置边界,构建离散特征;[0035]其中,维度2的值为当前区块的左边界空隙占区块的宽度百分比;[0036]其中,维度3的值为当前区块的右边界空隙占区块的宽度百分比;[0037]两边留白的空隙过少,会使阅览者觉得文章内容太多,留白的空隙过多,又会使阅览者觉得文章内容太少,因此需要使区块具备合适的留白;[0038]其中,维度4的值为当前区块内的行间距占区块的高度百分比;[0039]行间距需要与整个区块的高度相匹配,高度越高允许的行间距可以越大,但区块内的行间距需要合适的留白;[0040]维度5:针对当前区块与前置区块的纵向间隔,构建离散特征;维度5值为当前区块和上一个区块间的留白,占当前区块的高度百分比;与上一个区块的间隔,影响整体布局的美观性,若间隔过小,会显得区块过于拥挤,若间隔过大,则会显得区块分布过于空旷;[0041]维度6至7:针对当前区块的文字格式,构建离散特征;若当前区块的内容不含有文字,则6至7维度值为0;若当前区块的内容含有文字,则维度6的值为当前区块字体大小与预设最大字号的比值,若超过预设最大字号,则默认该值为1;维度7的值为当前区块行高与预设最大的行间隔的比值,若超过该行间隔,则默认该值为1;[0042]维度8至10:针对当前区块的文字颜色,构建离散特征;[0043]若当前区块的内容不含有文字,则8-10维度值为0;[0044]若当前区块的内容含有文字,则维度8的值为当前字体颜色值与预设颜色最大值的比值。[0045]进一步地,所述步骤s3中文章质量评价模型的训练过程,包括如下步骤:[0046]步骤s3.1:规整训练数据;获取现有文章并基于文章质量进行分类标注;[0047]步骤s3.2:模型训练;基于文章各区块序列及文章区块特征的特征向量,通过生成器得到每个位置的语义向量,将语义向量按位置顺序输入编码器,得到最后一个位置的语义向量,并基于最后一个位置的语义向量,预测文章质量等级的类别,基于预测类别与真实的所述分类标注,训练文章质量评价模型;[0048]步骤s3.3:存储最佳的质量评价模型,并用于后续对待评价文本的质量进行预测。[0049]进一步地,所述步骤s3.2中,获取文章序列向量,通过特征生成器,得到语义向量,在每一个位置,隐状态向量ht的计算公式为:[0050]ht=f(ht-1,xt)[0051]其中,xt表示当前位置的词向量,ht-1表示截止到上一个位置的语义向量,f表示一种非线性的激活方程,可以是双曲正切函数tanh,或logistic激活函数sigmoid,或线性整流函数relu;[0052]将所有的位置向量按位置顺序输入到编码器中,得到最后一个位置的隐状态语义向量,通常认为该向量包含了整个序列的信息,记为c,其维度大小为(1,256),其中1表示该批次的大小为1;[0053]再将上一步抽取出的语义向量,输入到全连接神经网络中,再接一个softmax归一化函数,计算每一个文章质量等级的类别概率,具体计算公式如下:[0054][0055]其中,[0056]zk=f(wkc+bk)[0057]其中,f表示一种非线性的激活方程,可以是双曲正切函数tanh,或logistic激活函数sigmoid,或线性整流函数relu;[0058]其中,wk、bk表示需要训练的神经网络参数,对应的交叉熵损失函数为:[0059][0060]该损失函数是可导的,故可以直接用梯度下降法不断优化和迭代,得到一个最佳的模型m’best。[0061]基于排版和图文关联融合分析的文章质量评价装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现所述的基于排版和图文关联融合分析的文章质量评价方法。[0062]本发明的优势和有益效果在于:[0063]本发明的基于排版和图文关联融合分析的文章质量评价方法及装置,[0064]基于特征模板对文章进行区块划分,基于结构化的文本数据获取文章区块的特征,通过图文关联性分析,将相邻区块的的图文关联性融入区块特征,并基于各区块特征及区块序列,通过时序循环神经网络进行文章质量的评价预测,从而提高的图文匹配度,进而提升了包含图文的文章质量评价的准确度,以便对优质文章进行筛选,剔除排版混乱和图文不匹配的文章。附图说明[0065]图1是本发明实施例中基于排版和图文关联融合分析的文章质量评价方法流程图。[0066]图2是本发明实施例中基于排版和图文关联融合分析的文章质量评价装置的结构示意图。具体实施方式[0067]以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。[0068]如图1所示,基于排版和图文关联融合分析的文章质量评价方法,包括如下步骤:[0069]步骤s1:构建图文关联性分析模型,对输入的图片和文字进行关联性分析,得到关联性分数。[0070]本发明实施例中,搭建图文关联性分析模块,该模块输入为一张图片和一段文字,输出值域为[0,1]的关联性分数,分数越高,代表两者的相似度越高。[0071]图文关联性分析模块包括特征向量提取模块和特征向量分析模块,特征向量提取模块用于提取原始数据的特征向量,包括一个图片特征提取模型和一个语义向量提取模型,其中,图片特征提取模型为faster-rcnn,这是一种在图像识别领域经典的深度神经网络架构;语义向量提取模型为bert,这是一种在自然语言识别领域经典的预训练语言表征模型;特征向量分析模块主要包括一个图文匹配模型,该模型的输入为特征向量提取模块的输出,输出为图片和文字的关联性分数,其中,图文匹配模型的主体架构为visualbert,这是一种可以对一系列不同的视觉-语言任务进行建模的开源框架,图文匹配模型的训练方法包括如下步骤:[0072]步骤s1.1:规整训练数据,从现有文章中提取图片数据,并为图片添加相应的描述性话术,作为正样本数据。[0073]本发明实施例中,从往期的宣教文章中,提取出高质量的图片数据,并由专业的护士团队,为这一批图片数据的每一张图都写一段描述性的话术,作为正样本数据,并存储。[0074]具体地一种,存储示例如下:[0075][{“img_path”:...,//实际提取的图片数据[0076]“text”:“要多吃绿色蔬菜,以补充足够的纤维素”//图片对应的描述性话术[0077]},[0078]{“img_path”:...,[0079]“text”:“橙汁和木瓜能很好的调整消化机能”},[0080]...][0081]步骤s1.2:图文匹配模型训练,获取对应的图文数据进行融合,基于融合向量得到是否匹配的结果。[0082]本发明实施例中,利用特征向量分析模块分别提取对应的图文数据,输入至visualbert架构中,输出得到融合向量c,输入到全连接神经网络中,再接一个softmax计算每一个类别的概率pi。在该训练任务中总共有2个类别,即匹配和不匹配。[0083]训练损失函数为交叉熵损失函数,用于衡量模型输出的概率分布与实际标签之间的差异,具体地,对于一个样本(基于图文数据的融合向量),假设它的标签为y(匹配或不匹配),模型输出的概率分布向量为p,交叉熵损失函数的计算方式如下:[0084][0085]其中,n表示类别的数量,在该示例中等于2,yi表示实际标签中第i类的概率,pi表示模型输出的概率分布中第i类的概率。该损失函数是可导的,故可以直接用梯度下降法不断优化和迭代,得到一个最佳的模型mbest并保存。[0086]步骤s1.3:存储最佳的图文匹配模型,并用于后续预测。[0087]步骤s2:生成文章布局特征,对文章的布局进行结构化解析,生成结构化的文本数据,基于文本数据,通过特征模版,生成文章区块特征;当相邻文章区块分别为文字和图片时,基于图文关联性分析模型,计算图片和文字的关联性分数作为相应文章区块的特征;[0088]本发明实施例中,搭建文章布局特征生成模块,该模块主要负责对文章的布局进行特征生成,输出固定维度的特征向量。主要包括2个部分,第一个部分是文章内容结构解析模块,第二个部分是区块特征生成模块。[0089]具体地,文章内容结构解析模块主要利用python脚本对文章的html文件进行结构化解析,从而生成结构化的文本数据,用于后续文章质量评价模型的训练,本实施例中的结构化本质上为一种归一化操作,将复杂的页面端信息转化成统一的向量表征。其中,python脚本主要运用的解析模块为开源的beautifulsoup模块。[0090]其中的一种解析好的文本数据结构可以存储为:[0091][{“content”:{“text”:“这意味着药物效应和毒副作用会因此增加”,//文本内容[0092]“strong_text”:“药物效应和毒副作用”ꢀꢀꢀꢀꢀꢀꢀ//主要文本内容[0093]“img_path”:“./1.img.”},ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//对应图片路径[0094]“location”:{“padding_right”:5px,ꢀꢀꢀꢀꢀꢀꢀꢀ//位置信息:离右边界的像素距离[0095]“padding_left”:5px,ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//位置信息:离左边界的像素距离[0096]“top”:100px},ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//位置信息:离顶部的像素距离[0097]“size”:{“width”:30px,ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//大小:宽(单位:像素)[0098]“height”:20px},ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//大小:高(单位:像素)[0099]“style”:{“color”:[74,74,74],ꢀꢀꢀꢀꢀꢀꢀꢀ//风格:颜色(rgb)[0100]“font_size”:12,ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//风格:字体大小[0101]“line_height”:5}}ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//风格:行间距[0102]“label”:{“order”:1},...]ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//标签:序号[0103]具体地,区块特征生成模块主要利用预先定义的特征模版对每一个区块进行特征向量的生成。[0104]其中的一种特征模版示例如下:[0105]现用cur_block表示当前需要表征的区块;prev_block代表上一个需要表征的区块;特征的长度为12,其中每一个特征维度代表的意义如下:[0106]维度1:针对该区块的内容类型,构建离散特征;[0107]若该区块的内容仅含有文字,则该维度值为0;[0108]若该区块的内容仅含有图片,则该维度值为1;[0109]维度2至4:针对该区块的位置边界,构建离散特征;[0110]其中,维度2值的计算公式为,cur_block_padding_left/cur_block_width,表示当前区块的左边界空隙占区块的宽度百分比;[0111]其中,维度3值的计算公式为,cur_block_padding_right/cur_block_width,表示当前区块的右边界空隙占区块的宽度百分比;[0112]两边留白的空隙过少,会使阅览者觉得文章内容太多,留白的空隙过多,又会使阅览者觉得文章内容太少,因此需要使区块具备合适的留白。[0113]其中,维度4值的计算公式为,cur_block_line_height/cur_block_height,表示当前区块内的行间距占区块的高度百分比;[0114]行间距需要与整个区块的高度相匹配,高度越高允许的行间距可以越大,但区块内的行间距需要合适的留白。[0115]维度5:针对该区块与前置区块的纵向间隔,构建离散特征;[0116]其中,维度5值的计算公式为,cur_block_top-prev_block_top/cur_block_height,表示当前区块和上一个区块间的留白,占当前区块的高度百分比;与上一个区块的间隔,影响整体布局的美观性,若间隔过小,会显得区块过于拥挤,若间隔过大,则会显得区块分布过于空旷。[0117]维度6至7:针对该区块的文字格式,构建离散特征;[0118]若该区块的内容不含有文字,则6至7维度值为0;[0119]若该区块的内容含有文字,则维度6的值为当前区块字体cur_block_font_size/36,其中36为定义的最大的字号,若超过该字号,则默认该值为1;维度7的值为当前区块行高cur_block_line_height/10,其中10为定义的最大的行间隔,若超过该行间隔,则默认该值为1。[0120]维度8至10:针对该区块的文字颜色,构建离散特征;[0121]若该区块的内容不含有文字,则8-10维度值为0;[0122]若该区块的内容含有文字,则维度8的值为cur_block_color[0]/255;维度9的值为cur_block_color[1]/255;维度10的值为cur_block_color[2]/255,cur_block_color数组表示当前字体的颜色值,与255的比值表示一种对当前颜色值的归一化操作。[0123]维度11:针对该区块的内容与前置区块的关联度,构建离散特征;[0124]若该区块没有前置区块,则11维度值为0;[0125]若该区块的内容为文字,且前置区块的内容为文字,[0126]则利用上一步骤图文关联性分析模块中的语义向量提取模型,生成两段文字的特征向量,计算他们的余弦相似度作为维度11的值;其中的一种优选方案是,若区块加粗字体的文本cur_block_strong_text字段不为空,则使用该字段的文字生成特征向量。[0127]例如:作者对一段文本中某几句进行加粗,则可以理解为加粗的文本特别能够代表作者这段文字想要表达的含义,因此仅用加粗的几句文本去做语义的特征匹配,会比全段落的文本做语义的特征匹配效果更好。如果这段话文本没有加粗的字体,则只能将整段文本都去做语义的特征匹配。[0128]若该区块的内容为文字,且前置区块的内容为图片,或该区块的内容为图片,且前置区块的内容为文字,则利用上一步骤的图文关联性分析模块,计算两者的关联性分数作为维度11的值;其中的一种优选方案是,若区块加粗字体的文本cur_block_strong_text字段不为空,则使用该字段的文文字与图片进行图文关联性分析。[0129]若该区块的内容为图片,且前置区块的内容为图片,则利用上一步骤图文关联性分析模块中的图片特征提取模型,生成2段图片的特征向量,计算他们的余弦相似度作为维度11的值。[0130]维度12:针对该区块的内容与后置区块的关联度,构建离散特征;[0131]若该区块没有后置区块,则维度12的值为0;[0132]其他情况的值生成方法与维度11一致,仅将前置区块替换为后置区块即可。[0133]利用上述特征模版,针对每一个区块都可以生成一组维度为12的特征向量。[0134]步骤s3:构建文章质量评价模型,根据文章各区块特征及区块序列,通过时序循环神经网络,得到基于时序的最终语义向量,通过最终语义向量,对文章质量进行评价。[0135]本发明实施例中,搭建文章质量评价模块,该模块主要负责针对步骤s2生成的特征向量进行建模打分。[0136]具体地,区块与区块之前其实是存在上下文关联关系的,且每一篇文章的区块个数都不是一个固定数值,因此该模块主要包含一个针对时间序列建模的rnn(recurrent neural network)模型,即为质量评价模型。[0137]该模型的训练方法可包括如下步骤:[0138]步骤s3.1:规整训练数据,获取现有文章,并基于文章质量进行分类标注;[0139]本发明实施例中,从往期的宣教文章中,随机挑选出若干(大于100)篇,由专业的护士团队,为这批宣教文章进行标注分类,并存储。其中,分类的类别有2个,分别为好和不好,用1,0表示。[0140]具体地一种,存储示例如下,[0141][{“article_path”:...,ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//文章路径[0142]“label”:“0”ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//文章分类标签为质量不好[0143]},[0144]{“article_path”:...,ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//文章路径[0145]“label”:“1”},ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ//文章分类标签为质量好[0146]...][0147]步骤s3.2:质量评价模型训练,基于文章各区块序列及文章区块特征的特征向量,通过生成器得到每个位置的语义向量,将语义向量按位置顺序输入编码器,得到最后一个位置的语义向量,并基于最后一个位置的语义向量,预测文章质量等级的类别,基于预测类别与真实的所述分类标注,训练质量评价模型;[0148]本发明实施例中,利用上一步骤生成的序列向量,输入到特征生成器rnn(recurrent neural netword)模型中,得到语义向量,在每一个位置,隐状态向量ht的计算公式为:[0149]ht=f(ht-1,xt)[0150]其中,xt表示当前位置的词向量,ht-1表示截止到上一个位置的语义向量,f表示一种非线性的激活方程,可以是双曲正切函数tanh,或logistic激活函数sigmoid,或线性整流函数relu。[0151]将所有的位置向量都按位置顺序输入到编码器中之后,得到最后一个位置的隐状态语义向量,通常认为该向量包含了整个序列的信息,记为c,其维度大小为(1,256),其中1表示该批次的大小为1。[0152]再将上一步抽取出的语义向量,输入到全连接神经网络中,再接一个softmax归一化函数,计算每一个类别的概率,具体计算公式如下:[0153][0154]其中,[0155]zk=f(wkc+bk)[0156]其中,f表示一种非线性的激活方程,可以是双曲正切函数tanh,或logistic激活函数sigmoid,或线性整流函数relu;[0157]其中,wk、bk表示需要训练的神经网络参数,对应的交叉熵损失函数为:[0158][0159]该损失函数是可导的,故可以直接用梯度下降法不断优化和迭代,得到一个最佳的模型m’best。[0160]步骤s3.3:存储最佳的质量评价模型,并用于后续对待评价文本的质量进行预测。[0161]与前述基于排版和图文关联融合分析的文章质量评价方法的实施例相对应,本发明还提供了基于排版和图文关联融合分析的文章质量评价装置的实施例。[0162]参见图2,本发明实施例提供的基于排版和图文关联融合分析的文章质量评价装置,包括存储器和一个或多个处理器,存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现上述实施例中的基于排版和图文关联融合分析的文章质量评价方法。[0163]本发明基于排版和图文关联融合分析的文章质量评价装置的实施例可以应用在任意具备数据处理能力的设备上,该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图2所示,为本发明基于排版和图文关联融合分析的文章质量评价装置所在任意具备数据处理能力的设备的一种硬件结构图,除了图2所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能,还可以包括其他硬件,对此不再赘述。[0164]上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。[0165]对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。[0166]本发明实施例还提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现上述实施例中的基于排版和图文关联融合分析的文章质量评价方法。[0167]所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元,例如硬盘或内存。所述计算机可读存储介质也可以是任意具备数据处理能力的设备的外部存储设备,例如所述设备上配备的插接式硬盘、智能存储卡(smart media card,smc)、sd卡、闪存卡(flash card)等。进一步的,所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据,还可以用于暂时地存储已经输出或者将要输出的数据。[0168]以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
基于排版和图文关联融合分析的文章质量评价方法及装置与流程 专利技术说明
作者:admin
2023-07-05 12:36:43
842
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术