计算;推算;计数设备的制造及其应用技术1.本发明涉及知识图谱链路预测技术领域,特别是涉及一种基于解耦表征学 习的链路预测方法及系统。背景技术:2.近些年,由于数据量爆炸式的增长,知识图谱得到了迅速发展,在推荐系 统、问答系统、自然语言处理等领域都得到了广泛的应用。知识图谱由大量的 事实组成,其存在形式为三元组,目前,一些知识图谱已经包含了数以百万的 事实和三元组,例如freebase,wordnet,nell和yago等。但这些知识图谱 依旧存在知识缺失的问题,与现实世界的已有事实和新添加的知识相比,它们 还远远不够完整,使得预测三元组真实性的链路预测方法在知识图谱补全任务 中起着重要的作用,其中,链路预测通过基于知识图谱中已知事实推断缺失事 实来完成这一任务。3.知识图谱信息量巨大,传统的链路预测方法无法满足日益复杂的知识图补 充。研究人员为此提出了许多有效的方法来用于链路预测。其中较为突出的一 种方法是学习所有实体和关系的低维嵌入,然后使用他们的低维嵌入来生成新 的事实,并优化得分函数来预测新事实。这些低维嵌入方法可以分类为基于翻 译的、语义匹配的和基于卷积神经网络的方法等。在基于翻译的和语义匹配的 方法中,他们对于存在自反,反自反,传递等模式,以及1对n,n对1,n 对n的关系提出了不同的方法,从而提升了对真实三元组的预测能力,但这些 方法受限于自身浅层的结构,对三元组内实体与关系之间的信息获取能力仍有 所欠缺,为此,基于卷积的神经网络的方法便由此提出,该方法将实体与关系 进行连接并重塑,然后通过卷积神经网络来提取出实体与关系之间的相关信息, 而如何获取到更多以及更深层的信息便成为了该类方法的主要研究内容。技术实现要素:4.本发明的目的是提供一种基于解耦表征学习的链路预测方法及系统,能够 提升对三元组的预测能力。5.为实现上述目的,本发明提供了如下方案:6.本发明提供了一种基于解耦表征学习的链路预测方法,所述方法包括:7.获取目标数据集,并将所述目标数据集中包含的三元组中的实体替换为已 经编号的实体id,将关系替换为已经编号的关系id,得到替换后的三元组; 所述三元组包括头实体、关系和尾实体;8.对所述替换后的三元组中的实体数据和关系数据进行低维嵌入向量的初 始化,得到初始化后的三元组;所述初始化后的三元组包括实体向量和关系向 量;9.将初始化后的三元组标记为正确的三元组,根据所述正确的三元组生成错 误的三元组,将所述正确的三元组和所述错误的三元组作为训练数据并制作对 应的标签;10.构建卷积神经网络模型,并采用所述训练数据对所述卷积神经网络模型进 行训练,得到三元组预测模型;所述三元组预测模型包括第一子网络模型、第 二子网络模型和最终得分确定模型;所述第一子网络模型包括解耦层、卷积层 和拼接层;11.通过所述三元组预测模型预测所述三元组的得分,所述得分表征所述三元 组的真实性。12.可选地,所述采用所述训练数据对所述卷积神经网络模型进行训练,得到 三元组预测模型,具体包括:13.采用adam优化器对所述卷积神经网络模型进行超参数优化,直至损失函 数收敛,停止训练;14.若损失函数未收敛,且当前训练轮次超过设定阈值,则将当前训练轮次对 应的超参数作为最优超参数,并停止训练。15.可选地,所述对所述替换后的三元组中的实体数据和关系数据进行低维嵌 入向量的初始化,得到初始化后的三元组,具体包括:16.设置初始化超参数;所述初始化超参数包括第一初始化超参数、第二初始 化超参数和第三初始化超参数;所述第一初始化超参数为是否使用已训练好的 嵌入向量,所述第二初始化超参数为实体与关系的初始嵌入向量维度,所述第 三初始化超参数为实体的解耦模块数;17.当所述第一初始化超参数为使用已训练好的嵌入向量时,所述第一初始化 超参数为1,根据预先设定的路径导入已经训练好的低维嵌入向量对所述替换 后的三元组中的实体数据和关系数据进行初始化,并根据第三初始化超参数的 值对实体向量维度进行调整,关系向量的维度不变,得到初始化后的三元组;18.当所述第一初始化超参数为不使用已训练好的嵌入向量时,所述第一初始 化超参数为0,根据第二初始化超参数的值和第三初始化超参数的值随机初始 化实体向量,根据第二初始化超参数的值随机初始化关系向量,得到初始化后 的三元组。19.可选地,所述根据所述正确的三元组生成错误的三元组,具体包括:20.设置第四超参数,根据所述第四超参数确定生成的错误的三元组的数目; 所述第四超参数为错误的三元组与所述正确的三元组的比值;21.随机替换正确的三元组中的任一实体,生成错误的三元组。22.可选地,所述通过所述三元组预测模型预测所述三元组的得分,具体包括:23.通过所述解耦层将三元组中的头实体与尾实体分别解耦,将解耦后的头实 体向量、尾实体向量分别与关系向量连结,得到连结后的头实体-关系向量和 关系-尾实体向量;24.通过所述卷积层对连结后的头实体-关系向量、关系-尾实体向量进行特征 提取;25.通过所述拼接层对提取的头实体-关系向量特征信息和关系-尾实体向量 特征信息进行特征融合和内积操作,得到第一三元组得分;26.根据解耦前的三元组通过所述第二子网络模型,得到第二三元组得分;27.根据所述第一三元组得分和所述第二三元组得分,通过所述最终得分确定 模型确定最终三元组得分;所述最终三元组得分用于表征三元组的真实性。28.可选地,所述损失函数的表达式为:[0029][0030]其中,(s,r,o)表示三元组,ψ(s,r,o)代表最终三元组得分,代表生成 的错误三元组的集合,代表正确三元组的集合,代表对三元组的标签。[0031]可选地,所述方法还包括:[0032]将所述目标数据集中的测试集中的三元组输入至所述三元组预测模型,计 算三元组预测模型的性能指标;所述性能指标包括mr指标、mrr指标和 hit@n指标;[0033]其中,所述mr指标表示对每个最终三元组得分排名的平均排名;所述 mrr指标表示对每个最终三元组得分排名的倒数的平均;所述hit@n指标表 示链接预测中排名小于设定数值的三元组的平均占比。[0034]为实现上述目的,本发明还提供了一种基于解耦表征学习的链路预测系统, 所述系统包括:[0035]目标数据集获取和三元组替换单元,用于获取目标数据集,并将所述目标 数据集中包含的三元组中的实体替换为已经编号的实体id,将关系替换为已 经编号的关系id,得到替换后的三元组;所述三元组包括头实体、关系和尾 实体;[0036]初始化单元,用于对所述替换后的三元组中的实体数据和关系数据进行低 维嵌入向量的初始化,得到初始化后的三元组;所述初始化后的三元组包括实 体向量和关系向量;[0037]训练数据确定单元,用于将初始化后的三元组标记为正确的三元组,根据 所述正确的三元组生成错误的三元组,将所述正确的三元组和所述错误的三元 组作为训练数据并制作对应的标签;[0038]模型构建单元,用于构建卷积神经网络模型,并采用所述训练数据对所述 卷积神经网络模型进行训练,得到三元组预测模型;所述三元组预测模型包括 第一子网络模型、第二子网络模型和最终得分确定模型;所述第一子网络模型 包括解耦层、卷积层和拼接层;[0039]预测单元,用于通过所述三元组预测模型预测所述三元组的得分,所述得 分表征所述三元组的真实性。[0040]可选地,所述初始化单元,具体包括:[0041]初始化超参数设置模块,用于设置初始化超参数;所述初始化超参数包括 第一初始化超参数、第二初始化超参数和第三初始化超参数;所述第一初始化 超参数为是否使用已训练好的嵌入向量,所述第二初始化超参数为实体与关系 的初始嵌入向量维度,所述第三初始化超参数为实体的解耦模块数;[0042]初始化模块,用于当所述第一初始化超参数为使用已训练好的嵌入向量时, 所述第一初始化超参数为1,根据预先设定的路径导入已经训练好的低维嵌入 向量对所述替换后的三元组中的实体数据和关系数据进行初始化,并根据第三 初始化超参数的值对实体向量维度进行调整,关系向量的维度不变,得到初始 化后的三元组;[0043]还用于当所述第一初始化超参数为不使用已训练好的嵌入向量时,所述第 一初始化超参数为0,根据第二初始化超参数的值和第三初始化超参数的值随 机初始化实体向量,根据第二初始化超参数的值随机初始化关系向量,得到初 始化后的三元组。[0044]可选地,所述预测单元,具体包括:[0045]解耦模块,用于通过所述解耦层将三元组中的头实体与尾实体分别解耦, 将解耦后的头实体向量、尾实体向量分别与关系向量连结,得到连结后的头实 体-关系向量和关系-尾实体向量;[0046]特征提取模块,用于通过所述卷积层对连结后的头实体-关系向量、关系‑ꢀ尾实体向量进行特征提取;[0047]第一三元组得分确定模块,用于通过所述拼接层对提取的头实体-关系向 量特征信息和关系-尾实体向量特征信息进行特征融合和内积操作,得到第一 三元组得分;[0048]第二三元组得分确定模块,用于根据解耦前的三元组通过所述第二子网络 模型,得到第二三元组得分;[0049]最终三元组得分确定模块,用于根据所述第一三元组得分和所述第二三元 组得分,通过所述最终得分确定模型确定最终三元组得分;所述最终三元组得 分用于表征三元组的真实性。[0050]根据本发明提供的具体实施例,本发明公开了以下技术效果:[0051]本发明提供了一种基于解耦表征学习的链路预测方法及系统,所述方法包 括:获取目标数据集,并将所述目标数据集中包含的三元组中的实体替换为已 经编号的实体id,将关系替换为已经编号的关系id,得到替换后的三元组; 对所述替换后的三元组中的实体数据和关系数据进行低维嵌入向量的初始化, 得到初始化后的三元组;将初始化后的三元组标记为正确的三元组,根据所述 正确的三元组生成错误的三元组,将所述正确的三元组和所述错误的三元组作 为训练数据并制作对应的标签;构建卷积神经网络模型,并采用所述训练数据 对所述卷积神经网络模型进行训练,得到三元组预测模型;所述三元组预测模 型包括第一子网络模型、第二子网络模型和最终得分确定模型;所述第一子网 络模型包括解耦层、卷积层和拼接层;通过所述三元组预测模型预测所述三元 组的得分,所述得分表征所述三元组的真实性。本发明能够提升对三元组的预 测能力。附图说明[0052]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是 本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性 的前提下,还可以根据这些附图获得其他的附图。[0053]图1为本发明一种基于解耦表征学习的链路预测方法的流程图;[0054]图2为本发明一种基于解耦表征学习的链路预测系统的模块结构示意图。[0055]符号说明:[0056]目标数据集获取和三元组替换单元-1,初始化单元-2,训练数据确定单元ꢀ‑3,模型构建单元-4,预测单元-5。具体实施方式[0057]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0058]本发明的目的是提供一种基于解耦表征学习的链路预测方法及系统,能够 提升对三元组的预测能力。[0059]为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和 具体实施方式对本发明作进一步详细的说明。[0060]如图1所示,本发明一种基于解耦表征学习的链路预测方法,包括:[0061]s1:获取目标数据集,并将所述目标数据集中包含的三元组中的实体替换 为已经编号的实体id,将关系替换为已经编号的关系id,得到替换后的三元 组;所述三元组包括头实体、关系和尾实体。其中,目标数据集来自公开数据 集wn18rr或fb15k-237,从中获取已经分配好的训练集train,测试集test 和验证集valid的,将这三个数据集中的数据即三元组(实体,关系,实体) 中的实体和关系用已经进行了编号的对应的实体id和关系id进行替换,方便 后续对实体与关系进行低维嵌入的初始化,实体id和关系id在获取的数据集 中已经给出,就是根据实体类型或者关系类型数量进行的一个编号。两类数据 集中所蕴含的关系的类别不一样,wn18rr数据集是wordnet的一个子数据 集,wordnet是一种基于认知语言学的英语词典,而wn18rr即是从中获取 到的一个较小的单词的网络;fb15k-237则是freebase的一个子集,其中记录 各种各样的社交网络信息。[0062]s2:对所述替换后的三元组中的实体数据和关系数据进行低维嵌入向量的 初始化,得到初始化后的三元组;所述初始化后的三元组包括实体向量和关系 向量。其中,已经用实体id和关系id替换后的三类数据集中的数据分别表示 为train_data,validation_data,test_data。[0063]s3:将初始化后的三元组标记为正确的三元组,根据所述正确的三元组生 成错误的三元组,将所述正确的三元组和所述错误的三元组作为训练数据并制 作对应的标签。[0064]s4:构建卷积神经网络模型,并采用所述训练数据对所述卷积神经网络模 型进行训练,得到三元组预测模型;所述三元组预测模型包括第一子网络模型、 第二子网络模型和最终得分确定模型;所述第一子网络模型包括解耦层、卷积 层和拼接层。[0065]s5:通过所述三元组预测模型预测所述三元组的得分,所述得分表征所述 三元组的真实性。[0066]进一步地,步骤s2中,所述对所述替换后的三元组中的实体数据和关系 数据进行低维嵌入向量的初始化,得到初始化后的三元组,具体包括:[0067]设置初始化超参数;所述初始化超参数包括第一初始化超参数 pretrain_emb、第二初始化超参数embedding_size和第三初始化超参数k值; 所述第一初始化超参数为是否使用已训练好的嵌入向量,所述第二初始化超参 数为实体与关系的初始嵌入向量维度,所述第三初始化超参数为实体的解耦模 块数;这三个超参数是训练模型前自行设置的默认参数,用来控制实体或者关 系的低维嵌入的初始化。嵌入维度由输入的k值和embedding_size进行控制。[0068]当所述第一初始化超参数为使用已训练好的嵌入向量时,所述第一初始化 超参数pretrain_emb为1,根据预先设定的路径导入已经训练好的低维嵌入向 量对所述替换后的三元组中的实体数据和关系数据进行初始化,并根据第三初 始化超参数k值的大小对实体向量维度进行调整,关系向量的维度不变,得 到初始化后的三元组。[0069]当所述第一初始化超参数为不使用已训练好的嵌入向量时,所述第一初始 化超参数pretrain_emb为0,根据第二初始化超参数embedding_size的值和第 三初始化超参数k值的大小随机初始化实体向量,根据第二初始化超参数 embedding_size的值随机初始化关系向量,得到初始化后的三元组。最后得到 的实体向量维度∈k*embedding_size,关系向量的维度∈embedding_size。[0070]进一步地,步骤s3中,所述根据所述正确的三元组生成错误的三元组, 具体包括:[0071]s31:设置第四超参数,根据所述第四超参数确定生成的错误的三元组的 数目;所述第四超参数为错误的三元组与所述正确的三元组的比值。[0072]s32:随机替换正确的三元组中的任一实体,生成错误的三元组。[0073]具体地,进行过初始化后,我们需要对数据进行标签(正确的三元组标记 为1,错误的三元组标记为0),以及生成错误的三元组来用于训练,对于数 据集中的train_data,validation_data,test_data的所有三元组都标记为1,并进 行记录,随后我们会根据超参数valid_invalid_ratio(错误三元组比上正确三元 组的倍数)来确定生成的错误三元组的数目invalid_data_num。 (valid_invalid_ratio是训练前自行设置的超参数,)通过随机替换三元组中的 任一实体,并确认其不是已存在的三元组后将其标记为错误三元组后添加进训 练的数据中,随后将生成的错误的三元组和正确的三元组一起输入模型进行训 练,即训练的数据包括原来的正确的三元组以及后来根据正确的三元组生成的 错误的三元组。[0074]在错误的三元组生成的过程中,我们每次按顺序从训练集train_data中获 取到batch_size(每批次从训练集中获取到的正确三元组的数目)大小的正确 三元组,并通过随机替换获取到的三元组的头实体与尾实体来额外获取到错误 三元组,这两种类型的错误三元组的数量一致,用于训练而生成的错误三元组 的数据数目invalid_data_num如下:[0075]invalid_data_num=batch_size*valid_invalid_ratio。[0076]进一步地,步骤s4中,所述采用所述训练数据对所述卷积神经网络模型 进行训练,得到三元组预测模型,具体包括:[0077]s41:采用adam优化器对所述卷积神经网络模型进行超参数优化,并在 当前训练批次结束后使训练轮次epochs=epochs+1,直至损失函数收敛,停止 训练。[0078]s42:若损失函数未收敛,且当前训练轮次超过设定阈值,则将当前训练 轮次对应的超参数作为最优超参数,并停止训练。[0079]所述损失函数的表达式为:[0080][0081]其中,(s,r,o)表示三元组,ψ(s,r,o)代表最终三元组得分,代 表生成的错误三元组的集合,代表正确三元组的集合, 代表对三元组的标签。[0082]进一步地,步骤s5中,所述通过所述三元组预测模型预测所述三元组的 得分,具体包括:[0083]通过所述解耦层将三元组中的头实体与尾实体分别解耦,将解耦后的头实 体向量、尾实体向量分别与关系向量连结,得到连结后的头实体-关系向量和 关系-尾实体向量。在解耦部分根据k值将头实体与尾实体分别解耦,将维度 为k*embedding_size的头实体和尾实体拆解成k个维度为embedding_size大 小的实体向量,并且将每个解耦的部分分别与关系向量进行在第一个维度上连 结,连结后的数据维度为r2×embedding_size。k值是指将实体分解的组件个数,连 结是指将解耦的实体组件和关系在第一个维度进行连结,两个embedding_size 的向量连结后变成r2×embedding_size的二维数据。[0084]通过所述卷积层对连结后的头实体-关系向量、关系-尾实体向量进行特征 提取,提取出头实体与尾实体分别与关系之间的特征信息。[0085]通过所述拼接层对提取的头实体-关系向量特征信息和关系-尾实体向量 特征信息进行特征融合和内积操作,得到第一三元组得分。将两种特征信息分 别在各自类别内通过累加方式进行特征融合,最终得到头实体组件-关系和关 系-尾实体组件的特征信息,将这两组特征信息内积后并通过全连接层后得到 第一三元组得分。[0086]根据解耦前的三元组通过所述第二子网络模型,得到第二三元组得分。[0087]根据所述第一三元组得分和所述第二三元组得分,通过所述最终得分确定 模型确定最终三元组得分;所述最终三元组得分用于表征三元组的真实性。正 确三元组的得分越高越好,错误三元组的得分越低越好,证明该三元组的真实 性越高,两类三元组的得分用于可以用于计算损失函数。[0088]其中,由于第一子网络模型中将三元组进行了拆分,所以从中所获取到的 完整三元组的结构信息会有所缺失,为了对该部分的信息进行补充,我们将完 整的(头实体,关系,尾实体)输入第二子网络模型,通过卷积层直接对其结 构信息进行获取,随后将得到的特征信息通过全连接层直接整合,得到该部分 的得分,最后通过自适应权重的方式与第一部分所得到的得分相加,则得到最 终三元组得分。自适应权重的方式具体为:首先随机设置一个权重,随后在训 练过程中会根据训练过程的参数变化自行调整该权重。[0089]进一步地,所述方法还包括:[0090]s6:将所述目标数据集中的测试集中的三元组输入至所述三元组预测模型, 计算三元组预测模型的性能指标;所述性能指标包括mr(mean rank)指标、 mrr(mean reciprocal ranking)指标和hit@n指标。[0091]其中,将预测的所有三元组的得分进行一个排序后,计算上述指标。所述 mr指标表示对每个最终三元组得分排名的平均排名,该指标越小越好;所述mrr指标表示对每个最终三元组得分排名的倒数的平均,该指标越大越好; 所述hit@n指标表示链接预测中排名小于设定数值n的三元组的平均占比, 该指标越高越好。[0092]为实现上述目的,如图2所示,本发明还提供了一种基于解耦表征学习的 链路预测系统,所述系统包括:目标数据集获取和三元组替换单元1、初始化 单元2、训练数据确定单元3、模型构建单元4和预测单元5。[0093]目标数据集获取和三元组替换单元1,用于获取目标数据集,并将所述目 标数据集中包含的三元组中的实体替换为已经编号的实体id,将关系替换为 已经编号的关系id,得到替换后的三元组;所述三元组包括头实体、关系和 尾实体。[0094]初始化单元2,用于对所述替换后的三元组中的实体数据和关系数据进行 低维嵌入向量的初始化,得到初始化后的三元组;所述初始化后的三元组包括 实体向量和关系向量。[0095]训练数据确定单元3,用于将初始化后的三元组标记为正确的三元组,根 据所述正确的三元组生成错误的三元组,将所述正确的三元组和所述错误的三 元组作为训练数据并制作对应的标签。[0096]模型构建单元4,用于构建卷积神经网络模型,并采用所述训练数据对所 述卷积神经网络模型进行训练,得到三元组预测模型;所述三元组预测模型包 括第一子网络模型、第二子网络模型和最终得分确定模型;所述第一子网络模 型包括解耦层、卷积层和拼接层。[0097]预测单元5,用于通过所述三元组预测模型预测所述三元组的得分,所述 得分表征所述三元组的真实性。[0098]进一步地,所述初始化单元2,具体包括:[0099]初始化超参数设置模块,用于设置初始化超参数;所述初始化超参数包括 第一初始化超参数、第二初始化超参数和第三初始化超参数;所述第一初始化 超参数为是否使用已训练好的嵌入向量,所述第二初始化超参数为实体与关系 的初始嵌入向量维度,所述第三初始化超参数为实体的解耦模块数;[0100]初始化模块,用于当所述第一初始化超参数为使用已训练好的嵌入向量时, 所述第一初始化超参数为1,根据预先设定的路径导入已经训练好的低维嵌入 向量对所述替换后的三元组中的实体数据和关系数据进行初始化,并根据第三 初始化超参数的值对实体向量维度进行调整,关系向量的维度不变,得到初始 化后的三元组;[0101]还用于当所述第一初始化超参数为不使用已训练好的嵌入向量时,所述第 一初始化超参数为0,根据第二初始化超参数的值和第三初始化超参数的值随 机初始化实体向量,根据第二初始化超参数的值随机初始化关系向量,得到初 始化后的三元组。[0102]进一步地,所述预测单元5,具体包括:[0103]解耦模块,用于通过所述解耦层将三元组中的头实体与尾实体分别解耦, 将解耦后的头实体向量、尾实体向量分别与关系向量连结,得到连结后的头实 体-关系向量和关系-尾实体向量;[0104]特征提取模块,用于通过所述卷积层对连结后的头实体-关系向量、关系‑ꢀ尾实体向量进行特征提取;[0105]第一三元组得分确定模块,用于通过所述拼接层对提取的头实体-关系向 量特征信息和关系-尾实体向量特征信息进行特征融合和内积操作,得到第一 三元组得分;[0106]第二三元组得分确定模块,用于根据解耦前的三元组通过所述第二子网络 模型,得到第二三元组得分;[0107]最终三元组得分确定模块,用于根据所述第一三元组得分和所述第二三元 组得分,通过所述最终得分确定模型确定最终三元组得分;所述最终三元组得 分用于表征三元组的真实性。[0108]本发明在基于卷积的神经网络模型的基础上,提出了通过解耦的操作,将 实体解耦成不同的部分,不同的部分代表着实体的不同的属性,随后将这些不 同的属性与关系进行连结后并通过卷积,以此来获取到实体的不同属性与关系 之间的信息。相较其他的卷积神经网络的方法,本发明的方法考虑了实体的不 同属性与关系之间的关联,并通过解耦和卷积的方法获取了其中更深层次的信 息。将这两部分整合后便是我们在这里所提出的基于解耦表征学习的链路预测 方法——disenkge。[0109]本发明中,首先,根据k值将实体解耦成相应数量的实体模块,其中每 一模块的大小都等同embedding_size。随后,为了从中获得更多的实体与关系 之间的相关信息,将三元组进行拆分,拆分成(头实体组件,关系),(关系, 尾实体组件)两部分分别输入到卷积神经网络对实体与关系之间的信息进行提 取,之后再将这两部分的信息通过内积的方式对其相似度进行计算。另外,由 于对三元组进行了拆分,其所蕴含的完整的三元组结构信息会有所损失,为此, 还采用了一种方法来对完整三元组的信息进行获取,并最终通过自适应权重的 方法将两部分进行相加,获得最终的三元组得分。[0110]在测试阶段,同传统的链路预测方法相比,本发明采用解耦的方法对实体 进行解耦从而增强了对实体与关系之间特征信息的提取能力,并最终通过实验 证明了解耦方法的有效性。[0111]具体实施例[0112]以下详细地描述本发明在真实数据集上的测试效果,训练时使用的数据集 是wn18rr和fb15k-237,其中wn18rr是wordnet的一个子集,wordnet 是一个字典,对同一单词的不同语义进行测试,而fb15k-237则是社会关系的 一个数据集。在这两个数据集中也不存在着正反关系,即含义相同但指向相反 的关系,因此在这两个数据集上测试也会避免出现逆关系测试泄露的问题。[0113]表1选择的知识图谱数据集[0114][0115]为了验证本发明提出的方法(disenkge)的有效性,我们将其与几个典 型的链路预测方法进行比较。这里对比的算法是transe、rotatae、conve和 interacte。前两种算法是典型的基于翻译的模型,后两种则是基于卷积神经网 络的模型。实验结果主要比较这四种模型的mr、mrr和hit@10指标。[0116]表2 disenkge与其他四种算法的比较结果,加粗的表示最优结果[0117][0118][0119]从表2中可以看到,disenkge可以在两个数据集wn18rr和fb15k-237 上都取得较为优异的结果,尤其是在fb15k-237上,在mrr和hit@10两个 指标上都远高于其他四个模型,而这也恰恰证明了本发明方法的有效性,在这 个数据集上,关系的类别与实体的类型比例更高,因此对实体进行解耦的方法 也在这种情况下取得了更为优秀的效果。[0120]另外,为了验证发明中第二部分的对三元组解耦信息提取的有效性,我们 对其进行了一组消融实验,将该部分组件从disenkge上删掉以后再进行训练 后得到的模型与我们完整的模型进行比较。[0121]表3 disenkge的消融实验[0122][0123]从表3中的结果我们可以得知,去掉获取三元组结构信息的模块后,本发 明的三元组预测模型在各个指标上都有所下降,而这组实验进而验证了获取三 元组结构信息模块的有效性。[0124]最后,本发明的核心之处便是对实体的解耦部分,通过改变k值来对disenkge和disenkge-ablation模型进行测试,相较其他的模型来说,对实体 解耦是否在链路预测任务上有所提升,这里通过对k值的逐步增加来进行验 证。[0125]表4 disenkge受到k值的变化的实体结果[0126][0127]从表4的结果中可以发现,在k值为4或6时,本发明的三元组预测模 型取得最好的效果,而过低或者过高的k值都会导致模型性能有所降低,这 也证明了对实体的解耦这一方法是有效的,在将实体解耦后,会比未进行解耦 操作的模型具有更强的对实体与关系之间特征信息的获取能力,从而使模型具 有更强的三元组预测能力。[0128]综合以上,通过多个实验循序渐进、一步步地去充分验证模型的检测性能, 由以上实验结果可见,本发明所提出的解决方法是新颖、可靠、有效的。[0129]本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是 与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于 实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较 简单,相关之处参见方法部分说明即可。[0130]本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施 例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的 一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变 之处。综上所述,本说明书内容不应理解为对本发明的限制。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
一种基于解耦表征学习的链路预测方法及系统
作者:admin
2022-10-01 06:36:06
217
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术
- 下一篇: 一种钠电池正极材料及其制备方法以及应用与流程
- 上一篇: 一种软包锂电池自动封装设备的制作方法