计算;推算;计数设备的制造及其应用技术1.本发明属于用户推荐领域,特别涉及一种基于多粒度融合的异质网络中相同类型用户的发现方法及装置。背景技术:2.异质网络因为其多种类型的节点和边的结构特点而能表达更加丰富的信息,从而能够建模各种类型的场景以及场景内的各种交互。在实际生活中,异质网络有着许多的应用场景,例如对用户网站中的各类用户进行建模,并学习到其的低维向量。通过低维对可以相关用户进行密切用户推荐。3.然而,在现实生活中,对复杂网络进行建模和挖掘不是一件容易的事情,网络中的相关信息可能被忽略,而另一些错误的信息可能被纳入而混淆视听。人工的对这些信息进行筛选和分析会耗费巨大的人力物力,并且收集到的信息并不一定完整,这也为网络建模提升了难度。4.用户网络也属于一种社交网络,因其用户的不同类型和关系的不同类型,同时包括多种属性(如用户年龄、性别、地域等),将其建模为异质网络能更好的描述用户网络中的信息。建模后,模型能更正确的挖掘出用户网络中的潜在信息,加快了用户推荐中对于有效信息的整合效率,从而提高了推荐准确率。5.当前异质网络研究大都是对网络的结构信息、语义信息以及属性信息进行研究,而如何有效提取网络中的邻近结构信息和精准提取网络中的语义信息仍然是当前研究中的公开问题,同时结构信息和语义信息也存在着对模型结构的贡献差异。将这些技术问题对标到复杂网络分析中,即建模时模型可能忽略相关的重要信息,如用户的所在地、年龄、性别等,同时又将无关信息作为重要信息纳入。技术实现要素:6.针对上述问题,本发明提出一种基于多粒度融合的异质网络中相同类型用户的发现方法及装置,所述方法具体包括以下步骤:7.对相关用户的特征信息和关系数据进行采集,并对采集的信息中缺失或者不完善的部分进行补全和对齐;8.对相关用户直接接触的用户节点进行聚合,融合用户网络的低阶结构;9.对相关用户的元路径信息进行聚合,融合用户网络的高阶语义;10.使用多粒度认知计算的思路,对低阶结构向量和高阶语义向量进行互补聚合,得到用户的低维向量;11.将用户网络的低维向量投影到二维坐标系中,将与当前用户的低维向量距离最近的n个用户作为当前用户的同类用户,将同类用户推荐给当前用户。12.进一步的,对于获取的信息,根据用户网络的低维向量计算出相关用户与其接触人员的相似度距离,根据相似度距离预测出所述相关用户的若干密切用户集合。13.进一步的,获取相关用户完善的内容属性信息的过程,即通过随机游走生成一个随机游走序列,根据生成的游走序列使用skip-gram模型对参数进行更新,并生成最终的节点表示矩阵包括:[0014][0015][0016]其中,是以为起点的随机游走序列,表示异质神经网络,t为游走序列长度;s∈r|v|×d为用户属性内容矩阵,该矩阵的每一行表示为为相关用户的一个内容属性;d为节点嵌入大小,w为游走窗口大小;|v|为网络用户集合v中用户的数量。[0017]进一步的,获得用户网络的低阶结构信息的过程包括:[0018]获取相关用户的一阶邻居节点集合,并得到接触用户集合的类别;[0019]将每个类别的接触用户按照类别分别进行融合,得到每个类别的融合结果;[0020]将每个类别的融合结果分别与相关用户进行融合,获得网络的低阶结构向量。[0021]进一步的,将每个类别的接触用户按照类别分别进行融合,则类别为的接触用户的融合过程表示为:[0022][0023]其中,表示类别为的接触用户的融合结果,为接触用户对相关用户的重要度,为相关用户的接触用户集合中类别为中的一个节点,表示接触用户接触用户中类型为的节点集合;为相关用户的节点内容属性,表示相关用户的接触用户集合中类型为的同类接触用户。[0024]进一步的,若有k个其他类型的接触用户,则相关用户与所有类型的接触用户进行融合的过程表示为:[0025][0026]其中,为网络的低阶结构信息向量;为类型的接触用户对相关用户的关联度,通过注意力机制计算;k为类型的数量,表示总共k个类型中的第n个类型,简称类型[0027]进一步的,对相关用户的元路径信息进行聚合的过程包括:[0028]使用gcn对元路径进行编码,并将gcn最后一层的结果作为基于该原路径的编码;[0029]将所有原路径的编码进行融合,得到用户网络的高阶语义向量。[0030]进一步的,使用gcn对元路径进行编码的过程中,gcn第l+1层的输出表示为:[0031][0032]其中,为相关用户在第l层的特征,为相关用户vj在第l层的特征;为相关用户包括自己在内的邻居集;prelu()表示激活函数;cij表示归一化因子;w(l)、b(l)均是可训练的矩阵,w(l)为第l层的权重,b(l)为第l层的偏置项。[0033]进一步的,通过对比学习令低阶结构向量和高阶语义向量进行互补聚合,聚合过程中,使用低阶结构向量与高阶语义向量之间的余弦距离作为损失函数进行优化,直到优化后的低阶结构向量与高阶语义向量之间的余弦距离小于设置的阈值,得到融合后的低阶结构向量和高阶语义向量,并将其中一个作为最终的用户网络低维向量。本发明还提出一种基于多粒度层次融合的异质网络表示装置,包括特征抽取模块、属性补全模块、结构编码器模块、语义编码器模块、有偏对比融合模块、编码融合模块、推荐模块,其中:[0034]特征抽取模块,用于抽取相关用户的内容属性信息;[0035]属性补全模块,用于对相关用户的内容属性进行收集并补全;[0036]结构编码器模块,用于对相关用户的一阶邻居节点进行聚合,融合用户的低阶结构;[0037]语义编码器模块,用于对相关用户的元路径信息进行聚合,融合用户的高阶语义;[0038]有偏对比融合模块,用于进行低阶结构和高阶语义的互补聚合,最终得到用户的低维向量;[0039]推荐模块,用于将相关用户的低维向量投影到二维坐标系中,将与相关用户的低维向量距离最近的n个用户作为相关用户的同类用户,将同类用户推荐给相关用户。[0040]本发明通过多粒度认知计算的思想,分别融合复杂网络的结构信息和语义信息,再使用有偏对比融合的方法,对低阶结构向量和高阶语义向量进行最终融合,得到嵌入结果,进而发现用户网络中的潜在信息,在用户网络中能提高用户关系预测的准确率,提高用户推荐效率。附图说明[0041]图1为本发明一种基于多粒度融合的异质网络中相同类型用户的发现方法流程示意图;[0042]图2为本发明中结构编码器、语义编码器和有偏对比融合三个模块的结构示意图;[0043]图3为本发明高阶语义编码的示意图。具体实施方式[0044]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0045]本发明提出一种一种基于多粒度融合的异质网络中相同类型用户的发现方法,具体包括以下步骤:[0046]对相关用户的特征信息和关系数据进行采集,并对采集的信息中缺失或者不完善的部分进行补全和对齐;[0047]对相关用户直接接触的用户节点进行聚合,融合用户网络的低阶结构;[0048]对相关用户的元路径信息进行聚合,融合用户网络的高阶语义;[0049]使用多粒度认知计算的思路,对低阶结构向量和高阶语义向量进行互补聚合,得到用户的低维向量;[0050]将用户的低维向量投影到二维坐标系中,将与相关用户的低维向量距离最近的n个用户作为相关用户的同类用户,将同类用户推荐给相关用户。[0051]在本实施例中,如图1,对采集的用户的信息,即进行内容属性收集后,利用属性补全模块对采集的额信息中缺失或者不完善的部分进行补全;补全后的数据输入低阶结构编码器和高阶语义编码器,将编码后得到的低阶结构和高阶语义进行有偏对比融合,得到最终的低维向量,将最终的低维向量应用在链接预测、好友推荐等领域,本发明主要将得到的相关用户的最终编码用于推荐领域,例如想相关用户推荐同类用户或者同类用户相关的商品。具体包括:[0052](一)数据采集和数据补全[0053]收集到相关用户内容属性后,通过属性补全模块,使用随机游走和skipgram方法对缺失或不完整的属性进行补全。抽取相关用户的特征,即相关用户内容属性,如年龄、所在地、性别等。此过程获取到的数据可能缺失节点内容属性信息或内容属性信息并不完善。为了能够对用户属性进行统一处理,我们以用户间的拓扑关系为指导,通过用户网络整体的拓扑结构补全相关用户的属性。[0054]获取相关用户完善的内容属性信息的过程包括:[0055][0056][0057]其中,是以为起点的随机游走序列,为整个异质神经网络,t为游走序列长度。随后根据生成的游走序列使用skip-gram模型对参数进行更新,并生成最终的相关用户表示矩阵户表示矩阵为节点嵌入size,w为游走窗口size,每一行为相关用户的内容属性。[0058](二)获取相关用户的低阶结构[0059]融合相关用户的接触用户,获得网络的低阶结构向量。作为一种可选的实施方式,本实施例中的接触用户可以是指与相关用户直接连接的邻居用户,也可以是与相关用户相距某一范围的用户,所述某一范围本领域技术人员根据实际情况进行设置。确定相关用户的接触用户集合后,将该集合中接触用户按照其类型进行分类,然后将每个类型的接触用户分别进行聚合,类型为的接触用户聚合过程表示为:[0060][0061]其中,为相关用户的节点内容属性;为接触用户对相关用户的关联度,该关联度本领域通过现有计算一个用户对另一个用户的重要程度的方法进行计算,作为一种可选的实施方式,本实施例选择采用注意力机制进行计算。[0062]在每个类型完成融合之后,若总共有k个类型的接触用户,则这k个类型的接触用户的融合过程包括:[0063][0064]其中,为类型为的接触用户对的重要度,通过注意力机制进行计算;即为网络的低阶结构向量;为类型为的接触用户对的向量表示。[0065](三)获取节点的高阶语义[0066]获取节点的高阶语义向量过程中,首先使用gcn对元路径进行编码,编码过程包括:[0067][0068]其中,为相关用户在第l层的特征,为相关用户包括自己在内的邻居用户集,最后一层的结果即为基于元路径的节点编码。[0069]根据原路径的数量,即若有m条原路径,则融合相关用户的m条元路径信息的过程包括:[0070][0071]其中,为一条元路径的重要度权重;即为网络的高阶语义信息编码结果;为一条元路径上一个节点的向量表示。[0072]在本实施例中,表示不同场景下节点的向量表示,表示在按照类别对节点进行融合过程中,一个节点的向量表示,或称用户的低阶结构;表示在按照元路径对节点进行融合的过程中,一个节点的向量表示,也可成为基于元路径的节点编码,或称用户的高阶语义。[0073]如图2,本实施例通过有偏对比融合方法对低阶结构向量和高阶语义向量进行融合。由于结构向量和语义向量都是从不同的角度去获取到用户网络的信息,所以彼此都有对方所不具有的一些信息,当它们进行融合时,能够互补,从而得到更完整的用户网络信息。本实施例通过余弦函数来计算和的相似程度,当和在融合过程中的相似程度越来越高时,就表明和获得对方的互补信息越好,和的信息也就更加完整。[0074]低阶结构向量和高阶语义向量之间的余弦相函数的公式为:[0075][0076]进一步的,定义损失函数:[0077][0078]其中,为一个权重矩阵,作为一种优选的实施方式,本实施例权重矩阵初始化为一个对角矩阵,对角线上的值设置为2;为通过元路径与相关用户相连的用户集合。在机器学习过程中,希望损失函数在训练中越来越小,最终能趋于一个定值,在这个过程中,和也在进行信息的互补,当训练结束时,这两个向量也趋于完整,作为一种优选的实施方案,本实施例根据实验数据最终选取为用户网络的低维向量,比包含的信息更加丰富。[0079]作为一种可选的技术方案,本实施例给出通过最终得到的用户网络的低维向量获取目标用户的潜在信息的应用。根据学习到的用户网络低阶向量可以挖掘出目标用户类的潜在信息,从而推荐出所述相关用户的若干密切用户集合,例如图3中每一个圆圈表示一个用户,圆圈中的数值为用户的标号,当我们需要研究相关用户时,例如图3中的用户5,可以根据用户网络低阶向量编码,即图3中左边表示的用户之间的关系,进行数据挖掘,在本实施例中将用户网络低阶向量编码中与相关用户直接相连的用户作为相关用户的接触用户,例如图3中用户1、用户2、用户3、用户4以及用户12,与相关用户的接触用户连接但是与相关用户没有连接的用户作为密切用户,例如图3中用户5、用户11,当进行推荐时,将相关用户的密切用户推荐给相关用户。[0080]本实施例还提出一种基于多粒度融合的异质网络表示装置,包括特征抽取模块、属性补全模块、结构编码器模块、语义编码器模块、有偏对比融合模块、编码融合模块、推荐模块,其中:[0081]特征抽取模块,用于抽取相关用户的内容属性信息;[0082]属性补全模块,用于对相关用户的内容属性进行收集并补全;[0083]结构编码器模块,用于对相关用户的一阶邻居节点进行聚合,融合用户的低阶结构;[0084]语义编码器模块,用于对相关用户的元路径信息进行聚合,融合用户的高阶语义;[0085]有偏对比融合模块,用于进行低阶结构和高阶语义的互补聚合,最终得到用户的低维向量;[0086]推荐模块,用于将用户的低维向量投影到二维坐标系中,将与当前用户的低维向量距离最近的n个用户作为当前用户的同类用户,将同类用户推荐给当前用户。[0087]作为一种可选的实施方式,根据由低维向量计算出的相似度距离推荐相关用户时,采用相关用户与用户vj的欧几里得距离作为相似度距离,表示为:[0088][0089]其中,表示相关用户与用户vj的欧几里得距离;n为低维向量的维度,相关用户的低维向量为(x1,x2,…,xn),用户的低维向量为(y1,y2,…,yn),计算出相关用户与其余所有用户的欧式距离之后,根据此欧式距离从小到大排序,取前n个,即可推荐为相关用户的密切用户。[0090]作为另一种可选的实施方式,根据本技术得到当前用户的同类用户之后,在社交网络中可以将同类用户推荐给当前用户,在购物软件中可以将同类用户购买过的产品推荐给当前用户。[0091]现有的针对于复杂网络分析的研究工作中,大部分讨论的是同质网络的相关情况。但实际生活中的网络数据复杂且千变万化,若将这些网络当做同质网络进行处理,会丢失许多相关数据,异质网络能够更好的描述实际场景中的各个网络。此外,现有技术中,有效提取网络中的邻近结构信息和精准提取网络中的语义信息仍然是一个公开的问题。本实施例还给出一种具体的实施过程:[0092]图3是本发明实施例中的用户网络实施例示意图,假设某社交网站中,用户5为我们的相关用户。他与用户1、2、3、4、12有直接交互,也就是说它们是用户5的接触用户。然后经过多粒度融合的方法后,得到用户网络的低维向量,我们可以发现用户6和用户11与相关用户5虽然没有直接相连,但是却具有有潜在联系,则用户6和用户11可能为相关用户5的密切用户,则在此社交网站中,我们可以依据此对相关用户5做好友推荐。使用本方法具体包括以下步骤:[0093]1.用户节点内容属性收集[0094]在社交网站数据库中获取用户的属性信息和交互信息,如性别、年龄、所在地等。[0095]2.网络建模[0096]根据此社交网站的具体情况,将每个用户作为一个节点,用户之间的交互关系作为边,建立一个异质网络g,这个网络将成为后续的讨论重点。[0097]3.属性补全[0098]由于获取到的节点属性可能不全,如用户1选择隐藏性别和年龄。故根据网络g的拓扑结构,对节点内容属性信息进行补全和预处理,随后才能对网络g中的每个节点进行统一处理。[0099]4.低阶结构编码[0100]用户5存在一阶结构,如1-5,2-5,3-5,4-5,5-12,表示用户1与上述其他用户有直接交互,这里的交互可能为加好友、点赞、聊天等。根据一阶结构,本实施例可以通过低阶结构编码器得到用户5的低阶结构向量。[0101]5.高阶语义编码[0102]以图3为例,用户5存在数条以5为起点的元路径,如5-1-6、5-12-11,这些元路径分别有不同的语义:用户5和用户6有同一个好友用户1,用户5与用户11都关注了用户12等。根据这些元路径,本实施例可以通过高阶语义编码器得到用户5的高阶语义向量。[0103]6.有偏对比融合[0104]根据上述得到用户5的低阶结构向量和高阶语义向量,通过有偏对比融合的方法,对这两种向量进行互补融合,得到用户5的最终向量。对于所有的用户1,2,3,…,n,以同样的方式获得其嵌入低维向量。[0105]7.低维向量应用[0106]根据上述获得的所有用户的低维向量,根据所有用户的低维向量可得知相关用户与其他用户的相似度距离,再根据相似度距离推荐出所述相关用户的若干密切用户集合。随后,根据类似情况,具备潜在关联的n个密切人员会被筛选出来并进行存储;将最后在社交网站后台数据计算服务器中推荐出的n个密切人员,此结果将显示到用户使用界面作为好友推荐的参考。[0107]根据本技术得到当前用户的同类用户之后,在社交网络中可以将同类用户推荐给当前用户,在购物软件中可以将同类用户购买过的产品推荐给当前用户。[0108]尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
一种基于多粒度融合的异质网络中相同类型用户的发现方法及装置 专利技术说明
作者:admin
2022-11-26 10:43:36
225
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术