发布信息

针对数字化智能的用户行为数据挖掘方法及系统与流程

作者:admin      2022-11-02 09:06:34     872



计算;推算;计数设备的制造及其应用技术1.本技术涉及数字化技术领域,尤其涉及一种针对数字化智能的用户行为数据挖掘方法及系统。背景技术:2.数字化智能技术是新一代信息科技(大数据、云计算、人工智能等)互相交叉和紧密结合所形成的综合性技术。其围绕于云服务、实体/虚拟商品、项目生命周期等在线系统集成,从而实现数据信息业务处理的数字化、网络化、智能化。当下,数字化智能不仅涉及智能制造,更涉及数字用户的分析处理。在一些实际的应用领域,相关技术着眼于数字用户的兴趣挖掘分析,但是这类技术所反映出的挖掘精度和可靠性低下一直难以得到有效的改善。技术实现要素:3.本技术的一个目的是提供一种针对数字化智能的用户行为数据挖掘方法及系统。4.本技术的技术方案是通过如下至少部分实施例实现的。5.一种针对数字化智能的用户行为数据挖掘方法,应用于数字化服务系统,所述方法包括:采集待进行挖掘的数字用户行为数据;对所述待进行挖掘的数字用户行为数据进行业务活动知识挖掘,得到所述待进行挖掘的数字用户行为数据的行为活动知识短语;通过所述行为活动知识短语对所述待进行挖掘的数字用户行为数据进行用户兴趣识别,得到关于所述待进行挖掘的数字用户行为数据的基础兴趣事项识别结果;通过所述行为活动知识短语对所述基础兴趣事项识别结果进行校验,得到目标兴趣事项识别结果,并通过所述行为活动知识短语对所述目标兴趣事项识别结果进行兴趣关键词挖掘,确定所述目标兴趣事项识别结果所对应当前用户兴趣事项的兴趣关键词。6.应用于上述实施例,在获取到待进行挖掘的数字用户行为数据的基础上,可以对待进行挖掘的数字用户行为数据进行业务活动知识挖掘。在通过提取得到的行为活动知识短语对待进行挖掘的数字用户行为数据进行用户兴趣识别,得到针对待进行挖掘的数字用户行为数据的基础兴趣事项识别结果。进一步可以通过所述行为活动知识短语对基础兴趣事项识别结果进行校验,并可以通过行为活动知识短语对目标兴趣事项识别结果进行兴趣关键词挖掘,从而确定目标兴趣事项识别结果所对应当前用户兴趣事项的兴趣关键词。本技术可以通过行为活动知识短语进行兴趣事项识别结果的校验,校验得到的兴趣事项识别结果可以尽可能匹配当前用户兴趣事项所对应的行为数据集区间,进而保障兴趣捕捉和检测的精度,在高精度的兴趣捕捉和检测的基础上,能够进一步保障兴趣关键词挖掘的精度和可信度。7.在一些独立的设计思路下,所述方法通过ai机器学习模型执行。8.在一些独立的设计思路下,所述ai机器学习模型包括在先完成配置的知识向量分析子模型,所述通过所述行为活动知识短语对所述基础兴趣事项识别结果进行校验,得到目标兴趣事项识别结果,包括:从所述行为活动知识短语中获得与所述基础兴趣事项识别结果对应的第一目标行为活动知识短语;依据在先完成配置的知识向量分析子模型对所述第一目标行为活动知识短语进行特征误差分析,确定所述基础兴趣事项识别结果对应的相对分布特征误差;通过所述基础兴趣事项识别结果对应的相对分布特征误差对所述基础兴趣事项识别结果进行校验,得到目标兴趣事项识别结果。9.应用于上述实施例,可以依据在先完成配置的知识向量分析子模型实现相对分布特征误差的分析,然后通过基础兴趣事项识别结果及其对应的相对分布特征误差进行兴趣事项识别结果校验,这样能够精准及时地确定出校验结果,进而提高兴趣事项捕捉的精度。10.在一些独立的设计思路下,所述ai机器学习模型还包括第一知识短语分治子模型,所述第一知识短语分治子模型与所述知识向量分析子模型相连;所述依据在先完成配置的知识向量分析子模型对所述第一目标行为活动知识短语进行特征误差分析,确定所述基础兴趣事项识别结果对应的相对分布特征误差,包括:通过所述第一知识短语分治子模型吸收获得的针对每个知识维度的第一局部关注指数对所述第一目标行为活动知识短语进行拆分处理,得到完成拆分的第一目标行为活动知识短语;依据在先完成配置的知识向量分析子模型对所述完成拆分的第一目标行为活动知识短语进行特征误差分析,确定所述基础兴趣事项识别结果对应的相对分布特征误差。11.应用于上述实施例,为保障尽可能精准可靠的特征误差分析,可以在依据第一知识短语分治子模型对第一目标行为活动知识短语进行特征拆分后,再对完成拆分的第一目标行为活动知识短语进行特征误差的分析。鉴于拆分出的第一目标行为活动知识短语更加有助于兴趣事项捕捉,基于此所得到的特征误差的精度也得以保障。12.在一些独立的设计思路下,所述ai机器学习模型包括在先完成配置的朴素贝叶斯子模型,所述通过所述行为活动知识短语对所述目标兴趣事项识别结果进行兴趣关键词挖掘,确定所述目标兴趣事项识别结果所对应当前用户兴趣事项的兴趣关键词,包括:从所述行为活动知识短语中获得与所述目标兴趣事项识别结果对应的第二目标行为活动知识短语;依据在先完成配置的朴素贝叶斯子模型对所述第二目标行为活动知识短语进行兴趣关键词挖掘,确定所述校验当前用户兴趣事项所对应当前用户兴趣事项的兴趣关键词。13.应用于上述实施例,可以依据在先完成配置的朴素贝叶斯子模型对目标兴趣事项识别结果对应的第二目标行为活动知识短语进行兴趣关键词挖掘,从而能够保障兴趣关键词挖掘的时效性,确保兴趣关键词挖掘结果的精度。14.在一些独立的设计思路下,所述ai机器学习模型还包括第二知识短语分治子模型,所述第二知识短语分治子模型与所述朴素贝叶斯子模型相连;所述依据在先完成配置的朴素贝叶斯子模型对所述第二目标行为活动知识短语进行兴趣关键词挖掘,确定所述校验当前用户兴趣事项所对应当前用户兴趣事项的兴趣关键词,包括:通过所述第二知识短语分治子模型吸收获得的针对每个知识维度的第二局部关注指数对所述第二目标行为活动知识短语进行拆分处理,得到完成拆分的第二目标行为活动知识短语;依据在先完成配置的朴素贝叶斯子模型对所述完成拆分的第二目标行为活动知识短语进行兴趣关键词挖掘,确定所述校验当前用户兴趣事项所对应当前用户兴趣事项的兴趣关键词。15.应用于上述实施例,为保障尽可能精准可靠的兴趣关键词挖掘,可以在依据第二知识短语分治子模型对第二目标行为活动知识短语进行特征拆分后,再对完成拆分的第二目标行为活动知识短语进行兴趣关键词挖掘。鉴于拆分出的第二目标行为活动知识短语更有助于进行兴趣关键词挖掘,从而保障确定出的兴趣关键词的精度和可信度。16.在一些独立的设计思路下,依据以下思路配置所述ai机器学习模型:获取示例性数字用户行为数据,以及关于所述示例性数字用户行为数据中的当前用户兴趣事项的兴趣关键词注释;通过所述ai机器学习模型包含的业务活动知识挖掘单元对所述待进行挖掘的数字用户行为数据进行业务活动知识挖掘,得到所述示例性数字用户行为数据的示例性行为活动知识短语,并通过所述示例性行为活动知识短语对所述示例性数字用户行为数据进行用户兴趣识别,得到关于所述示例性数字用户行为数据的示例性基础兴趣事项识别结果;从所述示例性行为活动知识短语中获得与所述示例性基础兴趣事项识别结果对应的第一目标示例性行为活动知识短语,并依据所述ai机器学习模型包含的知识向量分析子模型对所述第一目标示例性行为活动知识短语进行特征误差分析,得到所述知识向量分析子模型生成的相对分布特征误差;通过所述相对分布特征误差以及所述示例性基础兴趣事项识别结果,确定示例性兴趣事项校验结果;以及,从所述示例性行为活动知识短语中获得与所述示例性兴趣事项校验结果对应的第二目标示例性行为活动知识短语,并依据所述ai机器学习模型包含的朴素贝叶斯子模型对所述第二目标示例性行为活动知识短语进行兴趣关键词挖掘,得到所述朴素贝叶斯子模型生成的分析结果;在所述朴素贝叶斯子模型生成的分析结果与关于所述示例性数字用户行为数据中的当前用户兴趣事项的兴趣关键词注释不配对的基础上,对所述ai机器学习模型包含的业务活动知识挖掘单元、知识向量分析子模型、朴素贝叶斯子模型中至少一个的模型变量进行改进,直到满足模型循环配置终止要求。17.应用于上述实施例,依据朴素贝叶斯子模型生成的分析结果与关于所述示例性数字用户行为数据中的当前用户兴趣事项的兴趣关键词注释的匹配结果进行不少于一次的模型配置,使得所配置得到的ai机器学习模型的运行效果尽可能满足实际需求,以便在高精度的兴趣事项捕捉基础上,进行更加准确可靠的兴趣关键词挖掘。18.在一些独立的设计思路下,所述ai机器学习模型还包括与所述知识向量分析子模型相连的第一知识短语分治子模型、以及与所述朴素贝叶斯子模型相连的第二知识短语分治子模型;所述依据所述ai机器学习模型包含的知识向量分析子模型对所述第一目标示例性行为活动知识短语进行特征误差分析,得到所述知识向量分析子模型生成的相对分布特征误差,包括:将所述第一目标示例性行为活动知识短语加载到所述第一知识短语分治子模型,得到所述第一知识短语分治子模型生成的针对每个知识维度的第一局部关注指数;将所述第一目标示例性行为活动知识短语以及所述第一局部关注指数的第一运算结果加载至所述ai机器学习模型包含的知识向量分析子模型,得到所述知识向量分析子模型生成的相对分布特征误差;所述依据所述ai机器学习模型包含的朴素贝叶斯子模型对所述第二目标示例性行为活动知识短语进行兴趣关键词挖掘,得到所述朴素贝叶斯子模型生成的分析结果,包括:将所述第二目标示例性行为活动知识短语加载到所述第二知识短语分治子模型,得到所述第二知识短语分治子模型生成的针对每个知识维度的第二局部关注指数;将所述第二目标示例性行为活动知识短语以及所述第二局部关注指数的第二运算结果加载至所述ai机器学习模型包含的朴素贝叶斯子模型,得到所述朴素贝叶斯子模型生成的分析结果。19.在一些独立的设计思路下,所述第一知识短语分治子模型和所述第二知识短语分治子模型为架构一致的知识短语分治子模型,所述知识短语分治子模型包含按序相连的下采样单元、第一知识映射单元、触发单元以及第二知识映射单元。20.一种数字化服务系统,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现上述方法的处理器。21.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述方法。附图说明22.图1是示出可以实现本技术的实施例的数字化服务系统的一种通信配置的示意图。23.图2是示出可以实现本技术的实施例的针对数字化智能的用户行为数据挖掘方法的流程示意图。24.图3是示出可以实现本技术的实施例的针对数字化智能的用户行为数据挖掘方法的应用环境的架构示意图。具体实施方式25.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。为了使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术作进一步地详细描述,所描述的实施例不应视为对本技术的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。26.图1是示出可以实现本技术的实施例的数字化服务系统100的一种通信配置的框图,数字化服务系统100包括用于存储可执行计算机程序的存储器101,用于执行所述存储器101中存储的可执行计算机程序时实现本技术实施例中针对数字化智能的用户行为数据挖掘方法的处理器102。27.图2是示出可以实现本技术的实施例的针对数字化智能的用户行为数据挖掘方法的流程示意图,针对数字化智能的用户行为数据挖掘方法可以通过图1所示的数字化服务系统100实现,进一步可以包括以下相关步骤所描述的技术方案。28.步骤101:采集待进行挖掘的数字用户行为数据。29.在本技术实施例中,待进行挖掘的数字用户行为数据可以是数字用户端与数字化服务系统进行交互时所产生的用户行为信息。例如:数字用户行为数据可以是跨境电商用户行为数据、虚拟现实用户行为数据等,数字用户行为数据具有一定的分析挖掘价值,能够为后续的业务升级或者大数据推送提供决策依据。30.步骤102:对待进行挖掘的数字用户行为数据进行业务活动知识挖掘,得到待进行挖掘的数字用户行为数据的行为活动知识短语。31.在本技术实施例中,对待进行挖掘的数字用户行为数据进行业务活动知识挖掘可以理解为对待进行挖掘的数字用户行为数据进行业务活动特征挖掘/提取,进而得到行为活动特征向量(比如行为活动知识短语)。此外,行为活动知识短语还可以通过图谱化的知识实体记录,从而提高后续调用处理的效率。32.步骤103:通过行为活动知识短语对待进行挖掘的数字用户行为数据进行用户兴趣识别,得到针对待进行挖掘的数字用户行为数据的基础兴趣事项识别结果。33.在本技术实施例中,在对待进行挖掘的数字用户行为数据进行业务活动特征挖掘/提取之后,通过所得到的行为活动知识短语对待进行挖掘的数字用户行为数据进行用户兴趣定位/用户兴趣识别,得到待进行挖掘的数字用户行为数据的初始用户兴趣捕捉窗口(比如基础兴趣事项识别结果),举例而言,数字用户行为数据可以为文本可视化数据,兴趣事项识别结果可以是文本可视化数据中的其中一部分,也可以是文本可视化数据中的其中一部分对应的映射数据,该映射处理可以根据预设的关系型数据库进行映射访问实现,比如兴趣事项识别结果为文本可视化数据中的数据集a,通过访问关系型数据库确定出数据集a对应的映射数据集a0,然后将映射数据集a0作为基础兴趣事项识别结果。34.步骤104:通过行为活动知识短语对基础兴趣事项识别结果进行校验,得到目标兴趣事项识别结果,并通过行为活动知识短语对目标兴趣事项识别结果进行兴趣关键词挖掘,确定目标兴趣事项识别结果所对应当前用户兴趣事项的兴趣关键词。35.在本技术实施例中,对目标兴趣事项识别结果进行兴趣关键词挖掘可以理解为以行为活动知识短语为参考基准,对基础兴趣事项识别结果进行修正/优化/更新之后,并对所得到的目标兴趣事项识别结果进行用户兴趣类别提取,进而得到当前用户兴趣事项的用户兴趣类别信息(比如兴趣关键词)。36.进一步地,对基础兴趣事项识别结果进行校验,可以是进行位置校验或者内容校验,从而确保目标兴趣事项识别结果的精度和可信度。37.为了便于理解本技术实施例提供的针对数字化智能的用户行为数据挖掘方法,首先对该方法的应用领域进行阐述。本技术实施例提供的针对数字化智能的用户行为数据挖掘方法可以应用于大数据挖掘领域,特别是用户行为分析领域,比如,可以应用于跨境电商服务中的用户服务偏好识别,还可以应用于虚拟现实服务中的用户偏好识别等。38.发明人经研究和分析发现,相关技术的用户兴趣分析思路如下:对于用户行为数据,经过相关ai模型(比如通过残差网络)提取特征,然后基于分类器模型可以得到相关的兴趣事项识别结果。但是发明人经进一步分析发现,上述方案难以保障兴趣挖掘分析的精度,且容易影响ai模型的运行状态,基于此,本技术实施例提供了一种通过兴趣事项识别结果校验进行拆分识别的针对数字化智能的用户行为数据挖掘方法,以显著提高识别结果(兴趣挖掘分析)的准确性及可信度。39.在本技术实施例中,通过不同的应用领域,这里所获取的待进行挖掘的数字用户行为数据也存在差异。在确定需要对待进行挖掘的数字用户行为数据进行用户兴趣识别的基础上,可先对待进行挖掘的数字用户行为数据进行业务活动知识挖掘,然后通过提取得到的待进行挖掘的数字用户行为数据的行为活动知识短语对待进行挖掘的数字用户行为数据进行用户兴趣识别,从而得到针对待进行挖掘的数字用户行为数据的基础兴趣事项识别结果。40.进一步地,在得到基础兴趣事项识别结果的基础上,可以通过行为活动知识短语对基础兴趣事项识别结果进行校验,使得所得到的目标兴趣事项识别结果能够尽可能精准的匹配包含到待进行挖掘的数字用户行为数据中的当前用户兴趣事项,在此基础上,再对目标兴趣事项识别结果进行兴趣关键词挖掘,能够进一步保障兴趣关键词挖掘的精度和可信度。41.在具体实施时,可以是依据比如残差网络来提取相关待进行挖掘的数字用户行为数据的行为活动知识短语,此外,还可以通过其他数字用户行为挖掘思路得到有关待进行挖掘的数字用户行为数据的行为活动知识短语。鉴于通过残差网络进行业务活动知识挖掘时能够挖掘出更加完整的行为活动知识短语,鉴于此,本技术实施例可以采用通过残差网络进行业务活动知识挖掘。42.对于提取得到的行为活动知识短语而言,本技术实施例首先可以进行冷门兴趣关键词的用户兴趣识别,可以得到基础兴趣事项识别结果。有关基础兴趣事项识别结果所选择的当前用户兴趣事项是无法辨别兴趣关键词的,在具体实施时,可以依据量化分析策略来实现相关无差别的识别。43.鉴于在较少模型训练示例的条件下,一些兴趣事项识别结果所对应数据可能对关键词区分单元的运行状态会造成干扰,因此,本技术实施例提出了一种通过关键词向量强化的数字化用户兴趣识别技术,该技术在得到基础兴趣事项识别结果的基础上,可以先对基础兴趣事项识别结果进行校验,在得到目标兴趣事项识别结果的基础上,再依据目标兴趣事项识别结果所对应的部分行为活动知识短语进行兴趣关键词挖掘,以提高所确定兴趣关键词的精度。44.鉴于兴趣事项识别结果校验以及兴趣关键词挖掘对于本技术实施例所提供的针对数字化智能的用户行为数据挖掘方法的显著贡献,因此可能结合以下两个方面对以上两个过程进行阐述。45.第一方面,本技术实施例可以依据以下思路进行兴趣事项识别结果校验,具体可以包括步骤201-步骤203所记录的内容。46.步骤201:从行为活动知识短语中获得与基础兴趣事项识别结果对应的第一目标行为活动知识短语。47.步骤202:依据在先完成配置的知识向量分析子模型对第一目标行为活动知识短语进行特征误差分析,确定基础兴趣事项识别结果对应的相对分布特征误差。48.步骤203:通过基础兴趣事项识别结果对应的相对分布特征误差对基础兴趣事项识别结果进行校验,得到目标兴趣事项识别结果。49.在本技术实施例中,可先从整个待进行挖掘的数字用户行为数据的行为活动知识短语中获得出与基础兴趣事项识别结果对应的第一目标行为活动知识短语,该第一目标行为活动知识短语作为部分行为活动知识短语,可以实现之后更加准确的用户兴趣锁定。50.可以理解的是,以上有关第一目标行为活动知识短语的获得过程可以是通过专家系统神经网络(比如图卷积神经网络)所对应的知识短语选择处理实现的,本技术实施例在此不作过多描述。51.在本技术实施例中,可以先通过一个完成配置的知识向量分析子模型(例如:回归模型),得到基础兴趣事项识别结果对应的相对分布特征误差,然后依据该相对分布特征误差对基础兴趣事项识别结果进行校验处理,得到目标兴趣事项识别结果。进一步地,相对分布特征误差用于指示的是目标兴趣事项识别结果相对于基础兴趣事项识别结果的特征误差(特征偏移差),特征误差越大,表明基础分析结果越不精准,否则,特征误差越小,表明基础分析结果更为精准。在具体实施时,可以通过基础兴趣事项识别结果所对应多个窗口标识的基础分布特征与相对分布特征误差之间进行全局处理(比如加权求和),来确定目标兴趣事项识别结果所对应的数据集区域,该数据集区域可以用于进行更加精准的用户兴趣锁定。52.第二方面,本技术实施例可以依据以下思路进行兴趣关键词挖掘,具体可以包括如下步骤301和步骤302所记录的内容。53.步骤301:从行为活动知识短语中获得与目标兴趣事项识别结果对应的第二目标行为活动知识短语。54.步骤302:依据在先完成配置的朴素贝叶斯子模型对第二目标行为活动知识短语进行兴趣关键词挖掘,确定校验当前用户兴趣事项所对应当前用户兴趣事项的兴趣关键词。55.在本技术实施例中,可先从整个待进行挖掘的数字用户行为数据的行为活动知识短语中获得出与目标兴趣事项识别结果对应的第二目标行为活动知识短语,该第二目标行为活动知识短语作为部分行为活动知识短语,可以实现之后更加准确及全面的兴趣关键词挖掘。56.可以理解的是,有关第二目标行为活动知识短语的获得过程也可以是通过专家系统神经网络所对应的知识短语选择处理实现的,本技术实施例在此不作过多描述。57.在本技术实施例中,再通过一次捕捉处理校验兴趣事项识别结果所对应的分布区域的基础上,可以通过目标兴趣事项识别结果提取出该兴趣事项识别结果对应的部分行为活动知识短语,然后对关键词区分单元(比如:分类器)用该部分行为活动知识短语进行用户兴趣识别。58.鉴于对于朴素贝叶斯子模型侧重于注意导入知识短语中的特征要素(比如场景要素、需求要素等)来区分类似的知识,而对于知识向量分析子模型则侧重于注意导入知识短语中的整体化知识(比如当前用户兴趣事项的事项知识概括)来确定兴趣关键词的分布,而通过不同的期望,所需获得的知识短语存在差异,因此,如果基于相关技术采用相同知识短语的基础上,将造成关键词分析质量差的问题,还难以保证用户兴趣识别的准确度。59.为了一并满足划分与识别的二重需求,本技术实施例提供了一种知识短语拆分单元以实现知识短语的拆分/重构处理。其中,知识短语拆分单元可以包括与知识向量分析子模型相连的第一知识短语分治子模型(可以理解为特征解耦层)、以及与朴素贝叶斯子模型相连的第二知识短语分治子模型。进一步地,两个知识短语分治子模型(比如:第一知识短语分治子模型和第二知识短语分治子模型)可以携带相同的模型架构,比如,可以包含按序相连的下采样单元、第一知识映射单元、触发单元以及第二知识映射单元。在实际应用时,可以对导入知识短语进行整体化下采样处理,然后吸收一个向量映射,在通过一个触发单元之后,再吸收另一个向量映射,最后得到经由局部关注策略更新后的知识短语。其中,ai模型在运行过程中可以不断地进行吸收和学习,从而提高模型性能。60.本技术实施例中,可以通过第一知识短语分治子模型的局部关注策略对用户兴趣锁定处理的第一目标行为活动知识短语进行调整,使其更匹配向量处理需求,同样可以使用第二知识短语分治子模型的局部关注策略对进行用户兴趣识别的第二目标行为活动知识短语进行调整,使其更匹配兴趣关键词挖掘需求,从而能够权衡不同的需求,避免对相关神经网络模型造成干扰。61.在本技术实施例中,针对导入的待进行挖掘的数字用户行为数据而言,可以通过残差网络获取到相关待进行挖掘的数字用户行为数据的行为活动知识短语,通过该行为活动知识短语可以确定基础兴趣事项识别结果。然后在专家系统神经网络阶段,根据基础兴趣事项识别结果在数字用户行为数据的分布,确定出对应的兴趣事项识别结果对应的知识向量(对应第一目标行为活动知识短语)以及根据目标兴趣事项识别结果在数字用户行为数据中的分布,确定出对应的兴趣事项识别结果特征(对应第二目标行为活动知识短语),通过一轮滑动平均(卷积处理)处理之后,便可以依据两个知识短语拆分单元(知识解耦模块),分别实现相关第一目标行为活动知识短语的全局处理以及相关第二目标行为活动知识短语的全局处理,依据知识短语校验单元(知识修正模块)可以在确保用户兴趣锁定精度的基础上,进而提高用户兴趣识别的准确性。62.进一步地,两个知识短语拆分单元对应两个知识短语分治子模型,知识短语校验单元则主要包括有知识向量分析子模型(比如回归网络)以及朴素贝叶斯子模型(比如分类网络),其中,通过知识向量分析子模型可以确定对应的目标兴趣事项识别结果,最后可以得到所选择的用户兴趣识别结果。63.可以理解的是,有关知识短语校验单元还可以包括另外的模型配置,比如,可以在知识向量分析子模型之后直接相连有朴素贝叶斯子模型,这是朴素贝叶斯子模型对应的可以是有关基础兴趣事项识别结果的目标代价评价指标;比如,可以在目标兴趣事项识别结果之后直接相连有知识向量分析子模型,这时知识向量分析子模型可以对应的是有关兴趣事项识别结果之间的目标代价评价指标(损失函数)。64.为了便于进行模型配置,上述业务活动知识挖掘单元、知识向量分析子模型、朴素贝叶斯子模型、第一知识短语分治子模型以及第二知识短语分治子模型都可以作为ai机器学习模型的组成部分,在具体实施时,可以依据以下思路进行模型配置,可以包括步骤401-步骤405所记录的内容。65.步骤401:获取示例性数字用户行为数据,以及针对示例性数字用户行为数据中的当前用户兴趣事项的兴趣关键词注释。66.在本技术实施例中,示例性数字用户行为数据可以理解的是数字用户行为数据样本。兴趣关键词注释可以理解的是类别标注结果。67.步骤402:通过ai机器学习模型包含的业务活动知识挖掘单元对待进行挖掘的数字用户行为数据进行业务活动知识挖掘,得到示例性数字用户行为数据的示例性行为活动知识短语,并通过示例性行为活动知识短语对示例性数字用户行为数据进行用户兴趣识别,得到针对示例性数字用户行为数据的示例性基础兴趣事项识别结果。68.在本技术实施例中,示例性行为活动知识短语可以理解为业务活动知识挖掘单元(可以理解为业务活动特征挖掘层)对待进行挖掘的数字用户行为数据进行业务活动特征挖掘后所得到的行为活动样本特征。示例性基础兴趣事项识别结果可以理解为初始样本兴趣事项识别指标。69.步骤403:从示例性行为活动知识短语中获得与示例性基础兴趣事项识别结果对应的第一目标示例性行为活动知识短语,并依据ai机器学习模型包含的知识向量分析子模型对第一目标示例性行为活动知识短语进行特征误差分析,得到知识向量分析子模型生成的相对分布特征误差。70.步骤404:通过相对分布特征误差以及示例性基础兴趣事项识别结果,确定示例性兴趣事项校验结果;以及,从示例性行为活动知识短语中获得与示例性兴趣事项校验结果对应的第二目标示例性行为活动知识短语,并依据ai机器学习模型包含的朴素贝叶斯子模型对第二目标示例性行为活动知识短语进行兴趣关键词挖掘,得到朴素贝叶斯子模型生成的分析结果。71.步骤405:在朴素贝叶斯子模型生成的分析结果与针对示例性数字用户行为数据中的当前用户兴趣事项的兴趣关键词注释不配对的基础上,对ai机器学习模型包含的业务活动知识挖掘单元、知识向量分析子模型、朴素贝叶斯子模型中至少一个的模型变量进行改进,直到满足模型循环配置终止要求。72.在本技术实施例中,可以通过与用户兴趣识别类似的步骤先进行业务活动知识挖掘以进行有关基础兴趣事项识别结果的确定。之后可以依据知识向量分析子模型对第一目标示例性行为活动知识短语进行特征误差分析,并可以通过相对分布特征误差以及示例性基础兴趣事项识别结果,确定示例性兴趣事项校验结果。最后,在依据朴素贝叶斯子模型对第二目标示例性行为活动知识短语进行兴趣关键词挖掘,得到朴素贝叶斯子模型生成的分析结果的基础上,可以通过朴素贝叶斯子模型生成的分析结果与针对示例性数字用户行为数据中的当前用户兴趣事项的兴趣关键词注释匹配结果进行模型配置。73.进一步地,在朴素贝叶斯子模型生成的分析结果与针对示例性数字用户行为数据中的当前用户兴趣事项的兴趣关键词注释不配对的基础上,表明模型配置效果不佳,这时可以通过多组模型配置来提高模型配置效果,直到满足模型循环配置终止要求的基础上,可以终止配置,得到完成配置的ai机器学习模型。74.在本技术实施例中,模型循环配置终止要求可以是循环轮数满足设定轮数(比如,24轮),还可以是所有的示例性数字用户行为数据被访问一遍,还可以是目标代价评价指标小于设定判定值,还可以是其它要求,本技术实施例可以结合不同的应用条件来获得,本技术实施例在此不做过多限定。75.进一步地,在配置ai机器学习模型的过程中,有关与知识向量分析子模型相连的第一知识短语分治子模型、以及与朴素贝叶斯子模型相连的第二知识短语分治子模型也可以一并进行配置,以使得所提取出的局部关注指数更匹配实际的指令,比如,所确定的相关第一局部关注指数更倾向于整体事件特征等相关行为活动知识短语,比如,所确定的相关第二局部关注指数更倾向于局部事件特征等相关行为活动知识短语,从而保障不同特征处理任务的并行运行。76.在一些可独立的设计思路下,在确定出所述当前用户兴趣事项的兴趣关键词之后,该方法还包括如下内容:基于所述兴趣关键词进行大数据推荐匹配处理。77.举例而言,大数据推荐匹配处理可以理解为查询与所述兴趣关键词对应的目标推送信息,然后将目标推送信息与兴趣关键词进行关联存储,便于后续进行精准可靠的大数据推荐。78.在一些可独立的设计思路下,该方法还包括如下内容:响应于目标服务商系统的数据推荐请求,从所述目标推送信息中确定与所述数据推荐请求匹配的待推送信息;将所述待推送信息推送给所述兴趣关键词对应的数字用户端。79.如此设计,基于数据推荐请求可以进行针对性的推送信息定向捕捉,从而进一步提高信息推荐的针对性和准确性。80.在一些可独立的设计思路下,响应于目标服务商系统的数据推荐请求,从所述目标推送信息中确定与所述数据推荐请求匹配的待推送信息,可以包括如下内容:结合数据推荐请求以及联动分析策略对目标推送信息进行信息提取,得到待推送信息。81.在一些可独立的设计思路下,结合数据推荐请求以及联动分析策略对目标推送信息进行信息提取,得到待推送信息,可以包括如下内容:结合数据推荐请求获取所述目标推送信息的推送要素数据集合,其中,所述推送要素数据集合包括存在关联的k组推送要素数据,所述k为大于或等于1的整数;根据所述推送要素数据集合获取反馈要素数据集合,其中,所述反馈要素数据集合包括存在关联的k组反馈要素数据;基于所述推送要素数据集合,通过推送要素挖掘算法所涵盖的第一需求分析模块获取推送要素需求字段集合,其中,所述推送要素需求字段集合包括k个推送要素需求字段;基于所述反馈要素数据集合,通过所述推送要素挖掘算法所涵盖的第二需求分析模块获取反馈要素需求字段集合,其中,所述反馈要素需求字段集合包括k个反馈要素需求字段;基于所述推送要素需求字段集合以及所述反馈要素需求字段集合,通过所述推送要素挖掘算法所涵盖的分类模块获取所述推送要素数据所对应的差异化标签;根据所述差异化标签确定所述推送要素数据集合的推荐项目定位结果;基于所述数据推荐请求从所述推荐项目定位结果中确定候选推荐项目,并结合所述候选推荐项目从所述目标推送信息中提取待推送信息。82.举例而言,推送要素可以理解为推送细节或者推送特征,推送要素需求字段用于反映用户的推送需求或者偏好,而反馈要素可以作为推送要素的辅助分析特征,用于表征用户对推送结果的反馈表达或者体验。基于此,能够结合所述推送要素需求字段集合以及所述反馈要素需求字段集合准确确定推送要素数据所对应的差异化标签(分类标签),然后实现对推送要素数据集合的推荐项目定位结果的确定,从而结合数据推荐请求快速确定候选推荐项目,并依据候选推荐项目的目录特征从目标推送信息中精准提取待推送信息。83.在一些可独立的设计思路下,所述基于所述推送要素需求字段集合以及所述反馈要素需求字段集合,通过所述推送要素挖掘算法所涵盖的分类模块获取所述推送要素数据集合所对应的差异化标签,包括:基于所述推送要素需求字段集合,通过所述推送要素挖掘算法所涵盖的第一深度残差模块获取k个第一要素描述数组,其中,每个第一要素描述数组对应于一个推送要素需求字段;基于所述反馈要素需求字段集合,通过所述推送要素挖掘算法所涵盖的第二深度残差模块获取k个第二要素描述数组,其中,每个第二要素描述数组对应于一个反馈要素需求字段;对所述k个第一要素描述数组以及所述k个第二要素描述数组进行拼接处理,得到k个目标要素描述数组,其中,每个目标要素描述数组包括一个第一要素描述数组以及一个第二要素描述数组;基于所述k个目标要素描述数组,通过所述推送要素挖掘算法所涵盖的所述分类模块获取所述推送要素数据集合所对应的差异化标签。84.在一些可独立的设计思路下,所述基于所述推送要素需求字段集合,通过所述推送要素挖掘算法所涵盖的第一深度残差模块获取k个第一要素描述数组,包括:针对所述推送要素需求字段集合中的每组推送要素需求字段,通过所述第一深度残差模块所涵盖的局部下采样模块获取第一局部下采样需求字段,其中,所述第一深度残差模块属于所述推送要素挖掘算法;针对所述推送要素需求字段集合中的每组推送要素需求字段,通过所述第一深度残差模块所涵盖的全局下采样模块获取第一全局下采样需求字段;针对所述推送要素需求字段集合中的每组推送要素需求字段,基于所述第一局部下采样需求字段以及所述第一全局下采样需求字段,通过所述第一深度残差模块所涵盖的滑动平均模块获取第一融合需求字段;针对所述推送要素需求字段集合中的每组推送要素需求字段,基于所述第一融合需求字段以及所述推送要素需求字段,通过所述第一深度残差模块所涵盖的第一全局下采样模块获取第一要素描述数组。85.在一些可独立的设计思路下,所述基于所述反馈要素需求字段集合,通过所述推送要素挖掘算法所涵盖的第二深度残差模块获取k个第二要素描述数组,包括:针对所述反馈要素需求字段集合中的每组反馈要素需求字段,通过所述第二深度残差模块所涵盖的局部下采样模块获取第二局部下采样需求字段,其中,所述第二深度残差模块属于所述推送要素挖掘算法;针对所述反馈要素需求字段集合中的每组反馈要素需求字段,通过所述第二深度残差模块所涵盖的全局下采样模块获取第二全局下采样需求字段;针对所述反馈要素需求字段集合中的每组反馈要素需求字段,基于所述第二局部下采样需求字段以及所述第二全局下采样需求字段,通过所述第二深度残差模块所涵盖的滑动平均模块获取第二融合需求字段;针对所述反馈要素需求字段集合中的每组反馈要素需求字段,基于所述第二融合需求字段以及所述反馈要素需求字段,通过所述第二深度残差模块所涵盖的第二全局下采样模块获取第二要素描述数组。86.在一些可独立的设计思路下,所述k为大于1的整数;所述基于所述k个目标要素描述数组,通过所述推送要素挖掘算法所涵盖的所述分类模块获取所述推送要素数据集合所对应的差异化标签,包括:基于所述k个目标要素描述数组,通过所述推送要素挖掘算法所涵盖的长短期记忆模块获取融合要素描述数组,其中,所述融合要素描述数组为根据所述k个目标要素描述数组以及k个时域优先级确定的,每个目标要素描述数组对应于一个时域优先级;基于所述融合要素描述数组,通过所述推送要素挖掘算法所涵盖的所述分类模块获取所述推送要素数据集合所对应的差异化标签。87.在一些可独立的设计思路下,所述基于所述k个目标要素描述数组,通过所述推送要素挖掘算法所涵盖的长短期记忆模块获取融合要素描述数组,包括:基于所述k个目标要素描述数组,通过所述长短期记忆模块所涵盖的第一分治处理单元获取k个第一分治要素描述数组,其中,所述长短期记忆模块属于所述推送要素挖掘算法;基于所述k个第一分治要素描述数组,通过所述长短期记忆模块所涵盖的第二分治处理单元获取k个第二分治要素描述数组;根据所述k个第二分治要素描述数组确定k个时域优先级,其中,每个时域优先级对应于一个目标要素描述数组;根据所述k个目标要素描述数组以及k个时域优先级,确定所述融合要素描述数组。88.图3是示出可以实现本技术的实施例的针对数字化智能的用户行为数据挖掘方法的应用环境的架构示意图,针对数字化智能的用户行为数据挖掘方法的应用环境中可以包括互相通信的数字化服务系统100和数字化用户端200。基于此,数字化服务系统100和数字化用户端200在运行时实现或者部分实现本技术实施例的针对数字化智能的用户行为数据挖掘方法。89.以上所述,仅为本技术的较佳实施例而已,并非用于限定本技术的保护范围。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部