计算;推算;计数设备的制造及其应用技术1.本技术涉及数据处理技术领域,具体而言,涉及一种数据推测方法及装置。背景技术:2.目前,随着科学技术的不断发展,越来越多的电子产品已融入人们的日常生活,为人们提供舒适便捷的生活方式。因此,商家在进行产品生产、销售及售后服务的过程中,通常会记录客户数据。在对客户的画像数据收集不完整的情况下,如果客户数据覆盖率不足时,数据分析人员需要进行挖掘建模,采用固定值、均值或者众数进行缺失数据推测,该方法不够灵活,无法不能捕获最新样本变化的趋势,容易受极端异常波动影响。技术实现要素:3.本技术实施例的目的在于提供一种数据推测方法及装置,能够基于客户画像相似度进行缺失数据推测,更加贴合业务逻辑,灵活性好,能捕获最新样本变化的趋势,且不容易受极端异常波动影响。4.本技术实施例第一方面提供了一种数据推测方法,包括:5.获取当前存储的已有客户数据;6.根据所述已有客户数据绘制每个客户的客户画像;7.根据所述客户画像计算两两客户之间的目标相似度;8.根据所述目标相似度和所述已有客户数据,构建相似客户群数据库;9.确定待推测客户;10.通过所述相似客户群数据库推测所述待推测客户的客户数据。11.在上述实现过程中,该方法可以优先获取当前存储的已有客户数据;并根据已有客户数据绘制每个客户的客户画像;然后,再根据客户画像计算两两客户之间的目标相似度;再后,根据目标相似度和已有客户数据,构建相似客户群数据库;最后,再确定待推测客户;并通过相似客户群数据库推测待推测客户的客户数据。可见,该方法能够基于客户画像相似度进行缺失数据推测,更加贴合业务逻辑,灵活性好,能捕获最新样本变化的趋势,且不容易受极端异常波动影响。12.进一步地,所述根据所述已有客户数据绘制每个客户的客户画像,包括:13.根据预设维度对所述已有客户数据进行划分,得到每个客户对应的多维度数据;14.对所述多维度数据进行归一化分值处理,得到每个客户的多维向量;15.根据所述多维向量生成每个客户的客户画像。16.进一步地,所述根据所述客户画像计算两两客户之间的目标相似度,包括:17.遍历所述客户画像,得到遍历数据;18.根据所述遍历数据和预设的余弦相似算法计算两两客户之间的目标相似度。19.进一步地,所述通过所述相似客户群数据库推测所述待推测客户的客户数据,包括:20.确定所述待推测客户的缺失数据维度;21.获取所述待推测客户的现有客户数据;22.根据所述现有客户数据和所述相似客户群数据库,确定待补充数据;23.将所述待补充数据补充至所述现有客户数据中,得到所述待推测客户的客户数据。24.进一步地,所述根据所述现有客户数据和所述相似客户群数据库,确定待补充数据,包括;25.根据所述现有客户数据从所述相似客户群数据库中确定最相似客户;26.获取所述最相似客户的目标客户数据;27.根据所述目标客户数据和所述缺失数据维度确定待补充数据。28.本技术实施例第二方面提供了一种数据推测装置,所述数据推测装置包括:29.获取单元,用于获取当前存储的已有客户数据;30.画像绘制单元,用于根据所述已有客户数据绘制每个客户的客户画像;31.计算单元,用于根据所述客户画像计算两两客户之间的目标相似度;32.构建单元,用于根据所述目标相似度和所述已有客户数据,构建相似客户群数据库;33.确定单元,用于确定待推测客户;34.推测单元,用于通过所述相似客户群数据库推测所述待推测客户的客户数据。35.在上述实现过程中,该装置可以通过获取单元获取当前存储的已有客户数据;通过画像绘制单元来根据已有客户数据绘制每个客户的客户画像;通过计算单元来根据客户画像计算两两客户之间的目标相似度;通过构建单元来根据目标相似度和已有客户数据,构建相似客户群数据库;通过确定单元确定待推测客户;再通过推测单元通过相似客户群数据库推测待推测客户的客户数据。可见,该装置能够基于客户画像相似度进行缺失数据推测,更加贴合业务逻辑,灵活性好,能捕获最新样本变化的趋势,且不容易受极端异常波动影响。36.进一步地,所述画像绘制单元包括:37.划分子单元,用于根据预设维度对所述已有客户数据进行划分,得到每个客户对应的多维度数据;38.处理子单元,用于对所述多维度数据进行归一化分值处理,得到每个客户的多维向量;39.生成子单元,用于根据所述多维向量生成每个客户的客户画像。40.进一步地,所述计算单元包括:41.遍历子单元,用于遍历所述客户画像,得到遍历数据;42.计算子单元,用于根据所述遍历数据和预设的余弦相似算法计算两两客户之间的目标相似度。43.进一步地,所述推测单元包括:44.确定子单元,用于确定所述待推测客户的缺失数据维度;45.获取子单元,用于获取所述待推测客户的现有客户数据;46.所述确定子单元,还用于根据所述现有客户数据和所述相似客户群数据库,确定待补充数据;47.补充子单元,用于将所述待补充数据补充至所述现有客户数据中,得到所述待推测客户的客户数据。48.进一步地,所述确定子单元包括;49.确定模块,用于根据所述现有客户数据从所述相似客户群数据库中确定最相似客户;50.获取模块,用于获取所述最相似客户的目标客户数据;51.所述确定模块,还用于根据所述目标客户数据和所述缺失数据维度确定待补充数据。52.本技术实施例第三方面提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行本技术实施例第一方面中任一项所述的数据推测方法。53.本技术实施例第四方面提供了一种计算机可读存储介质,其存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行本技术实施例第一方面中任一项所述的数据推测方法。附图说明54.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。55.图1为本技术实施例提供的一种数据推测方法的流程示意图;56.图2为本技术实施例提供的另一种数据推测方法的流程示意图;57.图3为本技术实施例提供的一种数据推测装置的结构示意图;58.图4为本技术实施例提供的另一种数据推测装置的结构示意图;59.图5为本技术实施例提供的一种客户的六维向量示意图;60.图6为本技术实施例提供的一种客户关系多维空间网络示意图。具体实施方式61.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述。62.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。63.实施例164.请参看图1,图1为本实施例提供了一种数据推测方法的流程示意图。其中,该数据推测方法包括:65.s101、获取当前存储的已有客户数据。66.s102、根据已有客户数据绘制每个客户的客户画像。67.s103、根据客户画像计算两两客户之间的目标相似度。68.s104、根据目标相似度和已有客户数据,构建相似客户群数据库。69.s105、确定待推测客户。70.s106、通过相似客户群数据库推测待推测客户的客户数据。71.本实施例中,该方法的执行主体可以为计算机、服务器等计算装置,对此本实施例中不作任何限定。72.在本实施例中,该方法的执行主体还可以为智能手机、平板电脑等智能设备,对此本实施例中不作任何限定。73.可见,实施本实施例所描述的数据推测方法,能够将推荐算法中的冷启动思路,应用在客户缺失值填充中,从而使得其能够应用在产品推荐、客户价值测算、发展潜力测算、风险态势感知等场景当中,从而有效的提高该方法的普遍适应能力。同时从技术角度出发,该方法能够基于客户画像相似度的缺失特征填充,从而使得其更加贴合业务逻辑,兼顾科学与可解释性。具体的,该方法能够确定各维度指标权重,从而使得数据加工公正透明,进而使其更加贴合业务逻辑,更加容易解释推广;同时,该方法还能够使得更简单的被执行,并易于对特征进行理解,由于打开机器学习算法的黑盒,还能够让非it专业的业务运营人员也能理解、接收并参与到项目建设中,进而使得该方法落地便可执行,也更加容易进行迭代优化。74.实施例275.请参看图2,图2为本实施例提供了一种数据推测方法的流程示意图。其中,该数据推测方法包括:76.s201、获取当前存储的已有客户数据。77.s202、根据预设维度对已有客户数据进行划分,得到每个客户对应的多维度数据。78.s203、对多维度数据进行归一化分值处理,得到每个客户的多维向量。79.s204、根据多维向量生成每个客户的客户画像。80.s205、遍历客户画像,得到遍历数据。81.s206、根据遍历数据和预设的余弦相似算法计算两两客户之间的目标相似度。82.s207、根据目标相似度和已有客户数据,构建相似客户群数据库。83.s208、确定待推测客户。84.s209、确定待推测客户的缺失数据维度。85.s210、获取待推测客户的现有客户数据。86.s211、根据现有客户数据从相似客户群数据库中确定最相似客户。87.s212、获取最相似客户的目标客户数据。88.s213、根据目标客户数据和缺失数据维度确定待补充数据。89.s214、将待补充数据补充至现有客户数据中,得到待推测客户的客户数据。90.本实施例中,该方法提供了一种应用于金融领域的基于客户画像相似度的特征填充方法。举例来说,该方法可以包括以下多个步骤:91.第一步:该方法可以利用已有客户数据信息绘制客户画像,将同业大数据的600+客户标签划分为六大维度,首先计算出各个维度的归一化分值,得到每个客户的六维向量(可参阅图5)。92.其中,数据样例:{value_a1,value_a2,value_a3,value_a4,value_a5,value_a6}。93.第二步:在六维向量数据基础上,遍历计算出客户两两之间的相似度。94.具体的,该方法可以选用如下的余弦相似算法。[0095][0096]可见,该方法能够通过已知维度数据,计算客户相似度;还能够利用已知相似客户群的数据,推测未知客户/新客户的信息。[0097]本实施例中,该方法对应用场景进行举例如下:[0098](1)当客户a的部分数据缺失时,将与客户a相似度数值最高的客户b数据填充赋值给a;[0099](2)如果能够获得同业机构客户的亲缘联系,还可以基于2度关联进行延伸拓展提升,绘制客户关系多维空间网络(如图6所示)。[0100]本实施例中,该方法的执行主体可以为计算机、服务器等计算装置,对此本实施例中不作任何限定。[0101]在本实施例中,该方法的执行主体还可以为智能手机、平板电脑等智能设备,对此本实施例中不作任何限定。[0102]可见,实施本实施例所描述的数据推测方法,能够将推荐算法中的冷启动思路,应用在客户缺失值填充中,从而使得其能够应用在产品推荐、客户价值测算、发展潜力测算、风险态势感知等场景当中,从而有效的提高该方法的普遍适应能力。同时从技术角度出发,该方法能够基于客户画像相似度的缺失特征填充,从而使得其更加贴合业务逻辑,兼顾科学与可解释性。具体的,该方法能够确定各维度指标权重,从而使得数据加工公正透明,进而使其更加贴合业务逻辑,更加容易解释推广;同时,该方法还能够使得更简单的被执行,并易于对特征进行理解,由于打开机器学习算法的黑盒,还能够让非it专业的业务运营人员也能理解、接收并参与到项目建设中,进而使得该方法落地便可执行,也更加容易进行迭代优化。[0103]实施例3[0104]请参看图3,图3为本实施例提供的一种数据推测装置的结构示意图。如图3所示,该数据推测装置包括:[0105]获取单元310,用于获取当前存储的已有客户数据;[0106]画像绘制单元320,用于根据已有客户数据绘制每个客户的客户画像;[0107]计算单元330,用于根据客户画像计算两两客户之间的目标相似度;[0108]构建单元340,用于根据目标相似度和已有客户数据,构建相似客户群数据库;[0109]确定单元350,用于确定待推测客户;[0110]推测单元360,用于通过相似客户群数据库推测待推测客户的客户数据。[0111]本实施例中,对于数据推测装置的解释说明可以参照实施例1或实施例2中的描述,对此本实施例中不再多加赘述。[0112]可见,实施本实施例所描述的数据推测装置,能够将推荐算法中的冷启动思路,应用在客户缺失值填充中,从而使得其能够应用在产品推荐、客户价值测算、发展潜力测算、风险态势感知等场景当中,从而有效的提高该装置的普遍适应能力。同时从技术角度出发,该装置能够基于客户画像相似度的缺失特征填充,从而使得其更加贴合业务逻辑,兼顾科学与可解释性。具体的,该装置能够确定各维度指标权重,从而使得数据加工公正透明,进而使其更加贴合业务逻辑,更加容易解释推广;同时,该装置还能够使得更简单的被执行,并易于对特征进行理解,由于打开机器学习算法的黑盒,还能够让非it专业的业务运营人员也能理解、接收并参与到项目建设中,进而使得该装置落地便可执行,也更加容易进行迭代优化。[0113]实施例4[0114]请参看图4,图4为本实施例提供的一种数据推测装置的结构示意图。如图4所示,该数据推测装置包括:[0115]获取单元310,用于获取当前存储的已有客户数据;[0116]画像绘制单元320,用于根据已有客户数据绘制每个客户的客户画像;[0117]计算单元330,用于根据客户画像计算两两客户之间的目标相似度;[0118]构建单元340,用于根据目标相似度和已有客户数据,构建相似客户群数据库;[0119]确定单元350,用于确定待推测客户;[0120]推测单元360,用于通过相似客户群数据库推测待推测客户的客户数据。[0121]作为一种可选的实施方式,画像绘制单元320包括:[0122]划分子单元321,用于根据预设维度对已有客户数据进行划分,得到每个客户对应的多维度数据;[0123]处理子单元322,用于对多维度数据进行归一化分值处理,得到每个客户的多维向量;[0124]生成子单元323,用于根据多维向量生成每个客户的客户画像。[0125]作为一种可选的实施方式,计算单元330包括:[0126]遍历子单元331,用于遍历客户画像,得到遍历数据;[0127]计算子单元332,用于根据遍历数据和预设的余弦相似算法计算两两客户之间的目标相似度。[0128]作为一种可选的实施方式,推测单元360包括:[0129]确定子单元361,用于确定待推测客户的缺失数据维度;[0130]获取子单元362,用于获取待推测客户的现有客户数据;[0131]确定子单元361,还用于根据现有客户数据和相似客户群数据库,确定待补充数据;[0132]补充子单元363,用于将待补充数据补充至现有客户数据中,得到待推测客户的客户数据。[0133]作为一种可选的实施方式,确定子单元361包括;[0134]确定模块,用于根据现有客户数据从相似客户群数据库中确定最相似客户;[0135]获取模块,用于获取最相似客户的目标客户数据;[0136]确定模块,还用于根据目标客户数据和缺失数据维度确定待补充数据。[0137]本实施例中,对于数据推测装置的解释说明可以参照实施例1或实施例2中的描述,对此本实施例中不再多加赘述。[0138]可见,实施本实施例所描述的数据推测装置,能够将推荐算法中的冷启动思路,应用在客户缺失值填充中,从而使得其能够应用在产品推荐、客户价值测算、发展潜力测算、风险态势感知等场景当中,从而有效的提高该装置的普遍适应能力。同时从技术角度出发,该装置能够基于客户画像相似度的缺失特征填充,从而使得其更加贴合业务逻辑,兼顾科学与可解释性。具体的,该装置能够确定各维度指标权重,从而使得数据加工公正透明,进而使其更加贴合业务逻辑,更加容易解释推广;同时,该装置还能够使得更简单的被执行,并易于对特征进行理解,由于打开机器学习算法的黑盒,还能够让非it专业的业务运营人员也能理解、接收并参与到项目建设中,进而使得该装置落地便可执行,也更加容易进行迭代优化。[0139]本技术实施例提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行本技术实施例1或实施例2中的数据推测方法。[0140]本技术实施例提供了一种计算机可读存储介质,其存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行本技术实施例1或实施例2中的数据推测方法。[0141]在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。[0142]另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。[0143]所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。[0144]以上所述仅为本技术的实施例而已,并不用于限制本技术的保护范围,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。[0145]以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应所述以权利要求的保护范围为准。[0146]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
一种数据推测方法及装置与流程 专利技术说明
作者:admin
2023-06-29 20:03:59
548
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术
- 下一篇: 一种土壤污染防治用修复装置及修复方法与流程 专利技术说明
- 上一篇: 卷绕铁芯的制作方法 专利技术说明