计算;推算;计数设备的制造及其应用技术1.本公开涉及数据处理技术领域,尤其涉及一种数据分析方法、装置、电子设备及存储介质。背景技术:2.目标指标数据是衡量信息投放效果的关键指标,而且是一个聚合性指标,当观察到目标指标数据发生重大波动时,希望可以找到导致数据波动的原因。3.相关技术中,在信息投放效果产生改变时,为了分析改变原因,可以对目标指标数据所对应的多个分类来拆分影响因子,得到数据波动在每个分类下的影响因子,即得到每个分类所造成的数据波动,例如,信息投放时涉及分类1、分类2和分类3这三个分类,在进行数据波动分析时,可以基于这三个分类来拆分影响因子,得到每个分类所造成的数据波动。但是,这种方式分析不准确。技术实现要素:4.本公开提供一种数据分析方法、装置、电子设备及存储介质,以至少解决相关技术中数据分析不准确的问题。本公开的技术方案如下:5.根据本公开实施例的第一方面,提供一种数据分析方法,包括:6.获取待分析数据,所述待分析数据包括第一统计周期内的第一点击数据集合和第一展示数据集合,以及第二统计周期内的第二点击数据集合和第二展示数据集合;7.根据所述第一点击数据集合和所述第一展示数据集合,确定第一目标指标数据,并根据所述第二点击数据集合和第二展示数据集合,确定第二目标指标数据;8.根据所述第一展示数据集合、所述第二展示数据集合、所述第一点击数据集合和所述第二点击数据集合,确定与数据相关联的第一加权目标指标数据和第二加权目标指标数据;9.根据所述第一目标指标数据和所述第二目标指标数据,确定数据波动率;10.根据所述第一目标指标数据、所述第二目标指标数据、所述第一加权目标指标数据、所述第二加权目标指标数据和所述数据波动率,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子和结构影响因子。11.可选的,根据所述第一目标指标数据、所述第二目标指标数据、所述第一加权目标指标数据、所述第二加权目标指标数据和所述数据波动率,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子和结构影响因子,包括:12.将所述第一加权目标指标数据与所述第二加权目标指标数据的差值确定为第一差值,并将所述第一目标指标数据与所述第二目标指标数据的差值确定为第二差值;13.根据所述第一差值和所述第二差值,确定所述数据波动率的数据影响权重;14.根据所述数据波动率和所述数据影响权重,确定所述数据影响因子和所述结构影响因子。15.可选的,根据所述数据波动率和所述数据影响权重,确定所述数据影响因子和所述结构影响因子,包括:16.将所述数据波动率与所述数据影响权重之积确定为所述数据影响因子;17.将所述数据波动率与所述数据影响因子的差值确定为所述结构影响因子,或者,将1与所述数据影响权重的差值确定为结构影响权重,并将所述数据波动率与所述结构影响权重之积确定为所述结构影响因子。18.可选的,根据所述第一展示数据集合、所述第二展示数据集合、所述第一点击数据集合和所述第二点击数据集合,确定与数据相关联的第一加权目标指标数据和第二加权目标指标数据,包括:19.根据所述第一展示数据集合和所述第二展示数据集合,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子权重集合;20.根据所述第一点击数据集合、第一展示数据集合和所述数据影响因子权重集合,确定所述第一加权目标指标数据,并根据所述第二点击数据集合、第二展示数据集合和所述数据影响因子权重集合,确定所述第二加权目标指标数据。21.可选的,所述第一点击数据集合包括多个分类下的第一点击数据,所述第一展示数据集合包括所述多个分类下的第一展示数据,所述第二点击数据集合包括所述多个分类下的第二点击数据,所述第二展示数据集合包括所述多个分类下的第二展示数据,所述数据影响因子权重集合包括所述多个分类下的数据影响因子权重。22.可选的,根据所述第一点击数据集合、第一展示数据集合和所述数据影响因子权重集合,确定第一加权目标指标数据,并根据所述第二点击数据集合、第二展示数据集合和所述数据影响因子权重集合,确定第二加权目标指标数据,包括:23.根据所述多个分类下的第一点击数据和第一展示数据,确定每个分类在第一统计周期内的目标指标数据,将每个分类在第一统计周期内的目标指标数据确定为第一分类指标数据;24.根据所述多个分类下的第二点击数据和第二展示数据,确定每个分类在第二统计周期内的目标指标数据,将每个分类在第二统计周期内的目标指标数据确定为第二分类指标数据;25.将所述多个分类下的第一分类指标数据与所述数据影响因子权重进行加权求和,得到所述第一加权目标指标数据,并将所述多个分类下的第二分类指标数据与所述数据影响因子权重进行加权求和,得到所述第二加权目标指标数据。26.可选的,根据所述第一展示数据集合和所述第二展示数据集合,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子权重集合,包括:27.根据所述多个分类下的第一展示数据和第二展示数据,确定每个分类下的数据因素影响数据;28.将所有分类下的数据因素影响数据之和确定为总数据因素影响数据;29.将每个分类下的数据因素影响数据与所述总数据因素影响数据的比值确定为该分类下的数据影响因子权重,所有分类下的数据影响因子权重组成所述数据影响因子权重集合。30.可选的,根据所述多个分类下的第一展示数据和第二展示数据,确定每个分类下的数据因素影响数据,包括:31.将每个分类下的第一展示数据和第二展示数据之积与该分类下的第一展示数据和第二展示数据之和的比值确定为该分类下的所述数据因素影响数据。32.根据本公开实施例的第二方面,提供一种数据分析装置,包括:33.数据获取模块,被配置为执行获取待分析数据,所述待分析数据包括第一统计周期内的第一点击数据集合和第一展示数据集合,以及第二统计周期内的第二点击数据集合和第二展示数据集合;34.目标指标数据确定模块,被配置为执行根据所述第一点击数据集合和所述第一展示数据集合,确定第一目标指标数据,并根据所述第二点击数据集合和第二展示数据集合,确定第二目标指标数据;35.加权指标数据确定模块,被配置为执行根据所述第一展示数据集合、所述第二展示数据集合、所述第一点击数据集合和所述第二点击数据集合,确定与数据相关联的第一加权目标指标数据和第二加权目标指标数据;36.数据波动率确定模块,被配置为执行根据所述第一目标指标数据和所述第二目标指标数据,确定数据波动率;37.影响因子拆分模块,被配置为执行根据所述第一目标指标数据、所述第二目标指标数据、所述第一加权目标指标数据、所述第二加权目标指标数据和所述数据波动率,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子和结构影响因子。38.可选的,所述影响因子拆分模块包括:39.差值确定单元,被配置为执行将所述第一加权目标指标数据与所述第二加权目标指标数据的差值确定为第一差值,并将所述第一目标指标数据与所述第二目标指标数据的差值确定为第二差值;40.自身权重确定单元,被配置为执行根据所述第一差值和所述第二差值,确定所述数据波动率的数据影响权重;41.影响因子拆分单元,被配置为执行根据所述数据波动率和所述自身影响权重,确定所述数据影响因子和所述结构影响因子。42.可选的,所述影响因子拆分单元被配置为执行:43.将所述数据波动率与所述数据影响权重之积确定为所述数据影响因子;44.将所述数据波动率与所述数据影响因子的差值确定为所述结构影响因子,或者,将1与所述数据影响权重的差值确定为结构影响权重,并将所述数据波动率与所述结构影响权重之积确定为所述结构影响因子。45.可选的,所述加权指标数据确定模块包括:46.因子权重集合确定单元,被配置为执行根据所述第一展示数据集合和所述第二展示数据集合,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子权重集合;47.加权指标数据确定单元,被配置为执行根据所述第一点击数据集合、第一展示数据集合和所述数据影响因子权重集合,确定所述第一加权目标指标数据,并根据所述第二点击数据集合、第二展示数据集合和所述数据影响因子权重集合,确定所述第二加权目标指标数据。48.可选的,所述第一点击数据集合包括多个分类下的第一点击数据,所述第一展示数据集合包括所述多个分类下的第一展示数据,所述第二点击数据集合包括所述多个分类下的第二点击数据,所述第二展示数据集合包括所述多个分类下的第二展示数据,所述数据影响因子权重集合包括所述多个分类下的数据影响因子权重。49.可选的,所述加权指标数据确定单元被配置为执行:50.根据所述多个分类下的第一点击数据和第一展示数据,确定每个分类在第一统计周期内的目标指标数据,将每个分类在第一统计周期内的目标指标数据确定为第一分类指标数据;51.根据所述多个分类下的第二点击数据和第二展示数据,确定每个分类在第二统计周期内的目标指标数据,将每个分类在第二统计周期内的目标指标数据确定为第二分类指标数据;52.将所述多个分类下的第一分类指标数据与所述数据影响因子权重进行加权求和,得到所述第一加权目标指标数据,并将所述多个分类下的第二分类指标数据与所述数据影响因子权重进行加权求和,得到所述第二加权目标指标数据。53.可选的,所述因子权重集合确定单元包括:54.数据因素影响数据确定子单元,被配置为执行根据所述多个分类下的第一展示数据和第二展示数据,确定每个分类下的数据因素影响数据;55.总自身影响数据确定子单元,被配置为执行将所有分类下的数据因素影响数据之和确定为总数据因素影响数据;56.因子权重集合确定子单元,被配置为执行将每个分类下的数据因素影响数据与所述总数据因素影响数据的比值确定为该分类下的数据影响因子权重,所有分类下的数据影响因子权重组成所述数据影响因子权重集合。57.可选的,所述数据因素影响数据确定子单元被配置为执行:58.将每个分类下的第一展示数据和第二展示数据之积与该分类下的第一展示数据和第二展示数据之和的比值确定为该分类下的所述数据因素影响数据。59.根据本公开实施例的第三方面,提供一种电子设备,包括:60.处理器;61.用于存储所述处理器可执行指令的存储器;62.其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的数据分析方法。63.根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面所述的数据分析方法。64.根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现第一方面所述的数据分析方法。65.本公开的实施例提供的技术方案至少带来以下有益效果:66.本公开实施例由于确定的与数据相关联的第一加权目标指标数据和第二加权目标指标数据,是与结构变化无关的目标指标数据,从而基于加权目标指标数据和目标指标数据将数据波动率拆分为了结构影响因子和数据影响因子,实现了对数据波动的结构因素影响和数据自身因素影响的分析,解决了相关技术中无法对数据波动的结构因素影响和自身因素影响进行分析的问题,提高了数据分析的准确性。67.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明68.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。69.图1是根据一示例性实施例示出的一种数据分析方法的流程图;70.图2是根据一示例性实施例示出的一种数据分析装置的框图;71.图3是根据一示例性实施例示出的一种电子设备的框图。具体实施方式72.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。73.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。74.图1是根据一示例性实施例示出的一种数据分析方法的流程图,如图1所示,数据分析方法用于计算机或服务器等电子设备中,包括以下步骤。75.在步骤s11中,获取待分析数据,所述待分析数据包括第一统计周期内的第一点击数据集合和第一展示数据集合,以及第二统计周期内的第二点击数据集合和第二展示数据集合。76.点击数据和展示数据是确定目标指标数据的基础数据,展示数据例如可以是一个信息被曝光的次数,点击数据例如可以是信息曝光后被用户点击的次数。第一点击数据集合为第一点击数据的集合,第一点击数据为第一统计周期内的点击数据,第一展示数据集合为第一展示数据的集合,第一展示数据集合为第一统计周期内的展示数据,第二点击数据集合为第二点击数据的集合,第二点击数据为第二统计周期内的点击数据,第二展示数据集合为第二展示数据的集合,第二展示数据为第二统计周期内的展示数据。77.统计周期是数据统计的周期,例如可以是一个时刻、一天、一周、一个月等。第一统计周期和第二统计周期为确定数据波动率的两个统计周期,且这两个统计周期的单位相同,均为一个时刻、一天、一周或一个月等,数据波动率例如可以是环比或同比等,第一统计周期和第二统计周期例如可以是计算环比的两个统计周期,例如第一统计周期是当天,第二统计周期是前一天等,或者还可以是计算同比的两个统计周期,例如第一统计周期是当前周的周二,第二统计周期是前一周的周二等。78.在步骤s12中,根据所述第一点击数据集合和所述第一展示数据集合,确定第一目标指标数据,并根据所述第二点击数据集合和第二展示数据集合,确定第二目标指标数据。79.对第一点击数据集合中的第一点击数据进行求和计算,得到第一总点击数据,对第一展示数据集合中的第一展示数据进行求和计算,得到第一总展示数据,将所述第一总点击数据与所述第一总展示数据的商确定为第一目标指标数据。80.对第二点击数据集合中的第二点击数据进行求和计算,得到第二总点击数据,对第二展示数据集合中的第二展示数据进行求和计算,得到第二总展示数据,将所述第二总点击数据与所述第二总展示数据的商确定为第二目标指标数据。81.在步骤s13中,根据所述第一展示数据集合、所述第二展示数据集合、所述第一点击数据集合和所述第二点击数据集合,确定与数据相关联的第一加权目标指标数据和第二加权目标指标数据。82.其中,第一加权目标指标数据和第二加权目标指标数据是基于数据自身因素影响得到的目标指标数据,排除了结构变化的影响。结构变化是指目标指标数据聚合维度的变化。83.由于展示数据是和结构变化无关的数据,是和数据自身因素相关联的数据,从而基于第一展示数据集合和第二展示数据集合,可以确定与数据相关联的权重,并基于该权重、第一点击数据集合和第一展示数据集合可以得到与数据相关联的第一加权目标指标数据,基于权重、第二点击数据集合和第二展示数据集合可以得到与数据相关联的第二加权目标指标数据。84.在一个示例性实施例中,根据所述第一展示数据集合、所述第二展示数据集合、所述第一点击数据集合和所述第二点击数据集合,确定与数据相关联的第一加权目标指标数据和第二加权目标指标数据,包括:85.根据所述第一展示数据集合和所述第二展示数据集合,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子权重集合;根据所述第一点击数据集合、第一展示数据集合和所述数据影响因子权重集合,确定第一加权目标指标数据,并根据所述第二点击数据集合、第二展示数据集合和所述数据影响因子权重集合,确定第二加权目标指标数据。86.数据影响因子权重集合中包括多个数据影响因子权重,每个数据影响因子权重分别与第一展示数据集合中的第一展示数据相对应,也分别与第二展示数据集合中的第二展示数据相对应。数据影响因子权重是数据自身因素影响数据波动所占有的权重。87.对所述第一展示数据集合中的第一展示数据和第二展示数据集合中的第二展示数据按照权重计算模型进行计算,得到第一目标指标数据相对于第二目标指标数据波动的数据影响因子权重集合。88.根据第一点击数据集合和第一展示数据集合,确定相对应的第一点击数据和第一展示数据的商,并将确定的商与数据影响因子权重集合中相对应的数据影响因子权重进行加权求和,得到第一加权目标指标数据。89.根据第二点击数据集合和第二展示数据集合,确定相对应的第二点击数据和第二展示数据的商,并将确定的商与数据影响因子权重集合中相对应的数据影响因子权重进行加权求和,得到第二加权目标指标数据。90.通过基于第一展示数据集合和第二展示数据集合,确定数据影响因子权重集合,进而基于数据影响因子权重集合来确定第一加权目标指标数据和第二加权目标指标数据,可以得到较为准确的与数据相关联的第一加权目标指标数据和第二加权目标指标数据。91.在步骤s14中,根据所述第一目标指标数据和所述第二目标指标数据,确定数据波动率。92.确定第一目标指标数据和第二目标指标数据的差值,将该差值与所述第二目标指标数据的比值确定为数据波动率。93.在步骤s15中,根据所述第一目标指标数据、所述第二目标指标数据、所述第一加权目标指标数据、所述第二加权目标指标数据和所述数据波动率,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子和结构影响因子。94.其中,所述数据影响因子表征数据自身因素的变化所导致的波动率,结构影响因子表征数据结构的变化所导致的波动率。95.根据第一目标指标数据、第二目标指标数据、第一加权目标指标数据和第二加权目标指标数据,将数据波动率拆分为数据影响因子和结构影响因子。将第一目标指标数据、第二目标指标数据、第一加权目标指标数据、第二加权目标指标数据和数据波动率代入数据影响因子计算模型,得到第一目标指标数据相对于第二目标指标数据波动的数据影响因子;将第一目标指标数据、第二目标指标数据、第一加权目标指标数据、第二加权目标指标数据和数据波动率代入结构影响因子计算模型,得到第一目标指标数据相对于第二目标指标数据波动的结构影响因子。96.影响因子的绝对值反映影响因子的相对大小,影响因子的正负值反映该影响因子与数据波动率是否同向变化(同号为同向变化,异号为反向变化),而数据影响因子与结构影响因子相加正好等于数据波动率,这样可以快速判断导致目标指标数据波动的是结构性因素还是目标指标数据自身因素波动的问题。97.在一个示例性实施例中,根据所述第一目标指标数据、所述第二目标指标数据、所述第一加权目标指标数据、所述第二加权目标指标数据和所述数据波动率,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子和结构影响因子,包括:将所述第一加权目标指标数据与所述第二加权目标指标数据的差值确定为第一差值,并将所述第一目标指标数据与所述第二目标指标数据的差值确定为第二差值;根据所述第一差值和所述第二差值,确定为所述数据波动率的数据影响权重;根据所述数据波动率和所述数据影响权重,确定所述数据影响因子和所述结构影响因子。98.计算第一加权目标指标数据与第二加权目标指标数据的差值,得到第一差值,第一差值为数据波动导致的波动值;计算第一目标指标数据和第二目标指标数据的差值,得到第二差值,第二差值为包括数据波动和结构波动导致的波动值;计算第一差值与第二差值的比值,该比值就是数据波动所占的权重,也就是数据影响权重;将数据波动率乘以数据影响权重,得到数据影响因子,数据波动率与数据影响因子的差值为结构影响因子。99.通过将第一差值与第二差值的比值确定为数据波动率的数据影响权重,可以准确地确定数据影响因子和结构影响因子。100.在一个示例性实施例中,根据所述数据波动率和所述数据影响权重,确定所述数据影响因子和所述结构影响因子,包括:将所述数据波动率与所述数据影响权重之积确定为所述数据影响因子;将所述数据波动率与所述数据影响因子的差值确定为所述结构影响因子,或者,将1与所述数据影响权重的差值确定为结构影响权重,并将所述数据波动率与所述结构影响权重之积确定为所述结构影响因子。101.在得到数据影响权重之后,可以将数据波动率与数据影响权重进行相乘,得到数据影响因子。即通过如下公式可以计算得到数据影响因子:[0102][0103]其中,cpmpart表示数据影响因子,mhcpmt为第一加权目标指标数据,mhcpmy为第二加权目标指标数据,cpmt为第一目标指标数据,cpmy为第二目标指标数据,为数据影响权重,为数据波动率。[0104]由于数据波动率可以拆分为数据影响因子和结构影响因子,从而可以将数据波动率与数据影响因子的差值确定为结构影响因子;或者,还可以计算1与数据影响权重的差值,得到结构影响权重,将数据波动率与结构影响权重进行相乘,得到结构影响因子。可以通过如下公式计算得到结构影响因子:[0105][0106]其中,wpart表示结构影响因子,mhcpmt为第一加权目标指标数据,mhcpmy为第二加权目标指标数据,cpmt为第一目标指标数据,cpmy为第二目标指标数据,为数据影响权重,为数据波动率。[0107]通过基于数据波动率和数据影响权重确定数据影响因子,并基于数据影响因子和结构影响因子共同组成数据波动率的关系,得到结构影响因子,可以得到较为准确的数据影响因子和结构影响因子,提高数据波动分析的准确性。[0108]本示例性实施例提供的数据分析方法,通过在获取到待分析数据后,根据第一点击数据集合和第一展示数据集合,确定第一目标指标数据,并根据第二点击数据集合和第二展示数据集合,确定第二目标指标数据,根据第一展示数据集合、第二展示数据集合、第一点击数据集合和第二点击数据集合,确定与数据相关联的第一加权目标指标数据和第二加权目标指标数据,这样可以得到只有数据自身因素影响的第一加权目标指标数据和第二加权目标指标数据,根据第一目标指标数据和第二目标指标数据确定数据波动率,根据第一目标指标数据、第二目标指标数据、第一加权目标指标数据、第二加权目标指标数据和数据波动率,可以确定第一目标指标数据相对于第二目标指标数据波动的数据影响因子和结构影响因子,由于确定的与数据相关联的第一加权目标指标数据和第二加权目标指标数据,是与结构变化无关的目标指标数据,从而基于加权目标指标数据和目标指标数据将数据波动率拆分为了结构影响因子和数据影响因子,实现了对数据波动的结构因素影响和数据自身因素影响的分析,解决了相关技术中无法对数据波动的结构因素影响和自身因素影响进行分析的问题,提高了数据分析的准确性。[0109]在上述技术方案的基础上,所述第一点击数据集合包括多个分类下的第一点击数据,所述第一展示数据集合包括所述多个分类下的第一展示数据,所述第二点击数据集合包括所述多个分类下的第二点击数据,所述第二展示数据集合包括所述多个分类下的第二展示数据,所述数据影响因子权重集合包括所述多个分类下的数据影响因子权重。[0110]在一个示例性实施例中,根据所述第一点击数据集合、第一展示数据集合和所述数据影响因子权重集合,确定第一加权目标指标数据,并根据所述第二点击数据集合、第二展示数据集合和所述数据影响因子权重集合,确定第二加权目标指标数据,包括:根据所述多个分类下的第一点击数据和第一展示数据,确定每个分类在第一统计周期内的目标指标数据,将每个分类在第一统计周期内的目标指标数据确定为第一分类指标数据;根据所述多个分类下的第二点击数据和第二展示数据,确定每个分类在第二统计周期内的目标指标数据,将每个分类在第二统计周期内的目标指标数据确定为第二分类指标数据;将所述多个分类下的第一分类指标数据与所述数据影响因子权重进行加权求和,得到所述第一加权目标指标数据,并将所述多个分类下的第二分类指标数据与所述数据影响因子权重进行加权求和,得到所述第二加权目标指标数据。[0111]将每个分类下的第一点击数据与第一展示数据的商确定为对应分类下的第一分类指标数据,将每个分类下的第二点击数据与第二展示数据的商确定为对应分类下的第二分类指标数据。[0112]按照如下公式,对多个分类下的第一分类指标数据与数据影响因子权重进行加权求和,得到第一加权目标指标数据:[0113][0114]其中,mhcpmt为第一加权目标指标数据,a表示多个分类中的一个分类,cpmt,a为a分类下的第一分类指标数据,weighta为a分类下的数据影响因子权重。[0115]按照如下公式,对多个分类下的第二分类指标数据与数据影响因子权重进行加权求和,得到第二加权目标指标数据:[0116][0117]其中,mhcpmy为第一加权目标指标数据,a表示多个分类中的一个分类,cpmy,a为a分类下的第二分类指标数据,weighta为a分类下的数据影响因子权重。[0118]通过上述方式确定的第一加权目标指标数据和第二加权目标指标数据为与结构变化无关的目标指标数据,便于对数据影响因子和结构影响因子的拆分。[0119]在上述技术方案的基础上,根据所述第一展示数据集合和所述第二展示数据集合,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子权重集合,包括:根据所述多个分类下的第一展示数据和第二展示数据,确定每个分类下的数据因素影响数据;将所有分类下的数据因素影响数据之和确定为总数据因素影响数据;将每个分类下的数据因素影响数据与所述总数据因素影响数据的比值确定为该分类下的数据影响因子权重,所有分类下的数据影响因子权重组成所述数据影响因子权重集合。[0120]按照如下公式计算每个分类下的数据影响因子权重:[0121][0122]其中,weighta表示在a分类下的数据影响因子权重,为a分类下的第一展示数据,为a分类下的第二展示数据,a为多个分类中的一个分类,为a分类下的数据因素影响数据,为总数据因素影响数据。[0123]由于展示数据和数据结构的变化无关,从而基于第一展示数据和第二展示数据可以确定数据影响因子权重,提高数据影响因子权重确定的准确性。[0124]在上述技术方案的基础上,根据所述多个分类下的第一展示数据和第二展示数据,确定每个分类下的数据因素影响数据,包括:将每个分类下的第一展示数据和第二展示数据之积与该分类下的第一展示数据和第二展示数据之和的比值确定为该分类下的所述数据因素影响数据。[0125]确定数据因素影响数据时,是计算每个分类下的第一展示数据与第二展示数据之积与对应分类下的第一展示数据与第二展示数据之和的比值得到的。[0126]下面介绍上述公式的推导过程:[0127]由目标指标数据的比值的展开式推导加权目标指标数据的计算:[0128][0129]其中,cpmt为第一目标指标数据,cpmy为第二目标指标数据,cost_totalt为多个分类下的第一总点击数据,ad_showt为多个分类下的第一总展示数据,cost_totaly为多个分类下的第二总点击数据,ad_showy为多个分类下的第二总展示数据,为a分类下的第一点击数据,为a分类下的第一展示数据,为a分类下的第二点击数据,为a分类下的第二展示数据,cpmt,a为a分类下的第一分类指标数据,cpmy,a为a分类下的第二分类指标数据,weightt,a为a分类下的第一数据权重,weighty,a为a分类下的第二数据权重。[0130]为了拆分出纯粹因为目标指标数据自身因素的变化(排除结构的变化)所导致的波动,让分子分母里的权重项保持一致,得到的数据影响因子权重如下:[0131][0132]其中,weighta表示a分类下的数据影响因子权重。[0133]将上述目标指标数据的比值的展开式中的第一数据权重和第二数据权重分别替换为数据影响因子权重,得到第一加权目标指标数据与第二加权目标指标数据的比值为:[0134][0135]其中,mhcpmratio为第一加权目标指标数据与第二加权目标指标数据的比值。[0136]由此可得,第一加权目标指标数据表示如下:[0137][0138]第二加权目标指标数据表示如下:[0139][0140]在得到第一加权目标指标数据和第二加权目标指标数据后,可以得到数据影响因子和结构影响因子的上述计算公式。[0141]下面以一个具体实例来说明本公开中的数据波动分析方法:[0142]假设获取到的待分析数据如表1所示,表1中,a列表示第一点击数据集合,b列表示第二点击数据集合,c列表示第一展示数据集合,d列表示第二展示数据集合。[0143]表1待分析数据[0144][0145][0146]在获取到待分析数据后,确定第一目标指标数据和第二目标指标数据:[0147][0148][0149]其中,cpmt为第一目标指标数据,cpmy为第二目标指标数据。[0150]确定第一加权目标指标数据和第二加权目标指标数据的过程如表2所示。[0151]表2确定加权目标指标数据[0152][0153][0154][0155]表2中,h列∶是数据影响因子权重weighta的分子部分,h列的加和sum(h)为数据影响因子权重weighta的分母部分;e列是数据影响因子权重weighta;f列为cpmt,a=a列/c列,是各个分类a下的第一分类指标数据,其中,a列和c列为表1中的列;g列为cpmy,a=b列/d列,是各个分类a下的第二分类指标数据,其中,b列和d列是表1中的列;第一加权目标指标数据mhcpmt=∑a(cpmt,a*weighta)=sum(e列*f列)=19.89792;第二加权目标指标数据mhcpmy=∑a(cpmt,a*weighta)=sum(e列*g列)=20.26437。[0156]确定数据波动率为:[0157][0158]数据影响因子为:[0159][0160]结构影响因子为:[0161][0162]其中,[0163]至此,将数据波动率拆分为数据影响因子和结构影响因子,即拆分为了数据自身因素影响和结构因素影响两部分。[0164]通过将数据波动率拆分为数据影响因子和结构影响因子,可以确定第一目标指标数据相对于第二目标指标数据的数据波动率为负值-2.9661%的主要原因是由目标指标数据自身因素下降引起的,因为数据影响因子cpmpart的绝对值大于结构影响因子wpart的绝对值,且数据影响因子cpmpart与数据波动率同号,都是负号,表明数据影响因子和数据波动率是同向变化的。[0165]本公开实施例中加权目标指标数据(包括第一加权目标指标数据和第二加权目标指标数据)的计算相比于传统目标指标数据(包括第一目标指标数据和第二目标指标数据)的计算,可以剔除聚合维度(即结构)的变化带来的影响;利用加权目标指标数据把数据波动率拆分为数据影响因子和结构影响因子两部分,实现了对数据波动率的有效归因;本公开实施例中的数据分析可以运用到多种场景,根据所关注的目标指标不同,维度不同,对不同维度的聚合型指标进行数据影响因子权重计算和拆分,具有灵活普适性;通过拆分后的数据影响因子和结构影响因子,可以有效解释数据波动率是由结构变化导致还是数据自身变化导致,实现了数据波动归因的量化。[0166]图2是根据一示例性实施例示出的一种数据分析装置的框图。参照图2,该装置包括数据获取模块21、目标指标数据确定模块22、加权指标数据确定模块23、数据波动率确定模块24和影响因子拆分模块25。[0167]该数据获取模块21被配置为执行获取待分析数据,所述待分析数据包括第一统计周期内的第一点击数据集合和第一展示数据集合,以及第二统计周期内的第二点击数据集合和第二展示数据集合;[0168]该目标指标数据确定模块22被配置为执行根据所述第一点击数据集合和所述第一展示数据集合,确定第一目标指标数据,并根据所述第二点击数据集合和第二展示数据集合,确定第二目标指标数据;[0169]该加权指标数据确定模块23被配置为执行根据所述第一展示数据集合、所述第二展示数据集合、所述第一点击数据集合和所述第二点击数据集合,确定与数据相关联的第一加权目标指标数据和第二加权目标指标数据;[0170]该数据波动率确定模块24被配置为执行根据所述第一目标指标数据和所述第二目标指标数据,确定数据波动率;[0171]该影响因子拆分模块25被配置为执行根据所述第一目标指标数据、所述第二目标指标数据、所述第一加权目标指标数据、所述第二加权目标指标数据和所述数据波动率,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子和结构影响因子。[0172]可选的,所述影响因子拆分模块包括:[0173]差值确定单元,被配置为执行将所述第一加权目标指标数据与所述第二加权目标指标数据的差值确定为第一差值,并将所述第一目标指标数据与所述第二目标指标数据的差值确定为第二差值;[0174]自身权重确定单元,被配置为执行根据所述第一差值和所述第二差值,确定所述数据波动率的数据影响权重;[0175]影响因子拆分单元,被配置为执行根据所述数据波动率和所述数据影响权重,确定所述数据影响因子和所述结构影响因子。[0176]可选的,所述影响因子拆分单元被配置为执行:[0177]将所述数据波动率与所述数据影响权重之积确定为所述数据影响因子;[0178]将所述数据波动率与所述数据影响因子的差值确定为所述结构影响因子,或者,将1与所述数据影响权重的差值确定为结构影响权重,并将所述数据波动率与所述数据影响权重之积确定为所述结构影响因子。[0179]可选的,所述加权指标数据确定模块包括:[0180]因子权重集合确定单元,被配置为执行根据所述第一展示数据集合和所述第二展示数据集合,确定所述第一目标指标数据相对于所述第二目标指标数据波动的数据影响因子权重集合;[0181]加权指标数据确定单元,被配置为执行根据所述第一点击数据集合、第一展示数据集合和所述数据影响因子权重集合,确定所述第一加权目标指标数据,并根据所述第二点击数据集合、第二展示数据集合和所述数据影响因子权重集合,确定所述第二加权目标指标数据。[0182]可选的,所述第一点击数据集合包括多个分类下的第一点击数据,所述第一展示数据集合包括所述多个分类下的第一展示数据,所述第二点击数据集合包括所述多个分类下的第二点击数据,所述第二展示数据集合包括所述多个分类下的第二展示数据,所述数据影响因子权重集合包括所述多个分类下的数据影响因子权重。[0183]可选的,所述加权指标数据确定单元被配置为执行:[0184]根据所述多个分类下的第一点击数据和第一展示数据,确定每个分类在第一统计周期内的目标指标数据,将每个分类在第一统计周期内的目标指标数据确定为第一分类指标数据;[0185]根据所述多个分类下的第二点击数据和第二展示数据,确定每个分类在第二统计周期内的目标指标数据,将每个分类在第二统计周期内的目标指标数据确定为第二分类指标数据;[0186]将所述多个分类下的第一分类指标数据与所述数据影响因子权重进行加权求和,得到所述第一加权目标指标数据,并将所述多个分类下的第二分类指标数据与所述数据影响因子权重进行加权求和,得到所述第二加权目标指标数据。[0187]可选的,所述因子权重集合确定单元包括:[0188]数据因素影响数据确定子单元,被配置为执行根据所述多个分类下的第一展示数据和第二展示数据,确定每个分类下的数据因素影响数据;[0189]总数据影响数据确定子单元,被配置为执行将所有分类下的数据因素影响数据之和确定为总数据因素影响数据;[0190]因子权重集合确定子单元,被配置为执行将每个分类下的数据因素影响数据与所述总数据因素影响数据的比值确定为该分类下的数据影响因子权重,所有分类下的数据影响因子权重组成所述数据影响因子权重集合。[0191]可选的,所述自身影响数据确定子单元被配置为执行:[0192]将每个分类下的第一展示数据和第二展示数据之积与该分类下的第一展示数据和第二展示数据之和的比值确定为该分类下的所述数据因素影响数据。[0193]关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。[0194]图3是根据一示例性实施例示出的一种电子设备的框图。例如,电子设备300可以被提供为一服务器。参照图3,电子设备300包括处理组件322,其进一步包括一个或多个处理器,以及由存储器332所代表的存储器资源,用于存储可由处理组件322执行的指令,例如应用程序。存储器332中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件322被配置为执行指令,以执行上述的数据分析方法。[0195]电子设备300还可以包括一个电源组件326被配置为执行电子设备300的电源管理,一个有线或无线网络接口350被配置为将电子设备300连接到网络,和一个输入输出(i/o)接口358。电子设备300可以操作基于存储在存储器332的操作系统,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm或类似。[0196]在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器332,上述指令可由电子设备300的处理组件322执行以完成上述数据波动分析方法。可选地,计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。[0197]在示例性实施例中,还提供一种计算机程序产品,包括计算机程序或计算机指令,所述计算机程序或计算机指令被处理器执行时实现上述的数据分析方法。[0198]本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。[0199]应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
数据分析方法、装置、电子设备及存储介质与流程 专利技术说明
作者:admin
2023-07-05 21:06:09
573
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术