乐器;声学设备的制造及制作,分析技术1.本发明涉及音频处理技术领域,尤其涉及一种高解析音频的音质检测方法及相关装置。背景技术:2.高解析音频是指采样率大于44100hz或量化精度大于16比特的音频文件。3.日常中往往存有大量通过对低品质音频重采样而制作的假高解析音频,或频谱有异常的音频文件。其中,假高解析音频是指在采用率和量化精度上满足要求,但频率大于44100hz以上的频谱内往往没有有效能量;频谱异常的音频文件是指在音频录制或编辑过程中因操作不当而导致音频数据损坏的音频文件。4.现有技术在识别高解析音频时,一般依赖人工观察的方式进行识别,而人工识别的方式往往存在因主观差异而带来的识别准确率低下的问题。技术实现要素:5.本发明实施例提供了一种高解析音频的音质检测方法及相关装置,用于提升对高解析音频的识别准确率。6.本技术实施例第一方面提供了一种高解析音频的音质检测方法,包括:7.获取待检测音频的采样率和量化精度;8.从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频;9.确定所述第一音频的有效频谱高度,所述有效频谱高度为音频最大能量处所对应的频率;10.从所述第一音频中筛选出有效频谱高度大于频率阈值的第二音频;11.若所述第二音频中预设高频段的能量总趋势呈现下降趋势,且预设高频段内未出现能量突变的频点时,则确定所述第二音频为高解析音频。12.优选的,在从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频之后,获取所述第一音频的有效频谱高度之前,所述方法还包括:13.获取所述第一音频的采样率;14.按照预设的多个采样区间,将所述第一音频归类至目标类别音频,其中,每个采样区间对应不同类别的音频;15.若所述第一音频的采样率不等于目标类别音频所对应的重采样率,则将所述第一音频按照目标类别音频所对应的重采样率执行重采样,以使得所述第一音频的重采样率与目标类别音频所对应的重采样率相同,其中,不同类别的音频对应不同的重采样率。16.优选的,所述确定所述第一音频的有效频谱高度,包括:17.将所述第一音频分帧加窗,并执行时域与频域的转换,以得到所述第一音频中每帧音频的频域信号;18.计算所述第一音频中每帧音频的能量,以根据所述第一音频中每帧音频的能量和第一能量阈值,筛选出所述第一音频中的有效帧;19.确定所述第一音频中有效帧的有效频谱高度。20.优选的,从所述第一音频中筛选出有效频谱高度大于频率阈值的第二音频,包括:21.统计所述第一音频中有效帧的有效频谱高度大于所述频率阈值的第一有效帧数量;22.若所述第一音频中第一有效帧的数量与所述第一音频中总有效帧的数量比值大于第一比例阈值,则将所述第一音频视为同一目标类别的第二音频。23.在筛选出所述第一音频中的有效帧之后,所述确定所述第一音频中有效帧的有效频谱高度之前,所述方法还包括:24.若所述第一音频中有效帧的数量与所述第一音频中总音频帧数的比值小于第二比例阈值,则确定所述第一音频为非高解析音频。25.优选的,所述确定所述第一音频中有效帧的有效频谱高度,包括:26.将所述第一音频中的有效帧按照预设的频率间隔,划分为m个频带,每个频带包括n个频点,其中,所述m大于等于2,所述n大于等于1;27.按照目标类别音频所对应的频带计算范围,计算所述第一音频中每个有效帧内沿着频率轴的方向,每个频带的一阶频带能量e1和相邻两个一阶频带能量之和e2,其中,不同类别的音频对应不同的频带计算范围;28.根据所述第一音频中每个有效帧内每个频带所对应的e1或e2,以及有效频谱高度确定规则,确定所述第一音频中每个有效帧的频谱高度。29.优选的,所述有效频谱高度确定规则包括:30.确定每个帧能量开始下降的拐点频带,将拐点频带的频率确定为每个帧的有效频谱高度。31.优选的,所述根据所述第一音频中每个有效帧内每个频带所对应的e1或e2,以及有效频谱高度确定规则,确定所述第一音频中每个有效帧的有效频谱高度,包括:32.获取第一音频中每个有效帧内最大e2值所对应的第一频带;33.若第一频带的e1值大于第二能量阈值,或沿频率轴的方向与所述第一频带相邻的第二频带的e2值大于第三能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度,其中,所述第二能量阈值和所述第三能量阈值用于表征拐点频带的能量变化范围;34.或,35.若第一频带的能量小于无效能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度。36.优选的,若所述第二音频中预设高频段的能量总趋势呈现下降趋势,且预设高频段内未出现能量突变的频点时,则确定所述第二音频为高解析音频,包括:37.按照目标类别音频预设高频段中的多个预设中心频带和预设高频点,计算所述第二音频中每帧音频的多个预设中心频带与预设高频点的多个能量差值,其中,多个预设中心频带的频率依次增大,但均小于预设高频点的频率,其中,不同类别的音频对应不同的多个预设中心频带和不同的预设高频点;38.统计所述第二音频中所述多个能量差值均大于对应多个阈值的第二有效帧数量,其中,与所述多个能量差值分别对应的多个阈值随着所述多个预设中心频带的频率的增大而减小;39.若所述第二有效帧数量与所述第二音频中总音频帧数的比值不小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势呈现下降趋势。40.优选的,若所述第二音频中预设高频段的能量总趋势呈现下降趋势,且预设高频段内未出现能量突变的频点,则确定所述第二音频为高解析音频,还包括:41.按照目标类别音频的预设高频段,获取所述第二音频中每个音频帧的所述预设高频段,其中,不同类别的音频设有不同的高频段范围;42.计算所述第二音频中每个音频帧预设高频段的能量分布区间;43.统计所述能量分布区间内无异常频点的第三有效帧数量,其中,异常频点为频点能量大于能量分布区间临界值的频点;44.若所述第三有效帧数量与所述第二音频中总音频帧的数量比值不小于第四比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;45.确定所述第二音频为高解析音频。46.优选的,若所述第二音频中预设高频段的能量总趋势呈现下降趋势,且预设高频段内未出现能量突变的频点,则确定所述第二音频为高解析音频,还包括:47.利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;48.针对所述第二音频中的每个音频帧,统计所述滑动窗口内所有频点能量的一阶差分之和;49.若所述滑动窗口内所有频点能量的一阶差分之和的符合为负,且大于第四能量阈值,则确定所述第二音频中的音频帧为正常帧;50.或,51.若所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且小于第五能量阈值,则确定所述所述第二音频中的音频帧为正常帧;52.统计所述第二音频中正常帧的比例,若所述第二音频中正常帧的比例不小于第五比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;53.确定所述第二音频为高解析音频。54.优选的,若所述第二音频中预设高频段的能量总趋势呈现下降趋势,且预设高频段内未出现能量突变的频点,则确定所述第二音频为高解析音频,还包括:55.利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;56.针对所述第二音频中的每个音频帧,统计所述滑动窗口内每个频点能量的一阶差分之和;57.若所述滑动窗口内每个频点能量的一阶差分之和的符号为负,且大于第六能量阈值,则确定所述第二音频中的音频帧为正常帧;58.或,59.若所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且小于第七能量阈值,则确定所述第二音频中的音频帧为正常帧;60.统计所述第二音频中正常帧的比例,若所述第二音频中正常帧的比例不小于第六比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;61.确定所述第二音频为高解析音频。62.优选的,在所述利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧之前,所述方法还包括:63.利用平滑滤波器对所述第二音频中的每个音频帧执行平滑处理。64.本技术实施例第二方面提供了一种高解析音频的音质检测装置,包括:65.获取单元,用于获取待检测音频的采样率和量化精度;66.第一筛选单元,用于从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频;67.确定单元,用于确定所述第一音频的有效频谱高度,所述有效频谱高度为音频最大能量处所对应的频率;68.第二筛选单元,用于从所述第一音频中筛选出有效频谱高度大于频率阈值的第二音频;69.所述确定单元,还用于若所述第二音频中预设高频段的能量总趋势呈现下降趋势,且预设高频段内未出现能量突变的频点时,则确定所述第二音频为高解析音频。70.优选的,所述获取单元还用于:71.在从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频之后,获取所述第一音频的有效频谱高度之前,获取所述第一音频的采样率;72.所述装置还包括:73.归类单元,用于按照预设的多个采样区间,将所述第一音频归类至目标类别音频,其中,每个采样区间对应不同类别的音频;74.重采样单元,用于若所述第一音频的采样率不等于目标类别音频所对应的重采样率,则将所述第一音频按照目标类别音频所对应的重采样率执行重采样,以使得所述第一音频的重采样率与目标类别音频所对应的重采样率相同,其中,不同类别的音频对应不同的重采样率。75.优选的,所述确定单元具体用于:76.将所述第一音频分帧加窗,并执行时域与频域的转换,以得到所述第一音频中每帧音频的频域信号;77.计算所述第一音频中每帧音频的能量,以根据所述第一音频中每帧音频的能量和第一能量阈值,筛选出所述第一音频中的有效帧;78.确定所述第一音频中有效帧的有效频谱高度。79.优选的,所述第二筛选单元具体用于:80.统计所述第一音频中有效帧的有效频谱高度大于所述频率阈值的第一有效帧数量;81.若所述第一音频中第一有效帧的数量与所述第一音频中总有效帧的数量比值大于第一比例阈值,则将所述第一音频视为同一目标类别的第二音频。82.优选的,所述确定单元还用于:83.在筛选出所述第一音频中的有效帧之后,所述确定所述第一音频中有效帧的有效频谱高度之前,若所述第一音频中有效帧的数量与所述第一音频中总音频帧数的比值小于第二比例阈值,则确定所述第一音频为非高解析音频。84.优选的,所述确定单元具体用于:85.将所述第一音频中的有效帧按照预设的频率间隔,划分为m个频带,每个频带包括n个频点,其中,所述m大于等于2,所述n大于等于1;86.按照目标类别音频所对应的频带计算范围,计算所述第一音频中每个有效帧内沿着频率轴的方向,每个频带的一阶频带能量e1和相邻两个一阶频带能量之和e2,其中,不同类别的音频对应不同的频带计算范围;87.根据所述第一音频中每个有效帧内每个频带所对应的e1或e2,以及有效频谱高度确定规则,确定所述第一音频中每个有效帧的频谱高度。88.优选的,所述有效频谱高度确定规则包括:89.确定每个帧能量开始下降的拐点频带,将拐点频带的频率确定为每个帧的有效频谱高度。90.优选的,所述确定单元具体用于:91.获取第一音频中每个有效帧内最大e2值所对应的第一频带;92.若第一频带的e1值大于第二能量阈值,或沿频率轴的方向与所述第一频带相邻的第二频带的e2值大于第三能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度,其中,所述第二能量阈值和所述第三能量阈值用于表征拐点频带的能量变化范围;93.或,94.若第一频带的能量小于无效能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度。95.优选的,所述确定单元具体用于:96.按照目标类别音频预设高频段中的多个预设中心频带和预设高频点,计算所述第二音频中每帧音频的多个预设中心频带与预设高频点的多个能量差值,其中,多个预设中心频带的频率依次增大,但均小于预设高频点的频率,其中,不同类别的音频对应不同的多个预设中心频带和不同的预设高频点;97.统计所述第二音频中所述多个能量差值均大于对应多个阈值的第二有效帧数量,其中,与所述多个能量差值分别对应的多个阈值随着所述多个预设中心频带的频率的增大而减小;98.若所述第二有效帧数量与所述第二音频中总音频帧数的比值不小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势呈现下降趋势。99.优选的,所述确定单元具体用于:100.按照目标类别音频的预设高频段,获取所述第二音频中每个音频帧的所述预设高频段,其中,不同类别的音频设有不同的高频段范围;101.计算所述第二音频中每个音频帧预设高频段的能量分布区间;102.统计所述能量分布区间内无异常频点的第三有效帧数量,其中,异常频点为频点能量大于能量分布区间临界值的频点;103.若所述第三有效帧数量与所述第二音频中总音频帧的数量比值不小于第四比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;104.确定所述第二音频为高解析音频。105.优选的,所述确定单元具体用于:106.利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;107.针对所述第二音频中的每个音频帧,统计所述滑动窗口内所有频点能量的一阶差分之和;108.若所述滑动窗口内所有频点能量的一阶差分之和的符合为负,且大于第四能量阈值,则确定所述第二音频中的音频帧为正常帧;109.或,110.若所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且小于第五能量阈值,则确定所述所述第二音频中的音频帧为正常帧;111.统计所述第二音频中正常帧的比例,若所述第二音频中正常帧的比例不小于第五比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;112.确定所述第二音频为高解析音频。113.优选的,所述确定单元具体用于:114.利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;115.针对所述第二音频中的每个音频帧,统计所述滑动窗口内每个频点能量的一阶差分之和;116.若所述滑动窗口内每个频点能量的一阶差分之和的符号为负,且大于第六能量阈值,则确定所述第二音频中的音频帧为正常帧;117.或,118.若所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且小于第七能量阈值,则确定所述第二音频中的音频帧为正常帧;119.统计所述第二音频中正常帧的比例,若所述第二音频中正常帧的比例不小于第六比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;120.确定所述第二音频为高解析音频。121.优选的,所述装置还包括:122.预处理单元,用于在所述利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧之前,利用平滑滤波器对所述第二音频中的每个音频帧执行平滑处理。123.本技术实施例还提供了一种计算机装置,包括处理器,该处理器在执行存储于存储器上的计算机程序时,用于实现本技术实施例第一方面所述的高解析音频的音质检测方法。124.本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,用于实现本技术实施例第一方面所述的高解析音频的音质检测方法。125.从以上技术方案可以看出,本发明实施例具有以下优点:126.本技术实施例中,先对待检测音频执行初筛选,以筛选出采样率和量化精度都满足预设标准的第一音频,然从基于有效能量的角度,从第一音频中筛选出有效频谱高度大于频率阈值的第二音频,最后再确认第二音频的预设高频段的能量呈现下降趋势,且预设高频段内无能量突变的频点时,再确认第二音频为高解析音频。也即本技术该实施例,一方面基于具体的量化标准实现对高解析音频的筛选,避免了人工主观意愿的参与,提升了高解析音频识别的准确率,另一方面还可以将该识别标准的算法设置于计算机设备上,从而提升对高解析音频识别的效率。附图说明127.图1为本技术实施例中高解析音频的检测方法的一个实施例示意图;128.图2为本技术实施例中图1实施例中步骤103和104的细化步骤:129.图3为本技术实施例中图2实施例中步骤203的细化步骤;130.图4为本技术实施例中有效帧内频带和频点的示意图;131.图5为本技术实施例中图1实施例中步骤105的细化步骤;132.图6为本技术实施例中高解析音频的检测方法的另一个实施例示意图;133.图7为本技术实施例中有效帧内出现异常频点的示意图;134.图8为本技术实施例中高解析音频的检测方法的另一个实施例示意图;135.图9为本技术实施例中高解析音频的检测方法的另一个实施例示意图;136.图10为本技术实施例中高解析音频的检测装置的一个实施例示意图。具体实施方式137.本发明实施例提供了一种高解析音频的音质检测方法及相关装置,用于提升对高解析音频的识别准确率。138.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。139.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。140.高解析音频是指采样率大于44100hz或量化精度大于16比特的音频文件,针对现有技术中人工识别高解析音频而带来的识别准确率低下的问题,本技术提出了一种高解析音频的音质检测方法及相关装置,用于提升对高解析音频的识别准确率。141.为方便理解,下面对本技术中高解析音频的音质检测方法进行描述,请参阅图1,图1为高解析音频的音质检测方法的一个实施例示意图:142.101、获取待检测音频的采样率和量化精度;143.因为高解析音频的品质要比cd的品质更高,故高解析音频一般为采样率大于44100hz或量化精度大于16比特的音频文件,故本技术实施例为了检测出高解析音频,需要先获取待检测音频的采样率和量化精度。144.具体的,采样率指的是录音设备在单位时间内(1s)内对声音信号的采样次数,单位为hz(赫兹),而量化的过程即为将幅度上连续取值的每个样本转换为离散值的表示,而量化精度是指每个样本所占的二进制位数,同时,二进制的位数也反应了度量声音波形幅度的精度,其中,量化精度越大,声音的质量就越好。145.此外,本技术实施例中的待检测音频可以是从正在播放的音频中随机截取的一段音频,也可以是从音频库中选取出的一段音频,此处对待检测音频的具体获取方式不做限定。146.102、从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频;147.获取到待检测音频的采样率和量化精度以后,则可以按照高解析音频的预设标准,从待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频。148.具体的,本技术实施例中的预设标准为采样率大于44100hz,同时量化精度也大于16比特,但需要说明的是,随着用户对音频音质要求的提高,本技术中的预设标准还可以是采样率和量化精度都分别大于44100hz和16比特的其他自定义标准,此处对预设标准的具体定义不做限制。149.103、确定所述第一音频的有效频谱高度,所述有效频谱高度为音频最大能量处所对应的频率;150.从待检测音频中筛选出采样率和量化精度满足标准的第一音频后,为了识别假的高解析音频,也即采样率和量化精度上都满足要求,但频率大于44100hz以上的频谱内没有有效能量的音频,本技术实施例还需要确定第一音频的有效频谱高度,其中,有效频谱高度为音频最大能量出所对应的频率。故本技术实施例中确定第一音频的有效频谱高度,即为确定第一音频中的高频段是否具有有效能量。151.104、从第一音频中筛选出有效频谱高度大于频率阈值的第二音频;152.为了确保第一音频在高频段具有有效能量,可以预设一个频域阈值,以用于从第一音频中筛选出有效频谱高度大于频域阈值的第二音频。153.本技术实施例在该步骤中从第一音频中筛选出有效频谱高度大于频率阈值的第二音频,其中,有效频谱高度为音频最大能量处所对应的频率,故该步骤中第二音频的有效频谱高度大于频率阈值,也即反映了第二音频中高频段的有效能量大于预设的能量阈值,也即在高频段中存有有效能量。154.具体的,对于如何从第一音频中筛选出第二音频的过程,将在下面的实施例中进行描述,此处不再赘述。155.105、判断第二音频中预设高频段的能量总趋势是否呈现下降趋势,且预设高频段内未出现能量突变的频点,若是,则执行步骤106,若否,则执行步骤107。156.从第一音频中筛选出第二音频以后,进一步判断第二音频中预设高频段的能量总趋势是否呈现下降趋势,且预设高频段内是否未出现能量突变的频点,若是,则执行步骤106,若否,则执行步骤107。157.筛选出第二音频后,因为高解析音频随着频率的增大,能量会逐渐呈现下降趋势,且高解析音频中,一般不会存在能量突变的毛刺点(也即尖锐的声音),故本技术实施例在筛选出第二音频后,进一步判断第二音频中预设高频段的能量总趋势是否呈现下降趋势,且预设高频段内是否未出现能量突变的频点。158.具体的,对于如何判断第二音频中预设高频段的能量是否呈现下降趋势,且预设高频段内是否未出现能量突变点的过程,将在下面的实施例中进行详细描述,此处也不再赘述。159.106、若所述第二音频中预设高频段的能量呈现下降趋势,且预设高频段内未出现能量突变的频点时,则确定所述第二音频为高解析音频。160.若第二音频中预设高频段的能量呈现下降趋势,且预设高频段内未出现能量突变的频点,则确定第二音频为高解析音频。161.需要说明的是,本技术中根据第二音频的采样率,一般会设置不同的高频段,如当采样率等于48000hz,一般预设高频段为20000至24000hz,而当采样率大于48000hz且小于等于96000hz,一般预设高频段为24000hz到48000hz,而当采样率大于96000hz时,一般预设高频段也为24000hz到48000hz。162.107、若所述第二音频中预设高频段的能量未呈现下降趋势,和/或预设高频段内出现能量突变的频点时,则确定所述第二音频为非高解析音频。163.进一步,若第二音频中预设高频段的能量未呈现下降趋势,和/或预设高频段内出现能量突变的频点时,则确定所述第二音频为非高解析音频。164.本技术实施例中,先对待检测音频执行初筛选,以筛选出采样率和量化精度都满足预设标准的第一音频,然从基于有效能量的角度,从第一音频中筛选出有效频谱高度大于频率阈值的第二音频,最后再确认第二音频的预设高频段的能量呈现下降趋势,且预设高频段内无能量突变的频点时,再确认第二音频为高解析音频。也即本技术该实施例,一方面基于具体的量化标准实现对高解析音频的筛选,避免了人工主观意愿的参与,提升了高解析音频识别的准确率,另一方面还可以将该识别标准的算法设置于计算机设备上,从而提升对高解析音频识别的效率。165.基于图1所述的实施例,在步骤102和步骤103之间,为了实现从第一音频中对第二音频的高效率筛选,还可以获取第一音频的采样率和预设的采样区间,并将第一音频的采样率按照预设的采样区间,归类至目标类别音频,并在第一音频的采样率不等于目标类别音频所对应的重采样率时,将第一音频按照目标类别音频所对应的重采样率执行重采样,以使得第一音频的重采样率与目标类别音频所对应的重采样率相同,其中,不同类别的音频对应不同的重采样率。166.具体的,因为第一音频可以是采样率大于44100hz的任意频率区间的音频,而在从第一音频中筛选第二音频的过程中,有效频谱高度的确定需要按照第一音频的频率区间执行相应的换算,假设存在多个第一音频,若每个第一音频的频率区间都不相同,则需要按照每个第一音频的频率区间执行一次相应的换算。167.而为了简化该过程,也即实现从第一音频中对第二音频的高效筛选,我们可以预设不同的采样区间,并将位于不同采样区间的音频设为不同类别的音频,以按照对应类别的有效频谱高度的确定过程来确定第一音频的有效频谱高度,从而实现从第一音频中对第二音频的高效筛选。168.作为一种可选的实施方式,可以是按照下列方式来进行划分,如将采样率等于48000hz的音频,设为第一类音频;将采样率大于48000hz且小于等于96000hz的音频,设为第二类音频;将采样率大于96000hz的音频,设为第三类音频。对于第一类音频则对音频的采样率不做处理,对于第二类音频则将音频的重采样率统一为96000hz,对于第三类音频则将音频的重采样率统一为192000hz,因为根据香农采样定理,只有采样率是信号带宽(信号频率带宽)的两倍时,原来的连续信号才可以从采样样本中完全重建出来。故本技术则需要将第二类音频和第三类音频分别重采样至96000hz和192000hz。169.需要说明的是,在定义采样区间和音频类别时,可以是按照不同的标准来自定义,此处对采样区间和音频类别的定义方式不做具体限制。170.基于上述实施例,下面对图1实施例中的步骤103和104做详细描述,图2为图1实施例中步骤103和104的细化步骤:171.201、将所述第一音频分帧加窗,并执行时域与频域的转换,以得到所述第一音频中每帧音频的频域信号;172.因为语音信号一般为连续的时域信号,而为了实现对语音信号的数字化处理,需要先将语音信号离散化,以得到离散化的周期性频域信号。173.具体的,作为一种对语音信号的离散化方式,可以是对第一音频分帧加窗。因为语音信号在宏观上是不平稳的,而在微观上时平稳的,也即具有短时平稳性,故可以将语音信号分为一些短段来进行处理,而每一个短段即为一帧。174.而在对语音信号实现数字化处理的过程中,需要把长时间的信号截断,也即对语音信号进行加窗,同时使得没有周期性的语音信号呈现出周期函数的特征,而在加窗的过程中,会将一帧信号的两端部分信号削弱,故在分帧的时候,需要帧与帧之间有重叠。而具体的窗函数可以是汉明窗或矩形窗等,此处对具体的窗函数形式不做限定。175.完成对语音信号的分帧加窗后,则可以对每帧语音信号执行时域与频域的转换,以将语音信号从时域信号转换为频域信号,而作为时域和频域的一种具体转换方式,可以是傅里叶变换,短时傅里叶变换等,此处也不做具体限制。176.202、计算所述第一音频中每帧音频的能量,以根据所述第一音频中每帧音频的能量和第一能量阈值,筛选出所述第一音频中的有效帧;177.得到第一音频中每帧信号的频域信号后,进一步计算每帧音频的能量,以根据每帧音频的能量也第一能量阈值,筛选出第一音频中的有效帧。178.具体的,高解析音频必须在预设的高频段具有有效能量,故该步骤可以计算每帧音频的能量,根据每帧音频的能量和第一能量阈值,筛选出第一音频中的有效帧。179.其中,计算每帧音频的能量与信号的幅度平方相关,对于数字信号而言,每帧语音信号的能量即为各个频点信号幅度值平方后的求和。180.203、确定所述第一音频中有效帧的有效频谱高度;181.筛选出第一音频中的有效帧后,进一步确定第一音频中有效帧的有效频谱高度,具体的,对于如何确定有效频谱高度的过程将在下面的实施例中进行描述,此处不做赘述。182.204、统计所述第一音频中有效帧的有效频谱高度大于所述频率阈值的第一有效帧数量;183.得到第一音频中每个有效帧的有效频谱高度后,统计第一音频中有效帧的有效频谱高度大于频率阈值的第一有效帧数量,并根据第一有效帧的数量执行步骤205。184.具体的,该步骤中的频域阈值一般为20000hz。185.205、若所述第一音频中第一有效帧的数量与所述第一音频中总有效帧的数量比值大于第一比例阈值,则将所述第一音频视为同一目标类别的第二音频。186.若第一有效帧的数量与第一音频中总有效帧的数量比值大于第一比例阈值时,则将第一音频视为同一目标类别的第二音频。187.假设第一音频中的总有效帧数为100个,而第一有效帧为80个,第一比例阈值为60%,因为80%大于60%,则确定第一音频为第二音频。188.具体的,因为在上述过程中根据第一音频的采样率和预设的采样区间,对第一音频所隶属的目标类别做了归类,故在从第一音频中筛选出第二音频后,也相应的将第二音频视为同一目标类别,如当第一音频为第一类别音频时,则第二音频也为第一类别的音频,而当第一音频为第二类别音频时,则第二音频也为第二类别的音频,以方便后期对第一音频和第二音频的进一步处理。189.本技术实施例中,对如何从第一音频中筛选出第二音频的过程做了详细描述,提升了从第一音频中筛选第二音频过程的可靠性。190.进一步,在执行图2实施例的过程中,也即从第一音频中筛选出第二音频的过程中,为了节省计算量,还可以在步骤202之后,步骤203之前,统计第一音频中有效帧的数量与第一音频中总音频帧数的比值,若该比值小于第二比例阈值,则直接确定第一音频为非高解析音频,从而节省了步骤203至205的计算量,提升了高解析音频的检测效率。191.基于图2所述的实施例,下面接着对图2实施例中的步骤203进行详细描述,请参阅图3,图3为图2实施例中步骤203的细化步骤:192.301、将所述第一音频中的有效帧按照预设的频率间隔,划分为m个频带,每个频带包括n个频点,其中,所述m大于等于2,所述n大于等于1;193.图2实施例中得到语音帧的频域信号后,可以将每帧语音信号按照预设的频率间隔,如100hz、或500hz划分为m个频带,其中,每个频带包括n个频点,其中,m大于等于2,n大于等于1。194.为方便理解,图4给出了将一个有效帧划分为4个频带,而每个频带包括3个频点的帧信号示意图。195.302、按照目标类型的音频所对应的频带计算范围,计算所述第一音频中每个有效帧内沿着频率轴的方向,每个频带的一阶频带能量e1和相邻两个一阶频带能量之和e2,其中,不同类别的音频对应不同的频带计算范围;196.为了方便确定第一音频中有效帧的有效频谱高度,前述实施例中对音频按照预设的采样区间做了类别划分,为了描述的一致性,此处沿用前述的类别划分标准和高频段的设置范围,如将采样率等于48000hz的音频,设为第一类音频;将采样率大于48000hz且小于等于96000hz的音频,设为第二类音频;将采样率大于96000hz的音频,设为第三类音频;当采样率等于48000hz,一般预设高频段为20000至24000hz,而当采样率大于48000hz且小于等于96000hz,一般预设高频段为24000hz到48000hz,而当采样率大于96000hz时,一般预设高频段也为24000hz到48000hz。197.为方便描述,假设第一音频为第一类别音频,则第一类别音频的频带计算范围最高到24000hz,如对于图4中的每个频点,假设分别标记为1、2、3...12个频点,频带分别标记为第一频带、第二频带、第三频带和第四频带,分别计算每个频点的能量(其中,最高频点的频率范围不能大于24000hz),其中,频点的能量为频点信号幅度值的平方。198.得到每个频点的能量后,则对应频带的能量为频点能量的平均值,如第一频带的能量为1、2、3频点能量的平均值,第二频带能量为4、5、6频点能量的平均值,第三频带为7、8、9频点能量的平均值,第四频带为10、11、12频点能量的平均值。具体在计算频带能量时,为了避免异常频点对于频带能量所带来的影响,还可以是去除每个频带中的一个最大值,一个最小是,然后再计算平均值。199.得到每个频带的能量后,则第一频带的一阶频带能量e1为第二频带的能量与第一频带能量的差值,假设第一频带能量为x1,第二频带能量为x2,第三频带能量为x3,第四频带能量为x4,则e1=x2-x1;而第二频带的一阶频带能量e1为x3-x2,第三频带的一阶频带能量e1为x4-x3,而相邻两个一阶频带能量之和e2分别为x3-x1,x4-x2。200.303、根据所述第一音频中每个有效帧内每个频带所对应的e1或e2,以及有效频谱高度确定规则,确定所述第一音频中每个有效帧的有效频谱高度。201.得到第一音频中每个有效帧内每个频带所对应的e1和e2后,则进一步根据每个频带所对应的e1和e2,以及有效频谱高度确定规则,确定第一音频中每个有效帧的有效频谱高度。202.具体的,有效频谱高度确定规则包括:确定有效帧能量开始下降的拐点频带,将拐点频带的频率确定为有效帧的有效频谱高度。203.下面结合每个频带所对应的e1和e2,对确定有效帧能量开始下降的拐点频带的过程进行描述:204.确定第一音频中每个有效帧内最大e2值对应的第一频带,若第一频带的e1值大于第二能量阈值,或沿频率轴的方向与第一频带相邻的第二频带的e2值大于第三能量阈值,则将第一频带视为拐点频带,其中,第二能量阈值和第三能量阈值用于表征拐点频带的能量范围;或,若第一频带的能量小于无效能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度。205.假设步骤302中,e2的最大值为x3-x1,则最大e2值对应的第一频带为图4中的第一频带,若第一频带的e1值(即x2-x1)大于第二能量阈值(经验值为20db),或图4中第二频带的e2(即x4-x2)值大于第三能量阈值(经验值为40db),则确定图4中的第一频带为该有效帧中的拐点频带,则第一频带的频率即为该有效帧的有效频谱高度。206.当上述规则不适用时,也即按照e1和e2确定不了拐点频带时,则进一步判断最大e2值所对应的第一频带能量是否小于无效能量阈值,如果是,则将第一频带视为拐点频带,然后将拐点频带的频率确定为有效帧的有效频谱高度。207.本技术实施例中对确定第一音频中每个有效帧的有效频谱高度的过程做了详细描述,提升了本技术实施例中确定每个有效帧的有效频谱高度的可靠性。208.基于上述实施例,因为高解析音频在预设高频段的能量呈下降趋势,故本技术实施例对第二解析音频中预设高频段的音频是否呈下降趋势的判断过程进行描述,请参阅图5,图5为图1实施例中步骤105的细化步骤:209.501、按照目标类别音频预设高频段中的多个预设中心频带和预设高频点,计算所述第二音频中每帧音频的多个预设中心频带与预设高频点的多个能量差值,其中,多个预设中心频带的频率依次增大,但均小于预设高频点的频率,其中,不同类别的音频对应不同的多个预设中心频带和不同的预设高频点;210.因为高解析音频在预设高频段的能量呈下降趋势,故本技术实施例对第二音频中预设高频段的能量是否呈下降趋势的判断过程进行描述,基于与前述实施例描述的一致性,本技术还是采用如下分类标准:采样率等于48000hz的音频,设为第一类音频;将采样率大于48000hz且小于等于96000hz的音频,设为第二类音频;将采样率大于96000hz的音频,设为第三类音频。211.本技术实施例中对于第一类音频,预设的高频段是20000hz至24000hz,对于第二类音频和第三类音频,预设的高频段是从24000hz到48000hz,而对于第一类音频,多个预设中心频段为18000hz、20000hz、22000hz,预设高频点为24000hz;对于第二类音频,多个预设中心频段为26000hz、36000hz、42000hz,预设高频点为48000hz;对于第二类音频,多个预设中心频段为26000hz、36000hz、46000hz,预设高频点为48000hz。212.需要说明的是,对于不同类别中的多个预设中心频带和预设高频点,用户可以根据自己的实际测量需求进行自定义,而上述三类音频中的多个预设中心频带和预设高频点,只是一种具体的实施方式,此处对每类音频中多个预设中心频带和预设高频点的数值不做具体限制。213.假设第二音频为第一类音频,则分别计算第二音频中每个有效帧以18000hz为中心频带到以24000hz为中心频带的第一能量差值,以及每个有效帧以20000hz为中心频带到以24000hz为中心频带的第二能量差值,以及每个有效帧以22000hz为中心频带到以24000hz为中心频带的第三能量差值,并进一步比较第一能量差值、第二能量差值和第三能量差值与对应能量差值阈值的关系。214.容易理解的是,为了体现出第一音频的高频段的能量呈现下降趋势,则与第一能量差值、第二能量差值、第三能量差值分别对应的三个能量差值阈值依次呈现减小的趋势。215.若第二音频属于第二类音频或第三类音频,则采用相同的方法分别计算多个预设中心频带与预设高频点的多个能量差值。216.502、统计所述第二音频中所述多个能量差值均大于对应多个阈值的第二有效帧数量,其中,与所述多个能量差值分别对应的多个阈值随着所述多个预设中心频带的频率的增大而减小;217.得到第二音频中多个预设高频中心频带与预设高频点之间的多个能量差值后,进一步统计第二音频中多个能量差值均大于对应多个阈值的第二有效帧数量。218.503、判断第二有效帧数量与所述第二音频中总音频帧数的比值是否不小于第三比例阈值,若是,则执行步骤504,若否,则执行步骤505。219.得到第二音频中多个能量差值均大于对应多个阈值的第二有效帧数量以后,进一步判断第二有效帧数量与第二音频中总音频帧数的比值是否不小于第三比例阈值,若是,则执行步骤504,若否,则执行步骤505。220.具体的,此处的第三比例阈值可以是60%或70%,此处对第三比例阈值的具体数值不做具体限定。221.504、若所述第二有效帧数量与所述第二音频中总音频帧数的比值不小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势呈现下降趋势。222.若第二有效帧数量与第二音频中总音频帧数的比值不小于第三比例阈值,则表征第二音频中预设高频段的能量总趋势呈现下降趋势。223.505、若所述第二有效帧数量与所述第二音频中总音频帧数的比值小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势未呈现下降趋势。224.若第二有效帧数量与第二音频中总音频帧数的比值小于第三比例阈值,则表征第二音频中预设高频段的能量总趋势未呈现下降趋势。225.本技术实施例中对第二音频中预设高频段的能量是否呈现下降趋势的过程做了详细描述,提升了对第二音频中预设高频段能量呈现下降趋势判断过程的可靠性。226.基于上述实施例,下面接着对本技术实施例中高解析音频的音质检测方法做详细描述,请参阅图6,图6为本技术实施例中高解析音频的音质检测方法的另一个实施例:227.601、获取待检测音频的采样率和量化精度;228.602、从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频;229.603、确定所述第一音频的有效频谱高度,所述有效频谱高度为音频最大能量处所对应的频率;230.604、从第一音频中筛选出有效频谱高度大于频率阈值的第二音频;231.需要说明的是,本技术实施例中的步骤601至604与图1实施例中步骤101至104的描述类似,此处不再赘述。232.605、按照目标类别音频预设高频段中的多个预设中心频带和预设高频点,计算所述第二音频中每帧音频的多个预设中心频带与预设高频点的多个能量差值,其中,多个预设中心频带的频率依次增大,但均小于预设高频点的频率,其中,不同类别的音频对应不同的多个预设中心频带和不同的预设高频点;233.606、统计所述第二音频中所述多个能量差值均大于对应多个阈值的第二有效帧数量,其中,与所述多个能量差值分别对应的多个阈值随着所述多个预设中心频带的频率的增大而减小;234.607、判断第二有效帧数量与所述第二音频中总音频帧数的比值是否不小于第三比例阈值,若是,则执行步骤608,若否,则执行步骤609。235.608、若所述第二有效帧数量与所述第二音频中总音频帧数的比值不小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势呈现下降趋势。236.609、若所述第二有效帧数量与所述第二音频中总音频帧数的比值小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势未呈现下降趋势。237.需要说明的是,本技术实施例中步骤605至609的描述,与图5实施例中步骤501至505的描述类似,此处不再赘述。238.610、按照目标类别音频的预设高频段,获取所述第二音频中每个音频帧的所述预设高频段,其中,不同类别的音频设有不同的高频段范围;239.对于音频的分类区间和分类标准,以及每类音频中的预设高频段与上述实施例中描述的一致,此处不再赘述。240.假设第二音频属于第一类音频,则按照目标类别音频的预设高频点(也即第一类音频的预设高频段),分别获取第二音频中每个音频帧的预设高频段,其中,第一类音频的预设高频段为20000hz至24000hz,对于第二类音频和第三类音频,预设的高频段是从24000hz到48000hz。241.611、计算所述第二音频中每个音频帧预设高频段的能量分布区间;242.得到第二音频中每个音频帧的预设高频段后,分别计算第二音频帧中每个音频帧预设高频段的能量分布区间,其中,第一类音频是计算20000hz至24000hz之间的能量分布区间,第二类音频和第三类音频则是计算24000hz至48000hz之间的能量分布区间。243.612、统计所述能量分布区间内无异常频点的第三有效帧数量,其中,异常频点为频点能量大于能量分布区间临界值的频点;244.得到第二音频中每个音频帧预设高频段的能量分布区间后,进一步统计能量分布区间内无异常频点的第三有效帧的数量,其中,异常频点为频带能量大于能量分布区间临界值的频点。245.如假设第二音频各个音频帧预设高频段的能量分布区间为[-75db,-100db],若在[-75db,-100db]能量区间内,存在能量大于-75db的频点,或能量小于-100db的频点,则将该频点视为异常频点。[0246]613、判断所述第三有效帧数量与所述第二音频中总音频帧的数量比值是否不小于第四比例阈值,若是,则执行步骤614,若否,则执行步骤615。[0247]得到能量分布区间内无异常频点的第三有效帧数量后,进一步判断第三有效帧数量与所述第二音频中总音频帧的数量比值是否不小于第四比例阈值,若是,则执行步骤614,若否,则执行步骤615。[0248]具体的,此处的第四比例阈值可以是60%或70%,此处对第四比例阈值的具体数值不做具体限定。[0249]614若所述第三有效帧数量与所述第二音频中总音频帧的数量比值不小于第四比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点,将第二音频确定为高解析音频。[0250]得到第二音频中第三有效帧的数量后,则进一步获取第三有效帧数量与第二音频中总音频帧数的比值,若该比例不小于第四比例阈值,则表征第二音频预设高频段内未出现能量突变的频点,则将第二音频确定为高解析音频。[0251]615、若所述第三有效帧数量与所述第二音频中总音频帧的数量比值小于第四比例阈值,则表征所述第二音频预设高频段内出现能量突变的频点,则将第二音频确定为非高解析音频。[0252]得到第二音频中第三有效帧的数量后,则进一步获取第三有效帧数量与第二音频中总音频帧数的比值,若该比例小于第四比例阈值,则表征第二音频预设高频段内出现能量突变的频点,则将第二音频确定为非高解析音频。[0253]本技术实施例中,对预设高频段内是否存在能量突变频点的判断过程做了详细描述,提升了该过程的可靠性。[0254]基于图6所述的实施例,是从帧的角度对帧内是否存在能量突变频点的过程进行描述,可是在图6实施例的判断过程中,假设在该帧的末尾出现一个能量突变的频点,如图7框线中的异常频点时,则可能会因为能量计算的过程中,采用平均的方式而忽略掉该频点,故本技术实施例还可以从帧内频带的角度,来对异常频点的判断过程进行描述,请参阅图8,图8为本技术实施例中高解析音频的音质检测方法的另一个实施例:[0255]801、获取待检测音频的采样率和量化精度;[0256]802、从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频;[0257]803、确定所述第一音频的有效频谱高度,所述有效频谱高度为音频最大能量处所对应的频率;[0258]804、从第一音频中筛选出有效频谱高度大于频率阈值的第二音频;[0259]需要说明的是,本技术实施例中的步骤801至804与图1实施例中步骤101至104的描述类似,此处不再赘述。[0260]805、按照目标类别音频预设高频段中的多个预设中心频带和预设高频点,计算所述第二音频中每帧音频的多个预设中心频带与预设高频点的多个能量差值,其中,多个预设中心频带的频率依次增大,但均小于预设高频点的频率,其中,不同类别的音频对应不同的多个预设中心频带和不同的预设高频点;[0261]806、统计所述第二音频中所述多个能量差值均大于对应多个阈值的第二有效帧数量,其中,与所述多个能量差值分别对应的多个阈值随着所述多个预设中心频带的频率的增大而减小;[0262]807、判断第二有效帧数量与所述第二音频中总音频帧数的比值是否不小于第三比例阈值,若是,则执行步骤808,若否,则执行步骤809。[0263]808、若所述第二有效帧数量与所述第二音频中总音频帧数的比值不小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势呈现下降趋势。[0264]809、若所述第二有效帧数量与所述第二音频中总音频帧数的比值小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势未呈现下降趋势。[0265]需要说明的是,本技术实施例中步骤805至809的描述,与图5实施例中步骤501至505的描述类似,此处不再赘述。[0266]810、利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;[0267]在步骤808中确认出的第二音频中的预设高频段能量呈现下降趋势后,可以进一步利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围。[0268]811、针对所述第二音频中的每个音频帧,统计所述滑动窗口内所有频点能量的一阶差分之和;[0269]为描述方便,假设滑动窗口的大小为3个频点的频谱范围,则滑动窗口内所有频点的一阶差分之和分别对应为第三频点的能量与第一频点能量的差值、第四频点的能量与第二频点能量的差值、第五频点与第三频点能量的差值等,后面依次类推。[0270]812、判断所述滑动窗口内是否所有频点能量的一阶差分之和的符号为负,且大于第四能量阈值,或,所述滑动窗口内是否所有频点能量的一阶差分之和的符号为正,且小于第五能量阈值,若是,则执行步骤813,若否,则执行步骤814;[0271]若滑动窗口内所有频点能量的一阶差分之和的符号为负,且大于第四能量阈值,则确定所述第二音频中的音频帧为正常帧,因为滑动窗口内所有频点的一阶差分之和的符号为负,则说明滑动窗口内频点的能量呈现下降趋势,而若大于第四能量阈值,说明该滑动窗口内的频点没有出现能量突然下降的频点,也即没有能量发生突变的频点。[0272]而若所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且小于第五能量阈值,则确定所述所述第二音频中的音频帧为正常帧,是因为滑动窗口内所有频点的一阶差分之和的符号为正,说明滑动窗口内频点的能量呈现上升趋势,而若小于第五能量阈值,说明该滑动窗口内的频点能量虽然呈现上升趋势,但该能量上升的频点的能量没有出现突变,也即没有能量发生突变的频点。[0273]因为在帧的预设高频段的能量呈现下降趋势的前提下,是允许该音频帧的频点出现能量螺旋式上升或螺旋式下降的,只要不出现能量突变的频点即可。[0274]故本技术实施例可以判断滑动窗口内所有频点能量的一阶差分之和的符号为负,且大于第四能量阈值,或,所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且小于第五能量阈值,并在若是时,执行步骤813,在若否时,执行步骤814。[0275]813、若所述滑动窗口内所有频点能量的一阶差分之和的符号为负,且大于第四能量阈值,或,若所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且小于第五能量阈值,则确定所述所述第二音频中的音频帧为正常帧;[0276]若所述滑动窗口内所有频点能量的一阶差分之和的符号为负,且大于第四能量阈值,或,若所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且小于第五能量阈值,则说明滑动窗口内没有出现能量发生突变的频点,则确定所述所述第二音频中的音频帧为正常帧;[0277]814、若所述滑动窗口内所有频点能量的一阶差分之和的符号为负,且不大于第四能量阈值,和/或,若所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且不小于第五能量阈值,则确定所述所述第二音频中的音频帧为非正常帧;[0278]若所述滑动窗口内所有频点能量的一阶差分之和的符号为负,且不大于第四能量阈值,和/或,若所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且不小于第五能量阈值,则说明滑动窗口内出现了能量发生突变的频点,则确定所述所述第二音频中的音频帧为非正常帧。[0279]815、统计所述第二音频中正常帧的比例,判断第二音频中正常帧的比例是否不小于第五比例阈值,若是,则执行步骤816,若否,则执行步骤817。[0280]统计出第二音频中正常帧的比例后,进一步判断第二音频中正常帧的比例是否不小于第五比例阈值,若是,则执行步骤816,若否,则执行步骤817。[0281]816、表征所述第二音频预设高频段内未出现能量突变的频点,确定所述第二音频为高解析音频。[0282]统计第二音频中正常帧的比例,若第二音频中正常帧的比例不小于第五比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点,并确定所述第二音频为高解析音频。[0283]817、表征所述第二音频预设高频段内出现能量突变的频点,确定所述第二音频为非高解析音频。[0284]统计第二音频中正常帧的比例,若第二音频中正常帧的比例小于第五比例阈值,则表征所述第二音频预设高频段内出现能量突变的频点,并确定所述第二音频为非高解析音频。[0285]本技术实施例,从帧内频带的角度描述了第二音频预设高频段内未出现能量突变频点的过程,且从帧内频带角度识别能量突变频点的过程,较从帧的角度识别能量突变频点的过程而言,识别的准确率会更高。[0286]基于图8所述的实施例,为了实现更小颗粒度对能量突变频点的识别,还可以从频点的角度对第二音频预设高频点内未出现能量突变频点的过程进行描述,请参阅图9,图9为本技术实施例中高解析音频的音质检测方法的另一个实施例:[0287]901、获取待检测音频的采样率和量化精度;[0288]902、从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频;[0289]903、确定所述第一音频的有效频谱高度,所述有效频谱高度为音频最大能量处所对应的频率;[0290]904、从第一音频中筛选出有效频谱高度大于频率阈值的第二音频;[0291]需要说明的是,本技术实施例中的步骤901至904与图1实施例中步骤101至104的描述类似,此处不再赘述。[0292]905、按照目标类别音频预设高频段中的多个预设中心频带和预设高频点,计算所述第二音频中每帧音频的多个预设中心频带与预设高频点的多个能量差值,其中,多个预设中心频带的频率依次增大,但均小于预设高频点的频率,其中,不同类别的音频对应不同的多个预设中心频带和不同的预设高频点;[0293]906、统计所述第二音频中所述多个能量差值均大于对应多个阈值的第二有效帧数量,其中,与所述多个能量差值分别对应的多个阈值随着所述多个预设中心频带的频率的增大而减小;[0294]907、判断第二有效帧数量与所述第二音频中总音频帧数的比值是否不小于第三比例阈值,若是,则执行步骤908,若否,则执行步骤909。[0295]908、若所述第二有效帧数量与所述第二音频中总音频帧数的比值不小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势呈现下降趋势。[0296]909、若所述第二有效帧数量与所述第二音频中总音频帧数的比值小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势未呈现下降趋势。[0297]需要说明的是,本技术实施例中步骤905至909的描述,与图5实施例中步骤501至505的描述类似,此处不再赘述。[0298]910、利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;[0299]在步骤908中确认出的第二音频中的预设高频段能量呈现下降趋势后,可以进一步利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围。[0300]911、针对所述第二音频中的每个音频帧,统计所述滑动窗口内每个频点能量的一阶差分之和;[0301]为描述方便,同样也假设滑动窗口的大小为3个频点的频谱范围,区别于图8所述实施例中计算滑动窗口内所有频点的一阶差分之和,图9是统计滑动每个频点的一阶差分之和,而滑动窗口内每个频点的一阶差分之和分别为第二频点与第一频点的能量之差、第三频点与第二频点的能量之差、第四频点与第三频点的能量之差,然后依次类推。[0302]912、判断所述滑动窗口内是否每个频点能量的一阶差分之和的符号为负,且大于第六能量阈值;或所述滑动窗口内是否每个频点能量的一阶差分之和的符合为正,且小于第七能量阈值,若是,则执行步骤913,若否,则执行步骤914。[0303]因为所述滑动窗口内每个频点能量的一阶差分之和的符号为负,且大于第六能量阈值时,也即说明滑动窗口内频点的能量呈现下降趋势,而若大于第六能量阈值,说明该滑动窗口内的频点没有出现能量突然下降的频点,也即没有能量发生突变的频点。[0304]而所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且小于第七能量阈值,则说明滑动窗口内频点的能量呈现上升趋势,而小于第七能量阈值,说明该滑动窗口内的频点没有出现能量突然上升的频点,也即没有能量发生突变的频点。[0305]因为在帧内的预设高频段的能量总趋势呈现下降趋势的前提下,是允许该音频帧的频点出现能量螺旋式上升或螺旋式下降的,只要不出现能量突变的频点即可。[0306]故本技术实施例可以判断滑动窗口内每个频点能量的一阶差分之和的符号为负,且大于第六能量阈值;或所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且小于第七能量阈值,并在若是时,执行步骤913,而在若否时,执行步骤914。[0307]913、若所述滑动窗口内每个频点能量的一阶差分之和的符号为负,且大于第六能量阈值,或,若所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且小于第七能量阈值,则确定所述第二音频中的音频帧为正常帧;[0308]若所述滑动窗口内每个频点能量的一阶差分之和的符号为负,且大于第六能量阈值,或,若所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且小于第七能量阈值,则确定所述第二音频中的音频帧为正常帧。[0309]914、若所述滑动窗口内每个频点能量的一阶差分之和的符号为负,且不大于第六能量阈值,和/或,若所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且不小于第七能量阈值,则确定所述第二音频中的音频帧为非正常帧;[0310]若所述滑动窗口内每个频点能量的一阶差分之和的符号为负,且不大于第六能量阈值,和/或,若所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且不小于第七能量阈值,则确定所述第二音频中的音频帧为非正常帧。[0311]915、统计所述第二音频中正常帧的比例,判断所述第二音频中正常帧的比例是否不小于第六比例阈值,若是,执行步骤916,若否,则执行步骤917。[0312]因为第二音频帧中正常帧的比例超出一定阈值,则表征第二音频帧的高频段内未出现能量突变的频点,则执行步骤916,若第二音频帧中正常帧的比例未超出一定阈值,则表征第二音频帧的高频段内出现能量突变的频点,则执行步骤917。[0313]需要说明的是,此处的第六比例阈值可以是50%,或60%,用户可以根据实际情况进行自定义,此处不做具体限制。[0314]916、表征所述第二音频预设高频段内未出现能量突变的频点,并确定所述第二音频为高解析音频。[0315]若第二音频帧中正常帧的比例超出第六比例阈值,则表征第二音频帧的高频段内未出现能量突变的频点,则进一步确定第二音频为高解析音频。[0316]917、表征所述第二音频预设高频段内出现能量突变的频点,确定第二音频为非解析音频。[0317]若第二音频帧中正常帧的比例未超出第六比例阈值,则表征第二音频帧的高频段内出现能量突变的频点,则进一步确定第二音频为非高解析音频。[0318]本技术实施例,从帧内频点的角度描述了第二音频预设高频段内未出现能量突变频点的过程,且从帧内频点角度识别能量突变频点的过程,较从帧内频带的角度识别能量突变频点的过程而言,识别的准确率会更高。[0319]进一步,基于图8或图9所述的实施例,在利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧之前,还可以先利用平滑滤波器(如savitzky-golay滤波器、均值滤波器或中值滤波器等)对第二音频中的每个音频帧执行平滑处理,以滤除第二音频中的噪声。[0320]上面对本技术实施例中高解析音频的音质检测方法做了描述,下面接着对本技术实施例中高解析音频的音质检测装置进行描述,请参阅图10,图10为本技术实施例中高解析音频的音质检测装置的一个实施例示意图:[0321]获取单元1001,用于获取待检测音频的采样率和量化精度;[0322]第一筛选单元1002,用于从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频;[0323]确定单元1003,用于确定所述第一音频的有效频谱高度,所述有效频谱高度为音频最大能量处所对应的频率;[0324]第二筛选单元1004,用于从所述第一音频中筛选出有效频谱高度大于频率阈值的第二音频;[0325]所述确定单元1003,还用于若所述第二音频中预设高频段的能量总趋势呈现下降趋势,且预设高频段内未出现能量突变的频点时,则确定所述第二音频为高解析音频。[0326]优选的,所述获取单元还用于1001:[0327]在从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频之后,获取所述第一音频的有效频谱高度之前,获取所述第一音频的采样率;[0328]所述装置还包括:[0329]归类单元1005,用于按照预设的多个采样区间,将所述第一音频归类至目标类别音频,其中,每个采样区间对应不同类别的音频;[0330]重采样单元1006,用于若所述第一音频的采样率不等于目标类别音频所对应的重采样率,则将所述第一音频按照目标类别音频所对应的重采样率执行重采样,以使得所述第一音频的重采样率与目标类别音频所对应的重采样率相同,其中,不同类别的音频对应不同的重采样率。[0331]优选的,所述确定单元1003具体用于:[0332]将所述第一音频分帧加窗,并执行时域与频域的转换,以得到所述第一音频中每帧音频的频域信号;[0333]计算所述第一音频中每帧音频的能量,以根据所述第一音频中每帧音频的能量和第一能量阈值,筛选出所述第一音频中的有效帧;[0334]确定所述第一音频中有效帧的有效频谱高度。[0335]优选的,所述第二筛选单元1004具体用于:[0336]统计所述第一音频中有效帧的有效频谱高度大于所述频率阈值的第一有效帧数量;[0337]若所述第一音频中第一有效帧的数量与所述第一音频中总有效帧的数量比值大于第一比例阈值,则将所述第一音频视为同一目标类别的第二音频。[0338]优选的,所述确定单元1003还用于:[0339]在筛选出所述第一音频中的有效帧之后,所述确定所述第一音频中有效帧的有效频谱高度之前,若所述第一音频中有效帧的数量与所述第一音频中总音频帧数的比值小于第二比例阈值,则确定所述第一音频为非高解析音频。[0340]优选的,所述确定单元1003具体用于:[0341]将所述第一音频中的有效帧按照预设的频率间隔,划分为m个频带,每个频带包括n个频点,其中,所述m大于等于2,所述n大于等于1;[0342]按照目标类别音频所对应的频带计算范围,计算所述第一音频中每个有效帧内沿着频率轴的方向,每个频带的一阶频带能量e1和相邻两个一阶频带能量之和e2,其中,不同类别的音频对应不同的频带计算范围;[0343]根据所述第一音频中每个有效帧内每个频带所对应的e1或e2,以及有效频谱高度确定规则,确定所述第一音频中每个有效帧的频谱高度。[0344]优选的,所述有效频谱高度确定规则包括:[0345]确定每个帧能量开始下降的拐点频带,将拐点频带的频率确定为每个帧的有效频谱高度。[0346]优选的,所述确定单元1003具体用于:[0347]获取第一音频中每个有效帧内最大e2值所对应的第一频带;[0348]若第一频带的e1值大于第二能量阈值,或沿频率轴的方向与所述第一频带相邻的第二频带的e2值大于第三能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度,其中,所述第二能量阈值和所述第三能量阈值用于表征拐点频带的能量变化范围;[0349]或,[0350]若第一频带的能量小于无效能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度。[0351]优选的,所述确定单元1003具体用于:[0352]按照目标类别音频预设高频段中的多个预设中心频带和预设高频点,计算所述第二音频中每帧音频的多个预设中心频带与预设高频点的多个能量差值,其中,多个预设中心频带的频率依次增大,但均小于预设高频点的频率,其中,不同类别的音频对应不同的多个预设中心频带和不同的预设高频点;[0353]统计所述第二音频中所述多个能量差值均大于对应多个阈值的第二有效帧数量,其中,与所述多个能量差值分别对应的多个阈值随着所述多个预设中心频带的频率的增大而减小;[0354]若所述第二有效帧数量与所述第二音频中总音频帧数的比值不小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势呈现下降趋势。[0355]优选的,所述确定单元1003具体用于:[0356]按照目标类别音频的预设高频段,获取所述第二音频中每个音频帧的所述预设高频段,其中,不同类别的音频设有不同的高频段范围;[0357]计算所述第二音频中每个音频帧预设高频段的能量分布区间;[0358]统计所述能量分布区间内无异常频点的第三有效帧数量,其中,异常频点为频点能量大于能量分布区间临界值的频点;[0359]若所述第三有效帧数量与所述第二音频中总音频帧的数量比值不小于第四比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;[0360]确定所述第二音频为高解析音频。[0361]优选的,所述确定单元1003具体用于:[0362]利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;[0363]针对所述第二音频中的每个音频帧,统计所述滑动窗口内所有频点能量的一阶差分之和;[0364]若所述滑动窗口内所有频点能量的一阶差分之和的符合为负,且大于第四能量阈值,则确定所述第二音频中的音频帧为正常帧;[0365]或,[0366]若所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且小于第五能量阈值,则确定所述所述第二音频中的音频帧为正常帧;[0367]统计所述第二音频中正常帧的比例,若所述第二音频中正常帧的比例不小于第五比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;[0368]确定所述第二音频为高解析音频。[0369]优选的,所述确定单元1003具体用于:[0370]利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;[0371]针对所述第二音频中的每个音频帧,统计所述滑动窗口内每个频点能量的一阶差分之和;[0372]若所述滑动窗口内每个频点能量的一阶差分之和的符号为负,且大于第六能量阈值,则确定所述第二音频中的音频帧为正常帧;[0373]或,[0374]若所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且小于第七能量阈值,则确定所述第二音频中的音频帧为正常帧;[0375]统计所述第二音频中正常帧的比例,若所述第二音频中正常帧的比例不小于第六比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;[0376]确定所述第二音频为高解析音频。[0377]优选的,所述装置还包括:[0378]预处理单元1007,用于在所述利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧之前,利用平滑滤波器对所述第二音频中的每个音频帧执行平滑处理。[0379]需要说明的是,本技术实施例中各单元的作用与图1至图9实施例中描述的类似,此处不再赘述。[0380]本技术实施例中,先利用第一筛选单元1002对待检测音频执行初筛选,以筛选出采样率和量化精度都满足预设标准的第一音频,然后基于效能量的角度,利用第二筛选单元1004从第一音频中筛选出有效频谱高度大于频率阈值的第二音频,最后通过确定单元1003在确认第二音频的预设高频段的能量呈现下降趋势,且预设高频段内无能量突变的频点时,再确认第二音频为高解析音频。也即本技术该实施例,一方面基于具体的量化标准实现对高解析音频的筛选,避免了人工主观意愿的参与,提升了高解析音频识别的准确率,另一方面还可以将该识别标准的算法设置于计算机设备上,从而提升对高解析音频识别的效率。[0381]上面从模块化的角度对本技术实施例中的高解析音频的音质检测装置进行了描述,下面接着从硬件处理的角度对本发明实施例中的计算机装置进行描述:[0382]该计算机装置用于实现高解析音频的音质检测装置的功能,本发明实施例中计算机装置一个实施例包括:[0383]处理器以及存储器;[0384]存储器用于存储计算机程序,处理器用于执行存储器中存储的计算机程序时,可以实现如下步骤:[0385]获取待检测音频的采样率和量化精度;[0386]从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频;[0387]确定所述第一音频的有效频谱高度,所述有效频谱高度为音频最大能量处所对应的频率;[0388]从所述第一音频中筛选出有效频谱高度大于频率阈值的第二音频;[0389]若所述第二音频中预设高频段的能量总趋势呈现下降趋势,且预设高频段内未出现能量突变的频点时,则确定所述第二音频为高解析音频。[0390]在本发明的一些实施例中,在从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频之后,获取所述第一音频的有效频谱高度之前,处理器,还可以用于实现如下步骤:[0391]获取所述第一音频的采样率;[0392]按照预设的多个采样区间,将所述第一音频归类至目标类别音频,其中,每个采样区间对应不同类别的音频;[0393]若所述第一音频的采样率不等于目标类别音频所对应的重采样率,则将所述第一音频按照目标类别音频所对应的重采样率执行重采样,以使得所述第一音频的重采样率与目标类别音频所对应的重采样率相同,其中,不同类别的音频对应不同的重采样率。[0394]在本发明的一些实施例中,处理器,还可以用于实现如下步骤:[0395]将所述第一音频分帧加窗,并执行时域与频域的转换,以得到所述第一音频中每帧音频的频域信号;[0396]计算所述第一音频中每帧音频的能量,以根据所述第一音频中每帧音频的能量和第一能量阈值,筛选出所述第一音频中的有效帧;[0397]确定所述第一音频中有效帧的有效频谱高度。[0398]在本发明的一些实施例中,处理器,还可以用于实现如下步骤:[0399]统计所述第一音频中有效帧的有效频谱高度大于所述频率阈值的第一有效帧数量;[0400]若所述第一音频中第一有效帧的数量与所述第一音频中总有效帧的数量比值大于第一比例阈值,则将所述第一音频视为同一目标类别的第二音频。[0401]在本发明的一些实施例中,在筛选出所述第一音频中的有效帧之后,所述确定所述第一音频中有效帧的有效频谱高度之前,处理器,还可以用于实现如下步骤:[0402]若所述第一音频中有效帧的数量与所述第一音频中总音频帧数的比值小于第二比例阈值,则确定所述第一音频为非高解析音频。[0403]在本发明的一些实施例中,处理器,还可以用于实现如下步骤:[0404]将所述第一音频中的有效帧按照预设的频率间隔,划分为m个频带,每个频带包括n个频点,其中,所述m大于等于2,所述n大于等于1;[0405]按照目标类型的音频所对应的频带计算范围,计算所述第一音频中每个有效帧内沿着频率轴的方向,每个频带的一阶频带能量e1和相邻两个一阶频带能量之和e2,其中,不同类别的音频对应不同的频带计算范围;[0406]根据所述第一音频中每个有效帧内每个频带所对应的e1或e2,以及有效频谱高度确定规则,确定所述第一音频中每个有效帧的频谱高度。[0407]在本发明的一些实施例中,所述有效频谱高度确定规则包括:[0408]确定每个帧能量开始下降的拐点频带,将拐点频带的频率确定为每个帧的有效频谱高度。[0409]在本发明的一些实施例中,处理器,还可以用于实现如下步骤:[0410]确定有效帧能量开始下降的拐点频带,将拐点频带的频率确定为有效帧的有效频谱高度。[0411]在本发明的一些实施例中,处理器,还可以用于实现如下步骤:[0412]获取第一音频中每个有效帧内最大e2值所对应的第一频带;[0413]若第一频带的e1值大于第二能量阈值,或沿频率轴的方向与所述第一频带相邻的第二频带的e2值大于第三能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度,其中,所述第二能量阈值和所述第三能量阈值用于表征拐点频带的能量变化范围;[0414]或,[0415]若第一频带的能量小于无效能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度。[0416]在本发明的一些实施例中,处理器,还可以用于实现如下步骤:[0417]按照目标类别音频预设高频段中的多个预设中心频带和预设高频点,计算所述第二音频中每帧音频的多个预设中心频带与预设高频点的多个能量差值,其中,多个预设中心频带的频率依次增大,但均小于预设高频点的频率,其中,不同类别的音频对应不同的多个预设中心频带和不同的预设高频点;[0418]统计所述第二音频中所述多个能量差值均大于对应多个阈值的第二有效帧数量,其中,与所述多个能量差值分别对应的多个阈值随着所述多个预设中心频带的频率的增大而减小;[0419]若所述第二有效帧数量与所述第二音频中总音频帧数的比值不小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势呈现下降趋势。[0420]在本发明的一些实施例中,处理器,还可以用于实现如下步骤:[0421]按照目标类别音频的预设高频段,获取所述第二音频中每个音频帧的所述预设高频段,其中,不同类别的音频设有不同的高频段范围;[0422]计算所述第二音频中每个音频帧预设高频段的能量分布区间;[0423]统计所述能量分布区间内无异常频点的第三有效帧数量,其中,异常频点为频点能量大于能量分布区间临界值的频点;[0424]若所述第三有效帧数量与所述第二音频中总音频帧的数量比值不小于第四比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;[0425]确定所述第二音频为高解析音频。[0426]在本发明的一些实施例中,处理器,还可以用于实现如下步骤:[0427]利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;[0428]针对所述第二音频中的每个音频帧,统计所述滑动窗口内所有频点能量的一阶差分之和;[0429]若所述滑动窗口内所有频点能量的一阶差分之和的符合为负,且大于第四能量阈值,则确定所述第二音频中的音频帧为正常帧;[0430]或,[0431]若所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且小于第五能量阈值,则确定所述所述第二音频中的音频帧为正常帧;[0432]统计所述第二音频中正常帧的比例,若所述第二音频中正常帧的比例不小于第五比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;[0433]确定所述第二音频为高解析音频。[0434]在本发明的一些实施例中,处理器,还可以用于实现如下步骤:[0435]利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;[0436]针对所述第二音频中的每个音频帧,统计所述滑动窗口内每个频点能量的一阶差分之和;[0437]若所述滑动窗口内每个频点能量的一阶差分之和的符号为负,且大于第六能量阈值,则确定所述第二音频中的音频帧为正常帧;[0438]或,[0439]若所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且小于第七能量阈值,则确定所述第二音频中的音频帧为正常帧;[0440]统计所述第二音频中正常帧的比例,若所述第二音频中正常帧的比例不小于第六比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;[0441]确定所述第二音频为高解析音频。[0442]在本发明的一些实施例中,在所述利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧之前,处理器,还可以用于实现如下步骤:[0443]利用平滑滤波器对所述第二音频中的每个音频帧执行平滑处理。[0444]可以理解的是,上述说明的计算机装置中的处理器执行所述计算机程序时,也可以实现上述对应的各装置实施例中各单元的功能,此处不再赘述。示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述高解析音频的音质检测装置中的执行过程。例如,所述计算机程序可以被分割成上述高解析音频的音质检测装置中的各单元,各单元可以实现如上述相应高解析音频的音质检测装置说明的具体功能。[0445]所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可包括但不仅限于处理器、存储器。本领域技术人员可以理解,处理器、存储器仅仅是计算机装置的示例,并不构成对计算机装置的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置还可以包括输入输出设备、网络接入设备、总线等。[0446]所述处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。[0447]所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。[0448]本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,处理器,可以用于执行如下步骤:[0449]获取待检测音频的采样率和量化精度;[0450]从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频;[0451]确定所述第一音频的有效频谱高度,所述有效频谱高度为音频最大能量处所对应的频率;[0452]从所述第一音频中筛选出有效频谱高度大于频率阈值的第二音频;[0453]若所述第二音频中预设高频段的能量总趋势呈现下降趋势,且预设高频段内未出现能量突变的频点时,则确定所述第二音频为高解析音频。[0454]在本发明的一些实施例中,在从所述待检测音频中筛选出采样率和量化精度都满足预设标准的第一音频之后,获取所述第一音频的有效频谱高度之前,处理器,还可以用于实现如下步骤:[0455]获取所述第一音频的采样率;[0456]按照预设的多个采样区间,将所述第一音频归类至目标类别音频,其中,每个采样区间对应不同类别的音频;[0457]若所述第一音频的采样率不等于目标类别音频所对应的重采样率,则将所述第一音频按照目标类别音频所对应的重采样率执行重采样,以使得所述第一音频的重采样率与目标类别音频所对应的重采样率相同,其中,不同类别的音频对应不同的重采样率。[0458]在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0459]将所述第一音频分帧加窗,并执行时域与频域的转换,以得到所述第一音频中每帧音频的频域信号;[0460]计算所述第一音频中每帧音频的能量,以根据所述第一音频中每帧音频的能量和第一能量阈值,筛选出所述第一音频中的有效帧;[0461]确定所述第一音频中有效帧的有效频谱高度。[0462]在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0463]统计所述第一音频中有效帧的有效频谱高度大于所述频率阈值的第一有效帧数量;[0464]若所述第一音频中第一有效帧的数量与所述第一音频中总有效帧的数量比值大于第一比例阈值,则将所述第一音频视为同一目标类别的第二音频。[0465]在本发明的一些实施例中,在筛选出所述第一音频中的有效帧之后,所述确定所述第一音频中有效帧的有效频谱高度之前,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0466]若所述第一音频中有效帧的数量与所述第一音频中总音频帧数的比值小于第二比例阈值,则确定所述第一音频为非高解析音频。[0467]在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0468]将所述第一音频中的有效帧按照预设的频率间隔,划分为m个频带,每个频带包括n个频点,其中,所述m大于等于2,所述n大于等于1;[0469]按照目标类型的音频所对应的频带计算范围,计算所述第一音频中每个有效帧内沿着频率轴的方向,每个频带的一阶频带能量e1和相邻两个一阶频带能量之和e2,其中,不同类别的音频对应不同的频带计算范围;[0470]根据所述第一音频中每个有效帧内每个频带所对应的e1或e2,以及有效频谱高度确定规则,确定所述第一音频中每个有效帧的频谱高度。[0471]在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0472]确定有效帧能量开始下降的拐点频带,将拐点频带的频率确定为有效帧的有效频谱高度。[0473]在本发明的一些实施例中,所述有效频谱高度确定规则包括:[0474]确定每个帧能量开始下降的拐点频带,将拐点频带的频率确定为每个帧的有效频谱高度。[0475]在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0476]获取第一音频中每个有效帧内最大e2值所对应的第一频带;[0477]若第一频带的e1值大于第二能量阈值,或沿频率轴的方向与所述第一频带相邻的第二频带的e2值大于第三能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度,其中,所述第二能量阈值和所述第三能量阈值用于表征拐点频带的能量变化范围;[0478]或,[0479]若第一频带的能量小于无效能量阈值,则将所述第一频带视为所述拐点频带,确定所述拐点频带的频率为有效帧的有效频谱高度。[0480]在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0481]按照目标类别音频预设高频段中的多个预设中心频带和预设高频点,计算所述第二音频中每帧音频的多个预设中心频带与预设高频点的多个能量差值,其中,多个预设中心频带的频率依次增大,但均小于预设高频点的频率,其中,不同类别的音频对应不同的多个预设中心频带和不同的预设高频点;[0482]统计所述第二音频中所述多个能量差值均大于对应多个阈值的第二有效帧数量,其中,与所述多个能量差值分别对应的多个阈值随着所述多个预设中心频带的频率的增大而减小;[0483]若所述第二有效帧数量与所述第二音频中总音频帧数的比值不小于第三比例阈值,则表征所述第二音频中预设高频段的能量总趋势呈现下降趋势。[0484]在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0485]按照目标类别音频的预设高频段,获取所述第二音频中每个音频帧的所述预设高频段,其中,不同类别的音频设有不同的高频段范围;[0486]计算所述第二音频中每个音频帧预设高频段的能量分布区间;[0487]统计所述能量分布区间内无异常频点的第三有效帧数量,其中,异常频点为频点能量大于能量分布区间临界值的频点;[0488]若所述第三有效帧数量与所述第二音频中总音频帧的数量比值不小于第四比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;[0489]确定所述第二音频为高解析音频。[0490]在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0491]利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;[0492]针对所述第二音频中的每个音频帧,统计所述滑动窗口内所有频点能量的一阶差分之和;[0493]若所述滑动窗口内所有频点能量的一阶差分之和的符合为负,且大于第四能量阈值,则确定所述第二音频中的音频帧为正常帧;[0494]或,[0495]若所述滑动窗口内所有频点能量的一阶差分之和的符号为正,且小于第五能量阈值,则确定所述所述第二音频中的音频帧为正常帧;[0496]统计所述第二音频中正常帧的比例,若所述第二音频中正常帧的比例不小于第五比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;[0497]确定所述第二音频为高解析音频。[0498]在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0499]利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧,其中,所述滑动窗口至少大于单个频点的频谱范围;[0500]针对所述第二音频中的每个音频帧,统计所述滑动窗口内每个频点能量的一阶差分之和;[0501]若所述滑动窗口内每个频点能量的一阶差分之和的符号为负,且大于第六能量阈值,则确定所述第二音频中的音频帧为正常帧;[0502]或,[0503]若所述滑动窗口内每个频点能量的一阶差分之和的符合为正,且小于第七能量阈值,则确定所述第二音频中的音频帧为正常帧;[0504]统计所述第二音频中正常帧的比例,若所述第二音频中正常帧的比例不小于第六比例阈值,则表征所述第二音频预设高频段内未出现能量突变的频点;[0505]确定所述第二音频为高解析音频。[0506]在本发明的一些实施例中,在所述利用滑动窗口以单个频点为步长滑过所述第二音频中的每个音频帧之前,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,还可以用于实现如下步骤:[0507]利用平滑滤波器对所述第二音频中的每个音频帧执行平滑处理。[0508]可以理解的是,所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在相应的一个计算机可读取存储介质中。基于这样的理解,本发明实现上述相应的实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。[0509]所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。[0510]在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。[0511]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。[0512]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。[0513]以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
一种高解析音频的音质检测方法及相关装置与流程
作者:admin
2022-07-30 07:29:10
831