发布信息

图像识别方法及装置、终端、存储介质与流程

作者:admin      2022-08-26 21:42:21     424



计算;推算;计数设备的制造及其应用技术1.本公开涉及图像识别技术领域,尤其涉及一种图像识别方法及装置、终端、存储介质。背景技术:2.近几年,在计算机视觉和模式识别领域,图像内容辨识大多以深度学习的方式实现,但深度学习必须使用庞大的运算,才能够达到实时在当帧画面立即识别出目标场景的要求。若要以深度学习方式实现天空场景识别并实用于手机产品上,并不容易达成,因为手机的计算能力有限,且耗电量也受限制。技术实现要素:3.本公开提供一种图像识别方法及装置、终端、存储介质。4.根据本公开实施例的第一方面,提供一种图像识别方法,所述方法包括:5.获取待识别图像在预定色彩空间的统计值;6.确定所述统计值中,属于预定统计范围内的目标统计值;其中,所述预定统计范围表征待识别的目标场景在所述预定色彩空间的取值范围;7.基于所述目标统计值在所述预定色彩空间的分布形态,确定所述待识别图像是否为包括所述目标场景的图像。8.在一些实施例中,所述基于所述目标统计值在所述预定色彩空间的分布形态,确定所述待识别图像是否为包括所述目标场景的图像,包括:9.基于所述目标统计值,拟合目标线段;其中,所述目标统计值对应的目标统计点与所述目标线段的距离总和最小;10.至少基于所述目标线段,确定所述待识别图像是否为包括所述目标场景的图像。11.在一些实施例中,所述预定色彩空间为三维空间,第一维度表征亮度值、第二维度表征第一色彩比值、第三维度表征第二色彩比值;12.所述至少基于所述目标线段,确定所述待识别图像是否为包括所述目标场景的图像,包括:13.基于所述目标线段和所述第一维度的亮度轴之间的第一夹角,确定所述待识别图像包括所述目标场景的第一置信度;14.基于所述目标线段,与所述第二维度的色彩轴或所述第三维度的色彩轴之间的第二夹角,确定所述待识别图像包括所述目标场景的第二置信度;15.基于所述目标统计值对应的目标统计点与所述目标线段的平均距离,确定所述待识别图像包括所述目标场景的第三置信度;16.基于所述目标线段的长度,确定所述待识别图像包括所述目标场景的第四置信度;17.根据所述目标统计值的个数,确定所述待识别图像包括所述目标场景的第五置信度;18.根据所述第一置信度、所述第二置信度、所述第三置信度、所述第四置信度、所述第五置信度中任意之一或者任意组合,确定所述待识别图像是否为包括所述目标场景的图像。19.在一些实施例中,所述方法还包括:20.确定所述目标线段的起始端和终点端;21.根据所述起始端朝所述第一维度的亮度轴的方向,与所述起始端朝所述终点端方向的夹角,确定所述第一夹角;22.根据所述起始端朝所述第二维度的色彩轴的方向或者所述起始端朝所述第三维度的色彩轴的方向,与所述起始端朝所述终点端方向的夹角,确定所述第二夹角。23.在一些实施例中,所述目标场景包括天空场景,所述第一色彩比值为蓝色分量和绿色分量之间的比值,所述第二色彩比值为红色分量和绿色分量之间的比值;24.所述确定所述目标线段的起始端和终点端,包括:25.若所述目标线段的两端点对应的第一色彩比值不同,将第一色彩比值较小的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端;26.或者,27.若所述目标线段的两端点对应的第一色彩比值相同,将两端点对应的第二色彩比值中较大的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端;28.或者,29.若所述目标线段的两端点对应的第一色彩比值相同,且所述两端点对应的第二色彩比值相同,将两端点对应的亮度值中较大的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端。30.在一些实施例中,所述根据所述第一置信度、所述第二置信度、所述第三置信度、所述第四置信度、所述第五置信度中任意组合,确定所述待识别图像是否为包括所述目标场景的图像,包括:31.根据所述第一置信度、所述第二置信度、所述第三置信度、所述第四置信度、所述第五置信度中任意组合的各置信度的乘积,确定综合置信度;32.若所述综合置信度大于预设置信度阈值,确定所述待识别图像为包括所述目标场景的图像;33.若所述综合置信度小于或等于所述预设置信度阈值,确定所述待识别图像为不包括所述目标场景的图像。34.在一些实施例中,所述获取待识别图像在预定色彩空间的统计值,包括:35.将所述待识别图像分割成不同的区域图像;36.获取所述区域图像中各像素点在所述预定色彩空间的统计值;37.将各所述区域图像对应的统计值的均值,确定为所述待识别图像在所述预定色彩空间的统计值。38.在一些实施例中,所述方法还包括:39.获取不同设备拍摄的多张包括所述目标场景的图像在所述预定色彩空间的统计值;40.确定所述统计值在所述预定色彩空间的不同维度上的最大值和最小值;41.基于所述不同维度上的最大值和最小值,确定所述预定统计范围。42.根据本公开实施例的第二方面,提供一种图像识别装置,所述装置包括:43.第一获取模块,配置为获取待识别图像在预定色彩空间的统计值;44.第一确定模块,配置为确定所述统计值中,属于预定统计范围内的目标统计值;其中,所述预定统计范围表征待识别的目标场景在所述预定色彩空间的取值范围;45.第二确定模块,配置为基于所述目标统计值在所述预定色彩空间的分布形态,确定所述待识别图像是否为包括所述目标场景的图像。46.在一些实施例中,所述第二确定模块,具体配置为基于所述目标统计值,拟合目标线段;其中,所述目标统计值对应的目标统计点与所述目标线段的距离总和最小;至少基于所述目标线段,确定所述待识别图像是否为包括所述目标场景的图像。47.在一些实施例中,所述预定色彩空间为三维空间,第一维度表征亮度值、第二维度表征第一色彩比值、第三维度表征第二色彩比值;48.所述第二确定模块,具体配置为基于所述目标线段和所述第一维度的亮度轴之间的第一夹角,确定所述待识别图像包括所述目标场景的第一置信度;基于所述目标线段,与所述第二维度的色彩轴或所述第三维度的色彩轴之间的第二夹角,确定所述待识别图像包括所述目标场景的第二置信度;基于所述目标统计值对应的目标统计点与所述目标线段的平均距离,确定所述待识别图像包括所述目标场景的第三置信度;基于所述目标线段的长度,确定所述待识别图像包括所述目标场景的第四置信度;根据所述目标统计值的个数,确定所述待识别图像包括所述目标场景的第五置信度;根据所述第一置信度、所述第二置信度、所述第三置信度、所述第四置信度、所述第五置信度中任意之一或者任意组合,确定所述待识别图像是否为包括所述目标场景的图像。49.在一些实施例中,所述装置还包括:50.第三确定模块,配置为确定所述目标线段的起始端和终点端;51.第四确定模块,配置为根据所述起始端朝所述第一维度的亮度轴的方向,与所述起始端朝所述终点端方向的夹角,确定所述第一夹角;52.第五确定模块,配置为根据所述起始端朝所述第二维度的色彩轴的方向或者所述起始端朝所述第三维度的色彩轴的方向,与所述起始端朝所述终点端方向的夹角,确定所述第二夹角。53.在一些实施例中,所述目标场景包括天空场景,所述第一色彩比值为蓝色分量和绿色分量之间的比值,所述第二色彩比值为红色分量和绿色分量之间的比值;54.所述第三确定模块,具体配置为若所述目标线段的两端点对应的第一色彩比值不同,将第一色彩比值较小的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端;或者,若所述目标线段的两端点对应的第一色彩比值相同,将两端点对应的第二色彩比值中较大的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端;或者,若所述目标线段的两端点对应的第一色彩比值相同,且所述两端点对应的第二色彩比值相同,将两端点对应的亮度值中较大的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端。55.在一些实施例中,所述第二确定模块,具体配置为根据所述第一置信度、所述第二置信度、所述第三置信度、所述第四置信度、所述第五置信度中任意组合的各置信度的乘积,确定综合置信度;若所述综合置信度大于预设置信度阈值,确定所述待识别图像为包括所述目标场景的图像;若所述综合置信度小于或等于所述预设置信度阈值,确定所述待识别图像为不包括所述目标场景的图像。56.在一些实施例中,所述第一获取模块,具体配置为将所述待识别图像分割成不同的区域图像;获取所述区域图像中各像素点在所述预定色彩空间的统计值;将各所述区域图像对应的统计值的均值,确定为所述待识别图像在所述预定色彩空间的统计值。57.在一些实施例中,所述装置还包括:58.第二获取模块,配置为获取不同设备拍摄的多张包括所述目标场景的图像在所述预定色彩空间的统计值;59.第六确定模块,配置为确定所述统计值在所述预定色彩空间的不同维度上的最大值和最小值;60.第七确定模块,配置为基于所述不同维度上的最大值和最小值,确定所述预定统计范围。61.根据本公开实施例的第三方面,提供一种终端,包括:62.处理器;63.用于存储处理器可执行指令的存储器;64.其中,所述处理器被配置为执行如上述第一方面中所述的图像识别方法。65.根据本公开实施例的第四方面,提供一种存储介质,包括:66.当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行如上述第一方面中所述的图像识别方法。67.本公开的实施例提供的技术方案可以包括以下有益效果:68.在本公开的实施例中,获取待识别图像在预定色彩空间的统计值后,先确定属于预定统计范围的目标统计值,再基于目标统计值的分布形态来确定待识别图像是否为包括目标场景的图像。由于预定统计范围表征的是待识别的目标场景在预定色彩空间的取值范围,因而本公开基于预定统计范围获得目标统计值,相当于事先对统计值进行了过滤,相对于对待识别图像逐像素计算来识别目标场景的方式,一方面,减少了参与场景识别的像素个数,因而能有效降低计算量,提升识别速度,使得本方案也能适用于计算能力差的移动终端;另一方面,目标统计值已为过滤出的属于目标场景中的数值,而本公开进一步根据目标统计值的分布形态在确定待识别图像是否为包括目标场景的图像,即进行二次确认,因而能提升对目标场景识别的精准度。69.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明70.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。71.图1是本公开实施例示出的一种图像识别方法流程图。72.图2为一种预定统计范围形成的三维结构示例图。73.图3为本公开实施例中一种天空场景图像的示例图。74.图4为天空场景图像的各像素点在预定色彩空间的统计值分布图。75.图5为天空场景图像对应的目标统计点与目标线段示例图。76.图6为本公开实施例中一种第一夹角示例图。77.图7为本公开实施例中一种第二夹角示例图。78.图8为本公开实施例中目标线段的起始端和终点端的确定方法流程图。79.图9为本公开实施例中一种图像识别方法流程示例图。80.图10是根据一示例性实施例示出的一种图像识别装置图。81.图11是根据一示例性实施例示出的一种终端装置的框图。具体实施方式82.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。83.图1是本公开实施例示出的一种图像识别方法流程图,如图1所示,应用于终端中的图像识别方法包括以下步骤:84.s11、获取待识别图像在预定色彩空间的统计值;85.s12、确定所述统计值中,属于预定统计范围内的目标统计值;其中,预定统计范围表征待识别的目标场景在所述预定色彩空间的取值范围;86.s13、基于所述目标统计值在所述预定色彩空间的分布形态,确定所述待识别图像是否为包括所述目标场景的图像。87.在本公开的实施例中,终端设备包括:移动设备和固定设备;所述移动设备包括:手机、平板电脑或可穿戴式设备等。所述固定设备包括但不限于个人电脑(personal computer,pc)。88.终端中可包括图像采集模组,例如手机中的前置摄像头或后置摄像头,可进行图像采集。终端可对采集到的图像进行图像识别。当然,终端中也可不包括图像采集模组,而对接收到的图像进行图像识别。89.在步骤s11中,终端可获取待识别图像在预定色彩空间的统计值。其中,待识别图像可以是一般的jpeg图像或位图图像,也可以是未经过图像处理的raw图像。待识别图像各像素点的像素值通过红色(r)、绿色(g)和蓝色(b)三个颜色分量来表征。本公开中,预定色彩空间是不同于rgb色彩空间的其他色彩空间,例如该预定色彩空间可以是yuv空间、ycbcr空间,还可以是自定义的色彩空间。例如,该自定义的色彩空间是yrgbg,定义如下:90.y=0.299*r+0.587*g+0.114*b91.rg=1024*r/gꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(1)92.bg=1024*b/g93.其中,y表示亮度,定义同yuv空间中的y;rg表示一个像素点的红色分量(r)和绿色分量(g)的比值;bg表示一个像素点的蓝色分量(b)和绿色分量(g)的比值,r、g与b的取值范围在0到255之间。94.在步骤s12中,在获得待识别图像在预定色彩空间的统计值后,即可确定统计值中属于预定统计范围内的目标统计值。其中,预定统计范围表征的是待识别的目标场景在预定色彩空间的取值范围。95.例如,待识别的目标场景是天空场景,则预定统计范围可以是根据不同时间和/或不同地点拍摄的天空场景图像而确定的在预定色彩空间的取值范围。需要说明的是,本公开中目标场景不限定于天空场景,还可以是绿色草地场景、雪景等等。96.此外,因不同的镜头感光组件的感光特性不同,镜头模块将光信号转换成电信号、电信号转换成数字信号的转换方式也可能存在差异,因而生成的数字图像的色彩感应特性也是存在差异的。对此,为减少设备差异特性,也可考虑针对不同类型的设备来采集大量的天空场景图像而确定在预定色彩空间的取值范围。97.在步骤s13中,在确定属于预定统计范围内的目标统计值后,即可根据目标统计值在预定色彩空间的分布形态,确定待识别图像是否为包括目标场景的图像。98.需要说明的是,目标统计值在预定色彩空间的分布形态,例如可以是目标统计值对应的目标统计点的个数、目标统计点在预定色彩空间的分布位置、分布形状等等。99.相关技术中,在对图像进行识别,例如识别图像中的天空场景时,通常是利用图像上每个像素与邻近像素之间的色彩梯度变化程度来判断是否包括天空,即对图像上的每一个像素都要进行计算,可以理解的是,该种方式的计算量非常大,因而无法适用于手机等计算能力有限的移动终端,移动终端也无法基于识别的场景做针对性的图像增强以给用户提供更好的用户体验。100.而相对的,本公开获取待识别图像在预定色彩空间的统计值后,先确定属于预定统计范围的目标统计值,再基于目标统计值的分布形态来确定待识别图像是否为包括目标场景的图像。由于预定统计范围表征的是待识别的目标场景在预定色彩空间的取值范围,因而本公开基于预定统计范围获得目标统计值,相当于事先对统计值进行了过滤,相对于对待识别图像逐像素计算来识别目标场景的方式,一方面,减少了参与场景识别的像素个数,因而能有效降低计算量,提升识别速度,使得本方案也能适用于计算能力差的移动终端;另一方面,目标统计值已为过滤出的属于目标场景中的数值,而本公开进一步根据目标统计值的分布形态在确定待识别图像是否为包括目标场景的图像,即进行二次确认,因而能提升对目标场景识别的精准度。101.在一种实施例中,步骤s11中,包括:102.将所述待识别图像分割成不同的区域图像;103.获取所述区域图像中各像素点在所述预定色彩空间的统计值;104.将各所述区域图像对应的统计值的均值,确定为所述待识别图像在所述预定色彩空间的统计值。105.在该实施例中,可以将待识别图像分割成不同的区域图像,例如基于阈值分割方法进行简单的分割,或者将图像均分成m*n个区域图像等。在分割图像后,再统计区域图像中各像素点在预定色彩空间的统计值,并将区域图像对应的统计值的均值,作为待识别图像在预定色彩空间的统计值。也可以在转换到预定色彩空间之前,先获取区域图像对应的各颜色分量的均值,再将各颜色分量的均值基于上述公式(1)转换到预定色彩空间获得统计值。106.可以理解的是,由于图像的局部区域内相邻像素点的像素值极大可能相同,因而本公开事先对图像进行分割获得区域图像,并将区域图像中各像素点的统计值的均值,作为该区域图像的统计值,因而在不过多损失图像像素信息的基础上能整体上减少统计值的个数,进一步减少后续目标统计值的个数,具有能降低计算量,提升识别速度的效果。107.在一种实施例中,所述方法还包括:108.获取不同设备拍摄的多张包括所述目标场景的图像在所述预定色彩空间的统计值;109.确定所述统计值在所述预定色彩空间的不同维度上的最大值和最小值;110.基于所述不同维度上的最大值和最小值,确定所述预定统计范围。111.在该实施例中,终端基于不同设备拍摄的多张包括目标场景的图像,确定这些图像在预定色彩空间的统计值,并进一步确定统计值在预定色彩空间的不同维度上的最大值和最小值。例如,统计各图像的每个像素点在yrgbg色彩空间对应的统计值,并从所有图像的所有像素点的统计值中,确定出y轴上的最大值(y_high)和最小值(y_low)、rg轴上的最大值(rg_high)和最小值(rg_low)以及bg轴上的最大值(bg_high)和最小值(bg_low)。基于不同维度上的最大值和最小值,即可确定预定统计范围。112.图2为一种预定统计范围形成的三维结构示例图,如图2所示,由以上y_high、y_low、rg_high、rg_low、bg_high和bg_low共6个参数确定的矩形区域即为预定统计范围形成的区域,例如是天空场景下的蓝天统计区域。113.可以理解的是,在该实施例中,根据不同设备拍摄的多张包括目标场景的图像在预定色彩空间的不同维度上的最大值和最小值来确定预定统计范围,能使预定统计范围能涵盖更多情况下拍摄的包括目标场景的图像,因而能提升本公开在基于预定统计范围确定目标统计值,并基于目标统计值确定待识别图像是否为包括目标场景的图像的准确性。114.在一种实施例中,所述基于所述目标统计值在所述预定色彩空间的分布形态,确定所述待识别图像是否为包括所述目标场景的图像,包括:115.基于所述目标统计值,拟合目标线段;其中,所述目标统计值对应的目标统计点与所述目标线段的距离总和最小;116.至少基于所述目标线段,确定所述待识别图像是否为包括所述目标场景的图像。117.在该实施例中,目标统计值的分布形态可通过拟合的目标线段来表征。在基于目标统计值拟合目标线段时,可基于主成分分析法(principal component analysis,pca)提取目标统计值的主要特征分量(主要统计值),并基于提取出的主要特征分量拟合成目标线段,该目标线段使得目标统计值对应的目标统计点与目标线段的距离总和最小。118.目标统计值对应的目标统计点与目标线段的距离总和最小,也即目标线段与其余各目标统计点的聚合程度最高,因而目标线段在一定程度上可近似表征所有目标统计点的分布形态。本公开至少基于该目标线段,即可确定待识别图像是否为包括目标场景的图像。119.可以理解的是,本公开通过拟合目标线段,至少基于目标线段来识别场景,而不是对所有的目标统计值进行逐点的计算,能进一步减少计算量,提升识别速度。120.图3为本公开实施例中一种天空场景图像的示例图,图4为天空场景图像的各像素点在预定色彩空间的统计值分布图,图5为天空场景图像对应的目标统计点与目标线段示例图。如图4所示,图3对应的天空场景图像中,各像素点在预定色彩空间的分布范围较广,l标识的椭圆区域内,即对应图4中目标统计点的分布。对比图4和图5可知,图5中的目标统计值是图4中统计值的一部分,图5中的线段a即为目标线段。121.在一种实施例中,所述预定色彩空间为三维空间,第一维度表征亮度值、第二维度表征第一色彩比值、第三维度表征第二色彩比值;122.所述至少基于所述目标线段,确定所述待识别图像是否为包括所述目标场景的图像,包括:123.基于所述目标线段和所述第一维度的亮度轴之间的第一夹角,确定所述待识别图像包括所述目标场景的第一置信度;124.基于所述目标线段,与所述第二维度的色彩轴或所述第三维度的色彩轴之间的第二夹角,确定所述待识别图像包括所述目标场景的第二置信度;125.基于所述目标统计值对应的目标统计点与所述目标线段的平均距离,确定所述待识别图像包括所述目标场景的第三置信度;126.基于所述目标线段的长度,确定所述待识别图像包括所述目标场景的第四置信度;127.根据所述目标统计值的个数,确定所述待识别图像包括所述目标场景的第五置信度;128.根据所述第一置信度、所述第二置信度、所述第三置信度、所述第四置信度、所述第五置信度中任意之一或者任意组合,确定所述待识别图像是否为包括所述目标场景的图像。129.在本公开的实施例中,预定色彩空间的第一维度为亮度,第二维度和第三维度均为色彩比值,例如该预定色彩空间是yrgbg色彩空间。130.在该实施例中,在至少基于目标线段,确定待识别图像是否为包括目标场景的图像时,不仅考虑了目标线段,还考虑到了目标像素点的个数。131.目标线段和第一维度的亮度轴之间的第一夹角,反映的是待识别图像中初步确定属于目标场景取值范围的局部区域内像素的对比度。对比度也是场景特征的一部分,因而本公开根据目标线段上像素点的对比度值来确定第一置信度。132.目标线段与第二维度的色彩轴或第三维度的色彩轴之间的第二夹角,反映的是目标线段上像素点各分量的色彩关系。色彩关系也是场景特征的一部分,因而本公开根据像素点各分量的色彩关系来确定第二置信度。133.目标统计值对应的目标统计点与目标线段的平均距离,反映的是所有目标统计点的聚合程度。像素点的聚合程度也是场景特征的一部分,因而本公开根据目标统计值对应的目标统计点与目标线段的平均距离来确定第三置信度。134.目标线段的长度,反映的是属于目标线段上的目标统计点在预定统计范围内的跨度,由于预定统计范围可能是根据不同设备拍摄的多张包括目标场景的图像而确定的,预定统计范围是根据大量图像统计而获得的一个涵盖目标场景的较广的范围。因而在识别单一图像,即本公开的待识别图像时,属于目标线段上的目标统计点在预定统计范围的跨度不会太大,也即目标线段的长度不会太长。而目标线段的长度太短,说明待识别图像中初步确定的属于目标场景取值范围的局部区域内的主要特征不明显,与目标场景可能不太符合。因而本公开可根据目标线段的长度来确定第四置信度。135.目标统计值的个数,反映的是待识别图像中属于预定统计范围的像素个数,若像素个数太少,说明待识别图像包括目标场景的可能性较小。因而本公开可根据目标统计值的个数来确定第五置信度。136.以第一置信度的确定为例进行说明,本公开在基于目标线段和第一维度的亮度轴之间的第一夹角,确定待识别图像包括目标场景的第一置信度时,可采用如下方式:137.基于所述目标线段和所述第一维度的亮度轴之间的第一夹角,在预设第一对应关系中查找所述第一夹角对应的置信度;138.将所述第一夹角对应的置信度,确定为所述待识别图像包括所述目标场景的第一置信度。139.其中,预设第一对应关系可以是根据大量样本图像,分析样本图像的目标线段和第一维度的亮度轴之间的夹角,再结合样本图像的标签来建立的。其中,样本图像的标签标识了样本图像包括目标场景的概率。140.需要说明的是,在本公开的实施例中,也可基于第二夹角,在预设第二对应关系中查找第二夹角对应的第二置信度;基于目标统计值对应的目标统计点与目标线段的平均距离,在预设第三对应关系中查找平均距离对应的第三置信度;基于目标线段的长度在预设第四对应关系中查找距离对应的第四置信度;根据目标统计值的个数,在预设第五对应关系中查找第五置信度。其中,预设第二对应关系、预设第三对应关系、预设第四对应关系和预设第五对应关系的建立,可参考预设第一对应关系,本公开不再详述。141.在确定第一置信度、第二置信度、第三置信度、第四置信度和第五置信度之后,即可确定待识别图像是否为包括目标场景的图像。本公开可根据上述5个置信度中的任意一个或多个来确定待识别图像是否为包括目标场景的图像。例如,根据第一置信度(或其他任意一个置信度)来确定待识别图像是否为包括目标场景的图像,或者本公开可根据5个置信度的均值、最大值、最小值等确定待识别图像是否为包括目标场景的图像。142.在一种实施例中,所述根据所述第一置信度、所述第二置信度、所述第三置信度、所述第四置信度、所述第五置信度中任意组合,确定所述待识别图像是否为包括所述目标场景的图像,包括:143.根据所述第一置信度、所述第二置信度、所述第三置信度、所述第四置信度、所述第五置信度中任意组合的各置信度的乘积,确定综合置信度;144.若所述综合置信度大于预设置信度阈值,确定所述待识别图像为包括所述目标场景的图像;145.若所述综合置信度小于或等于所述预设置信度阈值,确定所述待识别图像为不包括所述目标场景的图像。146.在该实施例中,在根据置信度的任意组合来确定待识别图像是否为包括目标场景的图像时,可根据组合中各置信度的乘积获得综合置信度,再将综合置信度与预设置信度阈值进行比较,若综合置信度大于预设置信度阈值,则确定待识别图像为包括目标场景的图像;而若综合置信度小于预设置信度阈值,则确定待识别图像为不包括目标场景的图像。其中,任意组合可以是上述5个置信度中,任意两个置信度、任意三个置信度、任意四个置信度、或者5个置信度形成的组合。147.示例性的,假设以上5个置信度的数值范围为0到100,综合置信度的计算如下公式(2)所示:148.综合置信度=(第一置信度*第二置信度*第三置信度*第四置信度*第五置信度)/(100*4)(2)149.其中,综合置信度的数值范围也是0到100,数值越大代表包括目标场景的可能性越大。150.在该实施例中,根据各置信度的乘积确定综合置信度,乘积后的综合置信度全面考虑了各个置信度的大小,若各置信度中,有一个置信度的值较小,则乘积后的综合置信度的值可能较小,那么只要有一个置信度较小,待识别图像中包括目标场景的可能性也较小,即任何一个置信度的大小均可能影响综合置信度。可以理解的是,本公开通过乘积的方式获得综合置信度,再根据综合置信度的大小确定待识别图像是否为包括目标场景的图像的方式,能提升场景识别的准确度。151.在一种实施例中,所述方法还包括:152.确定所述目标线段的起始端和终点端;153.根据所述起始端朝所述第一维度的亮度轴的方向,与所述起始端朝所述终点端方向的夹角,确定所述第一夹角;154.根据所述起始端朝所述第二维度的色彩轴的方向或者所述起始端朝所述第三维度的色彩轴的方向,与所述起始端朝所述终点端方向的夹角,确定所述第二夹角。155.在本公开的实施例中,本公开还需进一步确定目标线段的起始端和终点端,因为目标线段不同的起始端和终点端定义,使得目标线段与各轴的角度定义也会不同,因而本公开可事先确定目标线段的起始端和终点端,再来确定第一夹角和第二夹角。156.具体的,本公开将起始端朝第一维度的亮度轴的方向,与起始端朝终点端方向的夹角,确定为第一夹角;将起始端朝第二维度的色彩轴的方向或者起始端朝第三维度的色彩轴的方向,与起始端朝终点端方向的夹角,确定为第二夹角。图6为本公开实施例中一种第一夹角示例图,如图6所示,θy即为第一夹角。图7为本公开实施例中一种第二夹角示例图,如图7所示,θbg即为第二夹角,图7所示的第二夹角为目标线段与其中一个色彩轴的夹角。157.在一种实施例中,所述目标场景包括天空场景,所述第一色彩比值为蓝色分量和绿色分量之间的比值,所述第二色彩比值为红色分量和绿色分量之间的比值;158.所述确定所述目标线段的起始端和终点端,包括:159.若所述目标线段的两端点对应的第一色彩比值不同,将第一色彩比值较小的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端;160.或者,161.若所述目标线段的两端点对应的第一色彩比值相同,将两端点对应的第二色彩比值中较大的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端;162.或者,163.若所述目标线段的两端点对应的第一色彩比值相同,且所述两端点对应的第二色彩比值相同,将两端点对应的亮度值中较大的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端。164.在该实施例中,目标场景为天空场景,由于天空场景时天空更多表现为蓝色,包括天空区域的图像中像素点的蓝色分量会比较大,而红色分量的值会相对较小。因而若预定色彩空间为yrgbg色彩空间,则上述公式(1)中,bg的值可能会大于rg的值。165.图8为本公开实施例中目标线段的起始端和终点端的确定方法流程图,如图8所示,在步骤s101中,确定目标线段的两端(第一端和第二端)的第一色彩比值(bg)是否相同;若不相同,执行步骤s102,若相同,执行步骤s105。在步骤s102中,比较第一端的第一色彩比值是否大于第二端的第一色彩比值,若否,执行步骤s103,将第一端确定为起始端,第二端确定为终点端;若是,执行步骤s104,将第二端确定为起始端,第一端确定为终点端。当两端的第一色彩比值相同时,在步骤s105中,会进一步比较两端的第二色彩比值(rg)是否相同;若不相同,执行步骤s106,若相同,执行步骤s109。在步骤s106中,比较第一端的第二色彩比值是否小于第二端的第二色彩比值,若否,执行步骤s107,将第一端确定为起始端,第二端确定为终点端;若是,执行步骤s108,将第二端确定为起始端,第一端确定为终点端。当两端的第二色彩比值也相同时,在步骤s109中,会进一步比较两端的亮度值是否相同;若相同,执行步骤110,将第一端确定为起始端,第二端确定为终点端;若不同,继续执行步骤s111。在s111中,比较第一端的亮度值是否小于第二端的亮度值,若否,执行步骤s112,将第一端确定为起始端,第二端确定为终点端;若是,执行步骤s113,将第二端确定为起始端,第一端确定为终点端。166.如图6所示,在天空场景下,由于天空场景的对比度在一定范围内,而若第一夹角θy接近0度或180度,则说明待识别图像中初步筛选的可能属于目标场景的区域的对比度太小或太大,出现天空场景的概率会很低。因而可在第一夹角θy接近0度或180度时,分配一个较小的第一置信度。例如,根据第一夹角和预设第一对应关系,确定一个较小的第一置信度。167.如图7所示,θbg表征的是目标线段和bg轴的夹角,θbg的数值范围为90度到-90度。在天空场景下,由于天空场景b分量值最大,r分量值最小,g分量值介于b和r之间,因而当θbg接近0度时,说明r分量和g分量的值靠近,此时出现天空场景的概率很低。而若θbg接近90度或-90度时,说明b分量和g分量的值很靠近,此时出现天空场景的概率也很低。因而本公开可在第二夹角θbg接近0度、90度或-90度时,分配一个较小的第二置信度。例如,根据第二夹角和预设第二对应关系,确定一个较小的第二置信度。168.可以理解的是,本公开根据第一夹角、第二夹角以及平均距离、线段长短和目标统计点的个数确定置信度的方式,具有运算量低且简便的效果。169.此外,需要说明的是,本公开并不限定于通过第一置信度至第五置信度来确定综合置信度,还可以是根据5个置信度中任意几个来确定综合置信度。170.图9为本公开实施例中一种图像识别方法流程示例图,如图9所示,应用于终端中的图像识别方法包括如下步骤:171.s201、将输入图像分割为m*n个小块并计算每个小块的统计值。172.在该实施例中,将输入图像分割成小块即将待识别图像分割成不同的区域图像,计算每个小块的统计值,可以理解为计算各区域图像对应的统计值的均值。173.s202、统计值由rgb转换到两维色彩与一维亮度的色彩空间。174.在该实施例中,即将待识别图像转换到预定色彩空间,例如该预定色彩空间yrgbg。175.s203、定出蓝天统计区。176.在该实施例中,蓝天统计区是预先基于大量蓝天图像确定的蓝天场景在预定色彩空间的取值范围(即本公开的预定统计范围)后,在预定色彩空间形成的三维结构区域。177.s204、蓝天统计点拟合出蓝天拟合线段。178.在该实施例中,蓝天统计点及目标统计值对应的目标统计点,拟合出的蓝天拟合线段即目标线段。179.s205、指定蓝天拟合线段的起始端和终点端。180.在该实施例中,指定蓝天拟合线段的起始端和终点端即确定目标线段的起始端和终点端。181.s206、计算出5个天空场景置信度。182.在该实施例中,5个天空场景置信度即本公开根据第一夹角确定出的第一置信度、根据第二夹角确定出的第二置信度、根据平均距离确定出的第三置信度、根据目标线段的长度确定出的第四置信度以及根据目标统计值的个数确定出的第五置信度。183.s207、计算最终天空场景置信度,并根据最终天空场景置信度确定输入图像是否包括天空场景。184.在该实施例中,最终天空场景置信度即综合置信度。185.在该实施例中,获取输入图像进行图像分割后的m*n统计值,再在预定色彩空间统计出蓝天统计点(目标统计值对应的统计点)并拟合出蓝天拟合线段(目标线段),根据目标线段和目标统计值确定五个天空场景置信度后再计算最终天空场景置信度以确定输入图像是否为包括目标场景的图像。一方面,减少了参与场景识别的像素个数,因而能有效降低计算量,提升识别速度,使得本方案也能适用于计算能力差的移动终端;另一方面,目标统计值已为过滤出的属于目标场景中的数值,而本公开进一步根据目标线段和目标统计值确定待识别图像是否为包括目标场景的图像,即进行二次确认,因而能提升对目标场景识别的精准度。186.图10是根据一示例性实施例示出的一种图像识别装置图。参照图10,该图像识别装置包括:187.第一获取模块301,配置为获取待识别图像在预定色彩空间的统计值;188.第一确定模块302,配置为确定所述统计值中,属于预定统计范围内的目标统计值;其中,所述预定统计范围表征待识别的目标场景在所述预定色彩空间的取值范围;189.第二确定模块303,配置为基于所述目标统计值在所述预定色彩空间的分布形态,确定所述待识别图像是否为包括所述目标场景的图像。190.在一些实施例中,所述第二确定模块303,具体配置为基于所述目标统计值,拟合目标线段;其中,所述目标统计值对应的目标统计点与所述目标线段的距离总和最小;至少基于所述目标线段,确定所述待识别图像是否为包括所述目标场景的图像。191.在一些实施例中,所述预定色彩空间为三维空间,第一维度表征亮度值、第二维度表征第一色彩比值、第三维度表征第二色彩比值;192.所述第二确定模块303,具体配置为基于所述目标线段和所述第一维度的亮度轴之间的第一夹角,确定所述待识别图像包括所述目标场景的第一置信度;基于所述目标线段,与所述第二维度的色彩轴或所述第三维度的色彩轴之间的第二夹角,确定所述待识别图像包括所述目标场景的第二置信度;基于所述目标统计值对应的目标统计点与所述目标线段的平均距离,确定所述待识别图像包括所述目标场景的第三置信度;基于所述目标线段的长度,确定所述待识别图像包括所述目标场景的第四置信度;根据所述目标统计值的个数,确定所述待识别图像包括所述目标场景的第五置信度;根据所述第一置信度、所述第二置信度、所述第三置信度、所述第四置信度、所述第五置信度中任意之一或者任意组合,确定所述待识别图像是否为包括所述目标场景的图像。193.在一些实施例中,所述装置还包括:194.第三确定模块304,配置为确定所述目标线段的起始端和终点端;195.第四确定模块305,配置为根据所述起始端朝所述第一维度的亮度轴的方向,与所述起始端朝所述终点端方向的夹角,确定所述第一夹角;196.第五确定模块306,配置为根据所述起始端朝所述第二维度的色彩轴的方向或者所述起始端朝所述第三维度的色彩轴的方向,与所述起始端朝所述终点端方向的夹角,确定所述第二夹角。197.在一些实施例中,所述目标场景包括天空场景,所述第一色彩比值为蓝色分量和绿色分量之间的比值,所述第二色彩比值为红色分量和绿色分量之间的比值;198.所述第三确定模块304,具体配置为若所述目标线段的两端点对应的第一色彩比值不同,将第一色彩比值较小的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端;或者,若所述目标线段的两端点对应的第一色彩比值相同,将两端点对应的第二色彩比值中较大的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端;或者,若所述目标线段的两端点对应的第一色彩比值相同,且所述两端点对应的第二色彩比值相同,将两端点对应的亮度值中较大的一端确定为所述起始端,所述起始端以外的一端确定为所述终点端。199.在一些实施例中,所述第二确定模块303,具体配置为根据所述第一置信度、所述第二置信度、所述第三置信度、所述第四置信度、所述第五置信度中任意组合的各置信度的乘积,确定综合置信度;若所述综合置信度大于预设置信度阈值,确定所述待识别图像为包括所述目标场景的图像;若所述综合置信度小于或等于所述预设置信度阈值,确定所述待识别图像为不包括所述目标场景的图像。200.在一些实施例中,所述第一获取模块301,具体配置为将所述待识别图像分割成不同的区域图像;获取所述区域图像中各像素点在所述预定色彩空间的统计值;将各所述区域图像对应的统计值的均值,确定为所述待识别图像在所述预定色彩空间的统计值。201.在一些实施例中,所述装置还包括:202.第二获取模块307,配置为获取不同设备拍摄的多张包括所述目标场景的图像在所述预定色彩空间的统计值;203.第六确定模块308,配置为确定所述统计值在所述预定色彩空间的不同维度上的最大值和最小值;204.第七确定模块309,配置为基于所述不同维度上的最大值和最小值,确定所述预定统计范围。205.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。206.图11是根据一示例性实施例示出的一种终端装置800的框图。例如,装置800可以是手机,相机等。207.参照图11,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(i/o)的接口812,传感器组件814,以及通信组件816。208.处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。209.存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。210.电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。211.多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。212.音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(mic),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。213.i/o接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。214.传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。215.通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如wi-fi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。216.在示例性实施例中,装置800可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。217.在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。218.一种非临时性计算机可读存储介质,当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行图像识别方法,所述方法包括:219.获取待识别图像在预定色彩空间的统计值;220.确定所述统计值中,属于预定统计范围内的目标统计值;其中,所述预定统计范围表征待识别的目标场景在所述预定色彩空间的取值范围;221.基于所述目标统计值在所述预定色彩空间的分布形态,确定所述待识别图像是否为包括所述目标场景的图像。222.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。223.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部