发布信息

用于语音识别的方法和使用该方法的设备与流程

作者:admin      2022-08-30 20:03:29     237



乐器;声学设备的制造及制作,分析技术用于语音识别的方法和使用该方法的设备1.相关申请的交叉引用2.本技术基于并要求于2021年2月25日向韩国知识产权局递交的韩国专利申请no.10-2021-0025962的优先权,该申请的公开内容通过引用整体并入本文。技术领域3.本公开涉及一种用于使用多频带声音传感器进行语音识别的方法以及一种用于语音识别的设备。背景技术:4.语音识别技术已经用于各个领域。语音识别可以通过识别输入到电子设备的用户语音来提供便利。例如,可以对输入到电子设备的用户语音执行语音识别以完成在线购物。5.包括声音传感器等的电子设备可以使用人工智能(ai)助手(例如,ai语音代理)来执行语音识别。例如,诸如语音购物、通过餐厅的自助服务终端点餐、预订票务系统、金融服务和非接触式响应服务等的服务或系统可以被设置为仅对特定电子设备的已通过语音识别预先识别的用户可用。然而,如果能够仅使用用户的语音来识别用户,则电子设备的用户可以更方便地使用各个领域的服务或系统。6.需要语音识别方法来准确地识别授权用户的语音。语音用户界面(vui)可以包括语音识别技术、语音合成技术、说话人识别技术等。vui可以通过语音识别来识别电子设备的合法用户的语音。7.除了语音识别在各个领域的应用之外,对用于提高语音识别的准确性和安全性的技术的需求也不断增加。由于电子设备的用户的语音的变化,语音识别的准确性可能降低。例如,语音识别的准确性可能由于以下原因而降低:诸如电子设备的用户的声带、颈部、口腔、鼻腔等器官的时变特性;以及由诸如感冒等疾病引起的短期身体状况变化。8.使用vui进行准确的语音识别可能需要反映各种周围环境和用户状况的训练数据。然而,很难准备反映所有周围环境和用户状况的训练数据库。技术实现要素:9.一个或多个示例实施例提供了一种使用多频带声音传感器进行语音识别的方法和一种用于语音识别的设备。10.附加方面部分地将在接下来的描述中阐述,且部分地将通过该描述而变得清楚明白,或者可以通过对本公开的所呈现实施例的实践来获知。11.根据本公开的一方面,提供一种电子设备,包括:存储器;声音传感器;以及处理器,被配置为:从声音传感器接收包括与第一频带相对应的第一条数据和与第二频带相对应的第二条数据的声音数据,其中第二频带与第一频带不同;从存储器接收与注册用户的语音相关的语音数据;通过将第一条数据和第二条数据与和注册用户的语音相关的语音数据进行比较来执行语音识别;以及基于语音识别的结果来确定输出。12.声音传感器可以包括多个机械振荡器,该多个机械振荡器被配置为根据频带感测声音数据。13.该多个机械振荡器可以包括:被配置为感测第一频带中的声音数据的至少一个第一机械振荡器和被配置为感测第二频带中的声音数据的至少一个第二机械振荡器。14.与注册用户的语音相关的语音数据可以包括第一频带中的第一语音数据和第二频带中的第二语音数据。15.处理器还可以被配置为:通过将第一条数据与第一频带中的第一语音数据进行比较并且将第二条数据与第二频带中的第二语音数据进行比较来执行语音识别。16.处理器还可以被配置为通过以下操作执行语音识别:确定与第一条数据相对应的第一代表值和与第二条数据相对应的第二代表值;以及将第一代表值和第二代表值的加权和与阈值进行比较。17.处理器还可以被配置为通过以下操作执行语音识别:确定第一条数据的原始数据和第二条数据的原始数据的加权和;以及将加权和与阈值进行比较。18.处理器还可以被配置为:基于第一条数据与第一频带中的第一语音数据的比较结果,来确定声音数据是否与第一频带中的注册用户的语音匹配;以及基于第二条数据与第二频带中的第二语音数据的比较结果,来确定声音数据是否与第二频带中的注册用户的语音匹配。19.处理器还可以被配置为:当加权和大于阈值时,确定语音识别成功。20.处理器还可以被配置为:当第一频带中的确定结果与第二频带中的确定结果之和大于阈值时,确定语音识别成功。21.根据本公开的另一方面,提供一种使用电子设备识别语音的方法,该方法包括:从声音传感器接收包括与第一频带相对应的第一条数据和与第二频带相对应的第二条数据的声音数据,其中第二频带与第一频带不同;从存储器接收与注册用户的语音相关的语音数据;通过将第一条数据和第二条数据与和注册用户的语音相关的语音数据进行比较来执行语音识别;以及基于语音识别的结果来确定输出。22.声音传感器可以包括多个机械振荡器,并且该方法还包括:通过使用该多个机械振荡器根据频带感测声音数据。23.根据频带感测声音数据可以包括:通过使用该多个机械振荡器中的至少一个第一机械振荡器来感测第一频带中的声音数据;以及通过使用该多个机械振荡器中的至少一个第二机械振荡器来感测第二频带中的声音数据。24.与注册用户的语音相关的语音数据可以包括第一频带中的第一语音数据和第二频带中的第二语音数据。25.执行语音识别可以包括:将第一条数据与第一频带中的第一语音数据进行比较;以及将第二条数据与第二频带中的第二语音数据进行比较。26.执行语音识别还可以包括:确定与第一条数据相对应的第一代表值和与第二条数据相对应的第二代表值;以及将第一代表值和第二代表值的加权和与阈值进行比较。27.执行语音识别还可以包括:确定第一条数据的原始数据和第二条数据的原始数据的加权和;以及将加权和与阈值进行比较。28.该方法还可以包括:基于第一条数据与第一频带中的第一语音数据的比较结果,来确定声音数据是否与第一频带中的注册用户的语音匹配;以及基于第二条数据与第二频带中的第二语音数据的比较结果,来确定声音数据是否与第二频带中的注册用户的语音匹配。29.确定输出可以包括:当加权和大于阈值时,确定语音识别成功。30.确定输出可以包括:当第一频带中的确定结果与第二频带中的确定结果之和大于阈值时,确定语音识别成功。31.根据本公开的另一方面,提供一种电子设备,包括:存储器,存储一个或多个指令;处理器,被配置为执行一个或多个指令以进行下列操作:接收包括与第一频带相对应的第一声音数据和与第二频带相对应的第二声音数据的声音数据,其中第二频带与第一频带不同;接收所存储的与用户的语音相关的语音数据,所存储的语音数据包括与第一频带相对应的第一语音数据和与第二频带相对应的第二语音数据;以及通过将第一声音数据与第一语音数据以及第二声音数据与第二语音数据分别进行比较来执行语音识别。32.根据本公开的另一方面,提供一种电子设备,包括:存储器,存储一个或多个指令;处理器,被配置为执行一个或多个指令以进行下列操作:接收包括与第一特性特征相对应的第一声音数据和与第二特性特征相对应的第二声音数据的声音数据;接收所存储的与用户的语音相关的语音数据,所存储的语音数据包括与第一特性特征相对应的第一语音数据和与第二特性特征相对应的第二语音数据;以及通过将第一声音数据与第一语音数据以及第二声音数据与第二语音数据分别进行比较来执行语音识别。33.根据本公开的另一方面,提供一种方法,包括:接收包括与第一特性特征相对应的第一声音数据和与第二特性特征相对应的第二声音数据的声音数据;接收所存储的与用户的语音相关的语音数据,所存储的语音数据包括与第一特性特征相对应的第一语音数据和与第二特性特征相对应的第二语音数据;以及通过将第一声音数据与第一语音数据以及第二声音数据与第二语音数据分别进行比较来执行语音识别。附图说明34.根据以下结合附图的描述,本公开的一些实施例的上述和其它方面、特征以及优点将更清楚,在附图中:35.图1是示出根据各种示例实施例的电子设备的元件的框图;36.图2a是示出根据各种示例实施例的识别使用麦克风收集的语音的方法的示例图;37.图2b是示出根据各种示例实施例的识别使用声音传感器收集的语音的方法的示例图;38.图3是示出根据各种示例实施例的多频带声音传感器的示例图;39.图4是示出根据各种示例实施例的通过语音识别方法根据频带进行比较的用户的语音数据能量的示例图;40.图5是示出根据各种示例实施例的用于确定用户的语音数据中是否存在错误的语音识别方法的示例图;41.图6是示出根据各种示例实施例的语音识别方法的流程图;42.图7是示出根据各种示例实施例的识别每个频带中的语音的方法的流程图;43.图8是示出根据各种示例实施例的在语音识别方法中导出结果的过程的流程图;44.图9a至图9c是示出根据各种示例实施例的语音识别方法的示例图;以及45.图10a和图10b是示出根据各种示例实施例的使用神经网络的语音识别方法的示例图。具体实施方式46.现在详细参考示例实施例,附图中示出了实施例的示例,在整个附图中,相同的附图标记指代相同的元件。在这点上,示例实施例可以具有不同形式,并且不应当被解释为受限于本文所阐明的描述。因此,下面仅通过参考附图描述示例实施例,以解释各个方面。如本文中所使用的术语“和/或”包括相关列出项目中的一个或多个的任何和所有组合。诸如“......中的至少一个”之类的表述当在元件列表之后时修饰整个元件列表,而不是修饰列表中的单独元件。47.示例实施例中使用的术语是基于目前广泛用于本领域中的通用术语而选择的,但是这些术语可以根据本领域普通技术人员的意图、先例或本领域中的新技术而改变。而且,申请人可以任意选择一些术语,并且在这种情况下,在本公开的具体实施方式中描述所选择的术语的含义。因此,本文中使用的术语不应仅基于术语的名称来解释,而应基于术语的含义以及整个本公开中的描述来解释。48.在示例实施例的以下描述中,诸如“由......构成”、“由......形成”、“包括”、“包括了”、“包含”和“含有”之类的表达或术语不应被解释为总是包括所有指定的元件、过程或操作,而是可以被解释为不包括某些指定的元件、过程或操作,或者进一步包括其他元件、过程或操作。49.在示例实施例中,本公开的“单元”和/或“模块”可以通过硬件组件、软件组件或者包括硬件组件和软件组件的组合来实现。例如,本公开的“单元”和/或“模块”可以由电路来实现。50.在示例实施例中,当一个部分或元件被称为连接到另一部分或元件时,该部分或元件可以直接连接到该另一部分或元件,或者可以通过在其间的中间部分或元件而电连接到该另一部分或元件。51.此外,尽管使用诸如“第一”和“第二”之类的术语来描述各种元件,但是这些元件不应受这些术语限制。这些术语仅用来将一个元件与其他元件区分开来。52.现在将参考附图描述实施例。然而,本公开的构思可以以不同形式来实现,且不限于本文描述的示例实施例。53.图1是示出根据各种示例实施例的电子设备100的元件的框图。54.参考图1,电子设备100可以包括处理器110、声音传感器120和存储器130。例如,电子设备100可以接收用户的语音数据。电子设备100可以包括便携式终端和配备有无人响应系统的电子单元(例如,自助服务终端)。图1中所示的电子设备100的元件仅仅是非限制性示例,并且电子设备100可以包括其他元件以代替图1中所示的元件,或者除了图1中所示的元件之外,电子设备100还可以包括其他元件。55.参考图1,声音传感器120可以通过传感器模块感测声音信息,并且处理器110可以接收声音信息。例如,处理器110可以在每个频带中接收使用声音传感器120感测的至少一条声音数据。处理器110可以分别接收包括第一频带中的声音数据的第一条数据和包括第二频带中的声音数据的第二条数据。56.参考图1,处理器110可以对注册为电子设备100的用户的一个或多个用户执行语音识别。例如,处理器110可以对电子设备100的用户1、用户2和用户3执行语音识别。电子设备100可以将与用户1的语音相关的数据(用户1的语音数据)、与用户2的语音相关的数据和与用户3的语音相关的数据存储在存储器130中。处理器110可以在每个频带中将接收到的声音数据和与被预设为电子设备100的用户的至少一个用户的语音相关的数据进行比较。57.参考图1,处理器110可以在每个频带中计算使用声音传感器120感测的至少一条声音数据。例如,处理器110可以计算与第一条数据相对应的第一代表值和与第二条数据相对应的第二代表值。处理器110可以将第一代表值和第二代表值的加权和与阈值进行比较。根据示例实施例,阈值可以是预设的。根据另一示例实施例,处理器110可以计算第一条数据的原始数据和第二条数据的原始数据的加权和。处理器110可以将计算出的加权和与阈值进行比较。根据示例实施例,阈值可以是预设的。在执行语音识别时,处理器110可以在计算出的结果大于预设阈值时确定语音识别成功。在执行语音识别时,处理器110可以在计算出的结果小于预设阈值时确定语音识别不成功。根据示例实施例,当在第一频带中的确定、第二频带中的确定、......、第n(例如,n是奇数)频带中的确定中超过百分之五十的结果为接受时(例如,当在1和0中,1表示接受,0表示拒绝,并且1的数量大于n/2时),处理器110可以确定语音识别成功。当在第一频带中的确定、第二频带中的确定、......、第n(例如,n是奇数)频带中的确定中超过百分之五十的结果为拒绝时(例如,当在1和0中,1表示接受,0表示拒绝,并且0的数量大于n/2时),处理器110可以确定语音识别不成功。然而,确定语音识别的方法不限于基于多个频带中的多数确定结果来确定语音识别成功,例如也可以基于预设数量的确定结果来确定语音识别成功,该预设数量的确定结果是根据制造商的设计规范预设的。根据示例实施例,预设数量可以是2。58.参考图1,声音传感器120可以检测至少一条声音数据。例如,声音传感器120可以响应于内置在电子设备100中并在其上执行的人工智能(ai)助手的起始短语(例如,问候)而检测语音输入作为声音数据。声音传感器120可以包括多个机械振荡器,并且多个机械振荡器可以根据频带感测声音数据。根据示例实施例,声音传感器120可以包括二十个机械振荡器(即,第一振荡器、第二振荡器、......、第二十振荡器),并且这些机械振荡器可以具有不同的可检测频带。然而,根据另一示例实施例,机械振荡器的数量不限于二十个。声音传感器120可以使用机械振荡器(例如,第一机械振荡器)来检测第一频带中的声音数据。声音传感器120可以使用两个或更多个机械振荡器(例如,第二机械振荡器和第七机械振荡器)来检测第二频带中的声音数据。一个机械振荡器或两个或更多个机械振荡器的可检测频带以及机械振荡器的组合不限于上述示例,而是可以根据用户设置进行定制。59.参考图1,与电子设备100的用户的语音相关的数据可以存储在存储器130中。例如,与被设置为电子设备100的用户的用户1、用户2和用户3的语音相关的数据可以存储在存储器130中。存储器130可以存储与任意常数相关的数据,处理器110可以使用这些常数来计算与第一条数据相对应的第一代表值和与第二条数据相对应的第二代表值。例如,存储器130可以存储与计算第一频带中的声音数据作为第一代表值所需的常数c1相关的数据以及与计算第二频带中的声音数据作为第二代表值所需的常数c2相关的数据。存储器130可以存储与阈值相关的数据,处理器110可以在语音识别期间将计算结果与阈值进行比较。例如,存储器130可以存储与要与代表值的加权和进行比较的阈值相关的数据和与要与原始数据的加权和进行比较的阈值相关的数据。存储器130可以预先存储数据,或者可以通过电子设备100的外部连接端口或通过可以包括在电子设备100中的通信模块来实时地存储数据。例如,通信模块可以是有线通信模块或无线通信模块。60.尽管已经参考图1描述了电子设备100的处理器110对用户执行语音识别的情况,但是在其他示例实施例中,处理器110可以通过通信模块(未示出)将使用声音传感器120感测到的至少一条声音数据发送给单独的服务器。在这种情况下,服务器可以包括单独的存储器和单独的处理器,并且与电子设备100的用户的语音相关的数据可以预先存储在该单独的存储器中。服务器的处理器可以对通过通信模块接收到的至少一条声音数据执行用户语音识别。服务器的处理器可以以与电子设备100的处理器110执行语音识别相同的方式执行语音识别。61.图2a是示出根据各种示例实施例的识别使用麦克风收集的语音的方法的示例图。62.参考图2a,电子设备(例如,图1所示的电子设备100)的麦克风可以接收声音数据(例如,输入到电子设备的已认证用户/未认证用户的语音)。语音识别可以由可以包括在电子设备中的处理器(例如,图1所示的处理器110)、包括处理器的语音识别模块(例如,能够执行语音识别的模块)等执行。语音识别模块可以通过对使用麦克风获取的信号(例如,语音或声音数据)进行分析以在每个频带中将该信号和与注册用户(例如,电子设备的用户1、用户2或用户3)的语音相关的数据(例如,与用户1的语音相关的数据、与用户2的语音相关的数据或与用户3的语音相关的数据)进行比较,来执行语音识别。语音识别模块可以基于比较的结果(例如,参考图2a中的最终判定)来确定用于识别注册用户的语音识别是成功还是不成功。63.图2b是示出根据各种示例实施例的识别使用声音传感器收集的语音的方法的示例图。64.参考图2b,声音传感器(例如,图1所示的声音传感器120或图2b所示的多频带声音传感器)可以包括多个机械振荡器的阵列,与图2a所示的麦克风不同。机械振荡器中的每一个可以根据其形状具有谐振频率并且可以用作给定频带的带通滤波器(特别地,声带通滤波器)。例如,机械振荡器可以具有谐波谐振模式并且因此可以具有不同于模拟滤波器或数字滤波器的宽频率范围内的频带特性(可变传递特性)。65.参考图2b,电子设备(例如,图1所示的电子设备100)的声音传感器可以检测声音数据(例如,输入到电子设备的用户语音)。根据示例实施例,用户可以是已认证用户或未认证用户。根据示例实施例,语音识别可以由可以包括在电子设备中的处理器(例如,图1中所示的处理器110)来执行。在另一实施例中,语音识别可以由单独的服务器执行,该服务器通过数据通信从电子设备接收声音数据。在这种情况下,语音识别可以由服务器的处理器执行。66.语音识别模块可以通过在每个频带中将使用声音传感器获取的信号(例如,语音或声音数据)和与注册用户的语音相关的数据进行比较而分析该信号以确定该信号,来执行语音识别。根据示例实施例,语音识别模块可以在每个频带中将与用户1的语音相关的数据、与用户2的语音相关的数据或与用户3的语音相关的数据与电子设备的注册用户1、用户2或用户3进行比较。67.当执行语音识别时,处理器可以在每个子频带中执行语音识别过程,并且可以通过将最终确定算法应用于子频带中的判定来确定语音识别的最终结果。例如,最终确定算法可以包括投票算法、加权求和算法、神经网络算法等。处理器可以根据每个子频带中的语音识别过程和子频带中的判定结果,使用所列出的确定算法中的至少一种。语音识别模块可以基于使用最终确定算法获得的结果(例如,参考图2b所示的最终判定)来确定语音识别成功或不成功。68.图3是示出根据各种示例实施例的作为声音传感器120的示例的多频带声音传感器的示例图。69.参考图3,电子设备(例如,图1所示的电子设备100)的声音传感器120可以检测多频带声音数据。例如,声音传感器120可以检测至少一条声音数据。例如,声音传感器120可以响应于内置在电子设备中并在其中执行的ai助手的起始短语(例如,问候)而检测语音输入作为声音数据。70.参考图3,声音传感器120可以包括多个机械振荡器。例如,在根据图3中的示例实施例示出的声音传感器120中,一个长竖直条可以指代一个机械振荡器。声音传感器120可以根据机械振荡器的长度而具有不同的可检测频带。例如,可以使用短机械振荡器(或粗机械振荡器)检测高频带。在图3中,一个机械振荡器可以感测第一频带310中的声音数据,并且四个机械振荡器可以感测第二频带320中的声音数据。粗度大的四个振荡器感测声音数据的第二频带320可以高于第一频带310。可以使用三个机械振荡器感测第三频带330中的声音数据,并且因为使用谐振频率特性来感测第三频带330中的声音数据,所以第三频带330可以低于第二频带320。参考图3描述的示例仅仅是非限制性示例,并且包括多个机械振荡器的声音传感器120可以根据制造过程规范而被不同地配置。71.参考图3,声音传感器120可以通过使用一个或多个机械振荡器来检测多个频带中的声音数据。例如,可以在第一频带310、第二频带320和第三频带330中可区分地感测输入到声音传感器120的声音数据。在另一示例实施例中,使用声音传感器120感测到的声音数据可以在第一频带310、第二频带320和第三频带330中可区分地发送给处理器(例如,图1中所示的处理器110)。使用声音传感器120或处理器根据频带划分声音数据的过程可以通过根据预先设置在声音传感器120中的频带来感测声音数据的方法、由处理器在预设频带中可区分地接收使用声音传感器120感测到的声音数据的方法、或这两种方法的组合来执行。72.图4是示出根据各种实施例的通过语音识别方法根据频带进行比较的用户的语音数据能量的示例图。73.处理器(例如,图1所示的处理器110)可以对被注册为电子设备(例如,图1所示的电子设备100)的用户的多个用户进行语音识别。例如,处理器可以对被注册为电子设备的用户的用户1、用户2和用户3执行语音识别。处理器可以确定接收到的声音数据是否与用户1、用户2和用户3中的至少一个匹配。例如,处理器可以将接收到的声音数据与存储在存储器(例如,图1所示的存储器130)中的用户1的语音数据、用户2的语音数据和用户3的语音数据进行比较,以确定接收到的声音数据是否与用户1、用户2和用户3中的至少一个匹配。74.参考图4,电子设备的注册用户可以是用户1、用户2和用户3。例如,语音数据420可以包括与用户1的语音相关的数据421、与用户2的语音相关的数据422和与用户3的语音相关的数据423。75.参考图4,根据频带示出了在整个频带410中接收到的与用户的语音相关的数据的能量。例如,在整个频带410中的与用户1的语音相关的数据421的能量可以对应于图4所示的表中的“用户1的语音”行与“整个频带410”列之间的交叉。在整个频带410中的与用户2的语音相关的数据422的能量可以对应于图4所示的表中的“用户2的语音”行与“整个频带410”列之间的交叉。在整个频带410中的与用户3的语音相关的数据423的能量可以对应于图4所示的表中的“用户3的语音”行与“整个频带410”列之间的交叉。76.参考图4,在频带310、320和330中的与用户语音相关的数据的能量可以存储在电子设备的存储器中。例如,与用户1的语音、用户2的语音和用户3的语音相关的数据420可以预先存储在存储器中并且可以与在这些频带中实时感测到的声音数据进行比较。77.与用户1的语音相关的数据421、与用户2的语音相关的数据422和与用户3的语音相关的数据423可以存储在电子设备100的存储器130中。处理器110可以在每个频带中将接收到的声音数据与被预先设置为电子设备100的用户的至少一个用户的语音数据进行比较。例如,在每个频带中和与至少一个用户的语音相关的数据420进行比较的声音数据可以是指第一频带310、第二频带320和第三频带330中的能量。78.参考图4,由声音传感器(例如,图1中所示的声音传感器120)感测的声音数据的能量可以具有第一频带310中的分布,其对应于“第一频带310”列与“用户n的语音”行(与用户n的语音相关的数据421、422或423)之间的交叉。例如,可以执行语音识别以识别向电子设备输入声音数据的用户是否为用户1。在执行用于识别用户1的语音识别之前,处理器可以将与用户1的语音相关的数据421存储在存储器中。在这种情况下,处理器可以通过被配置为感测每个频带中的声音数据的声音传感器来接收在每个频带中的与用户1的语音相关的数据421,并且可以将与用户1的语音相关的数据421存储在存储器中。处理器可以通过将在每个频带中接收并存储在存储器中的与用户1的语音相关的数据421与之后在每个频带中接收的声音数据进行比较来执行语音识别。例如,处理器可以将在第一频带310、第二频带320和第三频带330中接收并存储在存储器中的与用户1的语音相关的数据421与之后在第一频带310、第二频带320和第三频带330中接收的声音数据进行比较。处理器可以基于比较结果使用语音识别算法来确定输入当前声音数据的用户是否为用户1(例如,确定语音识别成功或不成功)。79.参考图4,由声音传感器感测的声音数据的能量可以具有第二频带320中的分布,其对应于“第二频带320”列与“用户n的语音”行(与用户n的语音相关的数据421、422或423)之间的交叉。例如,可以执行语音识别以识别向电子设备输入声音数据的用户是否为用户2。在执行用于识别用户2的语音识别之前,处理器可以将与用户2的语音相关的数据422存储在存储器中。在这种情况下,处理器可以通过被配置为感测每个频带中的声音数据的声音传感器来接收在每个频带中的与用户2的语音相关的数据422,并且可以将与用户2的语音相关的数据422存储在存储器中。处理器可以通过将在每个频带中接收并存储在存储器中的与用户2的语音相关的数据422与之后在每个频带中接收的声音数据进行比较来执行语音识别。例如,处理器可以将在第一频带310、第二频带320和第三频带330中接收并存储在存储器中的与用户2的语音相关的数据422与之后在第一频带310、第二频带320和第三频带330中接收的声音数据进行比较。处理器可以基于比较结果使用语音识别算法来确定输入当前声音数据的用户是否为用户2(例如,语音识别成功或语音识别失败)。80.参考图4,由声音传感器感测的声音数据的能量可以具有第三频带330中的分布,其对应于“第三频带330”列与“用户n的语音”行(与用户n的语音相关的数据421、422或423)之间的交叉。例如,可以执行语音识别以识别向电子设备输入声音数据的用户是否为用户3。在执行用于识别用户3的语音识别之前,处理器可以将与用户3的语音相关的数据423存储在存储器中。在这种情况下,处理器可以通过被配置为感测每个频带中的声音数据的声音传感器来接收在每个频带中的与用户3的语音相关的数据423,并且可以将与用户3的语音相关的数据423存储在存储器中。处理器可以通过将在每个频带中接收并存储在存储器中的与用户3的语音相关的数据423与之后在每个频带中接收的声音数据进行比较来执行语音识别。例如,处理器可以将在第一频带310、第二频带320和第三频带330中接收并存储在存储器中的与用户3的语音相关的数据423与之后在第一频带310、第二频带320和第三频带330中接收的声音数据进行比较。处理器可以基于比较结果使用语音识别算法来确定输入当前声音数据的用户是否为用户3(例如,语音识别成功或语音识别失败)。81.参考图4,处理器可以接收输入到电子设备的声音数据,并且可以通过语音识别来确定该声音数据是否是电子设备的注册用户(例如,用户1、用户2或用户3)的声音数据。例如,处理器可以通过在每个频带(例如,第一频带310、第二频带320和第三频带330)中将通过声音传感器接收的声音数据和与用户1的语音相关的数据421、与用户2的语音相关的数据422以及与用户3的语音相关的数据423进行比较以找到与接收到的声音数据匹配的数据,来执行语音识别。处理器可以将在每个频带中接收的声音数据与根据频带以表的形式存储的与用户1的语音相关的数据421的能量、与用户2的语音相关的数据422的能量和与用户3的语音相关的数据423的能量进行比较。例如,当输入任意声音数据时,处理器可以从存储器接收表类型的数据以确定该声音数据是否是在电子设备中注册的用户的声音数据。处理器可以在每个频带(例如,第一频带310、第二频带320和第三频带330)中将输入的任意声音数据与接收的表类型的数据进行比较。当在每个频带中的比较结果显示出所输入的任意声音数据在两个或更多个频带中和与用户1的语音相关的数据421匹配时,处理器可以确定语音识别成功。当在每个频带中的比较结果显示出所输入的任意声音数据仅在一个频带中和与用户1的语音相关的数据421匹配时,处理器可以确定语音识别不成功。此外,当在每个频带中的比较结果显示出所输入的任意声音数据在任何频带中都和与用户1的语音相关的数据421不匹配时,处理器可以确定语音识别不成功。例如,当处理器确定所输入的任意声音数据在n个频带(例如,n表示奇数)的超过50%的频带中和与用户n的语音相关的数据421、422或423匹配时,处理器可以确定对用户n的语音识别成功。当处理器确定所输入的任意声音数据在n个频带(例如,n表示奇数)的低于50%的频带中和与用户n的语音相关的数据421、422或423匹配时,处理器可以确定对用户n的语音识别不成功。82.图5是示出根据各种示例实施例的用于确定用户的语音数据中是否存在错误的语音识别方法的示例图。83.参考图5,关于语音识别的判定可以表示为成功或不成功。例如,判定为1可以指成功的语音识别。例如,判定为0可以指不成功的语音识别。成功的语音识别可以指判定一致地为1的情况。例如,判定不一致地为1或0的情况可能指不成功的语音识别。判定不一致地为1或0的情况可被确定为在语音识别期间出现错误的情况。成功的语音识别可以指输入的声音数据和与电子设备的多个注册用户中的至少一个用户的语音相关的数据匹配的情况。不成功的语音识别可以指输入的声音数据和与电子设备的多个注册用户中的任何一个用户相关的数据都不匹配的情况。84.参考图5,可以分别基于不同的声音数据来获得左侧和右侧所示的关于语音识别的判定。例如,可以基于相同的声音数据来获得左侧所示的关于语音识别的九个判定。例如,可以基于与用于导出左侧的九个判定的声音数据不同的声音数据,来获得右侧示出的关于语音识别的九个判定。图5中最下侧的判定530可以是通过在七个频带520中执行语音识别并且然后对其结果应用预设的确定算法(例如,投票算法、加权求和算法等)而导出的判定。85.图5示出了关于对输入到电子设备(例如,图1所示的电子设备100)的声音数据执行的语音识别的判定。参考图5,在整个频带510中,左侧和右侧所示的判定可以彼此不同。例如,在整个频带510中的左侧判定可以指示成功的语音识别(例如,判定的结果总是1),其中数据被识别为电子设备的多个注册用户之一的语音数据。例如,右侧所示的整个频带510中的判定具有语音识别错误,因为数据被不一致地识别为是或不是电子设备的多个注册用户之一的语音数据,即,语音识别失败(例如,判定的结果不一致地为1和0)。86.参考图5,处理器(例如,图1所示的处理器110)可以通过声音传感器(例如,图1所示的声音传感器120)接收七个频带520中的声音数据,并且可以对声音数据执行语音识别。例如,处理器可以接收在七个频带520中(即,在第一频带521、第二频带522、第三频带523、第四频带524、第五频带525、第六频带526和第七频带527中)的每一个中的声音数据,并且可以确定七个频带520中的每一个中的声音数据是否是电子设备的多个注册用户中的用户的声音数据。处理器在七个频带520(即,第一频带521至第七频带527)中接收的声音数据可以在七个频带520中的每一个中与存储在存储器(例如,存储器130)中的多个注册用户的语音数据进行比较。87.参考图5,在七个频带520中的关于语音识别的左侧判定中,在第一频带521、第二频带522、第三频带523、第四频带524、第五频带525和第七频带527中的判定一致地为1。然而,第六频带526中的判定随着时间的推移两次为0,也就是说,存在指示判定不一致地为1的错误。在七个频带520中的关于语音识别的左侧判定中,仅在一个频带(例如,第六频带526)中存在错误,并且在超过预设频带数量(例如,三个频带)的频带中的判定一致地为1,使得最终对语音识别做出的判定530可以为成功。88.参考图5,在七个频带520中的关于语音识别的右侧判定中,第六频带526和第七频带527中的判定一致地为0。然而,第一频带521、第二频带522、第三频带523、第四频带524和第五频带525中的判定随着时间的推移不一致地为0和1,显示出错误。在右侧所示的七个频带520中的关于语音识别的判定中,在五个频带(例如,第一频带521、第二频带522、第三频带523、第四频带524和第五频带525)中存在错误,但在超过预设频带数量(例如,三个频带)的频带中判定为0,使得最终对语音识别做出的判定530可以为失败。89.图6是示出根据各种示例实施例的语音识别方法的流程图。90.参考图6,在操作610中,电子设备(例如,图1所示的电子设备100)的处理器(例如,图1所示的处理器110)可以从声音传感器(例如,图1所示的声音传感器120)接收声音数据。声音数据可以包括与第一频带相对应的第一条数据和与第二频带相对应的第二条数据。例如,声音传感器可以包括能够感测不同频带中的声音数据的多个机械振荡器,并且因此可以通过使用多个机械振荡器来感测不同频带中的声音数据。也就是说,声音传感器可以通过使用能够感测第一频带中的声音数据的至少一个机械振荡器和能够感测第二频带中的声音数据的至少一个机械振荡器来区分地感测第一频带和第二频带中的声音数据。处理器可以接收由声音传感器在各频带中感测到的声音数据。91.参考图6,在操作620中,处理器可以从存储器(例如,图1所示的存储器130)接收与用户语音相关的数据。例如,用户可以指电子设备的多个注册用户中的至少一个用户。与用户语音相关的数据可以指与被注册为电子设备的用户的多个用户的语音相关的数据。与用户语音相关的数据可以预先存储在存储器中,并且当另外注册了用户时,可以更新与用户语音相关的数据。这里,数据可以通过任何方法被发送、接收和存储而没有限制。92.参考图6,在操作630中,处理器可以通过在每个相关频带中将第一条数据和第二条数据与同用户语音相关的数据进行比较来执行语音识别。例如,处理器可以通过在第一频带中将与用户语音相关的数据与第一条数据进行比较来执行语音识别。此外,处理器可以通过在第二频带中将与用户语音相关的数据与第二条数据进行比较来执行语音识别。在这种情况下,第一频带中的与用户语音相关的数据和第二频带中的与用户语音相关的数据可以指预先存储在存储器(例如,图1所示的存储器130)中的注册用户的语音数据。93.图7是示出根据各种示例实施例的识别每个频带中的语音的方法的流程图。94.参考图7,在操作710中,电子设备(例如,图1所示的电子设备100)的处理器(例如,图1所示的处理器110)可以从声音传感器(例如,图1所示的声音传感器120)接收各频带中的第一条数据和第二条数据。在一个实施例中,声音传感器可以具有分别具有频带特性的多个子频带(或通道)。可以通过多个子频带在每个频带中感测输入到声音传感器的声音。95.处理器可以接收由声音传感器在多个子频带中感测的基于频带的数据。例如,处理器可以从声音传感器接收在具有第一频带特性的第一子频带(或第一通道)中感测的第一条数据。此外,处理器可以从声音传感器接收在具有与第一频带不同的第二频带特性的第二子频带(或第二通道)中感测的第二条数据。96.参考图7,在操作720中,处理器可以从存储器(例如,图1所示的存储器130)接收每个频带中的与用户语音相关的数据。例如,每个频带中的与用户语音相关的数据可以指与电子设备的注册用户的语音相关并根据频带进行划分的数据。97.参考图7,在操作730中,处理器可以通过经训练的识别算法在每个频带中对接收的数据执行比较和确定(子频带判定)。98.处理器可以将在具有第一频带特性的第一子频带中感测的第一条数据和与注册用户的语音相关的数据中的第一频带中的数据进行比较。此外,处理器可以将在具有第二频带特性的第二子频带中感测的第二条数据和与注册用户的语音相关的数据中的第二频带中的数据进行比较。处理器可以对第一频带和第二频带中的数据并行地执行比较。99.处理器可以将在每个频带中接收的数据与根据频带预先存储的与注册用户的语音相关的数据进行比较,并且当数据之间的相似度大于或等于一定相似度时可以接受所接收的数据,而当数据之间的相似度小于该一定相似度时可以拒绝所接收的数据。根据示例实施例,该一定相似度可以是预设的。根据示例实施例,处理器可以对第一条数据和第二条数据并行地执行确定。100.参考图7,在操作740中,处理器可以基于对在每个频带中接收的数据的确定结果来执行投票和最终语音识别。例如,当在接收到的数据中的接受的数据的条数大于在接收到的数据中的拒绝的数据的条数时,处理器可以将投票的结果确定为接受,并且因此可以最终确定语音识别成功。在另一示例中,当在接收到的数据中的接受的数据的条数大于预设的接受数量时,处理器可以将投票结果确定为接受,并且可以最终确定语音识别成功。101.图8是示出根据各种示例实施例的在语音识别方法中导出结果的过程的流程图。102.参考图8,在操作810中,电子设备(例如,图1所示的电子设备100)的处理器(例如,图1所示的处理器110)可以从声音传感器(例如,图1所示的声音传感器120)接收声音数据。声音数据可以包括与第一频带相对应的第一条数据和与第二频带相对应的第二条数据。例如,声音传感器可以包括能够感测不同频带中的声音数据的多个机械振荡器,并且因此可以通过使用多个机械振荡器来感测不同频带中的声音数据。也就是说,声音传感器可以通过使用能够感测第一频带中的声音数据的至少一个机械振荡器和能够感测第二频带中的声音数据的至少一个机械振荡器来区分地感测第一频带和第二频带中的声音数据。处理器可以接收由声音传感器在各频带中感测到的声音数据。103.参考图8,在操作820中,处理器可以将语音识别的结果与阈值进行比较。根据示例实施例,阈值可以是预设的。处理器可以将根据频带接收的声音数据与存储在存储器(例如,图1所示的存储器130)中的与用户语音相关的数据的基于频带的数据进行比较。例如,处理器可以计算与第一条数据相对应的第一代表值和与第二条数据相对应的第二代表值。处理器可以将第一代表值和第二代表值的加权和与预设阈值进行比较。在另一示例实施例中,处理器可以计算第一条数据的原始数据和第二条数据的原始数据的加权和。处理器可以将计算出的加权和与预设阈值进行比较。104.参考图8,在操作830中,当在语音识别期间确定计算结果大于预设阈值时,处理器可以确定语音识别成功。例如,当在第一频带中的确定结果、第二频带中的确定结果、......、第n频带(例如,n为奇数)中的确定结果中超过百分之五十的确定结果为接受结果时(例如,在1和0中,如果值1表示接受,并且1的数量大于n/2),处理器可以确定语音识别成功。在操作840中,当在语音识别期间确定计算结果小于预设阈值时,处理器可以确定语音识别不成功。例如,当在第一频带中的确定结果、第二频带中的确定结果、......、第n频带(例如,n为奇数)中的确定结果中超过百分之五十的确定结果为拒绝结果时(例如,在1和0中,如果值1表示接受,并且0的数量大于n/2),处理器可以确定语音识别不成功。在操作840中确定语音识别不成功之后,处理器可以返回到操作810并对声音数据执行语音识别。105.图9a至图9c是示出根据各种示例实施例的语音识别方法的示例图。106.参考图9a,处理器(例如,图1所示的处理器110)可以对通过声音传感器(例如,图1所示的声音传感器120)感测的至少一个声音数据执行基于频带的计算。处理器可以包括在语音识别模块910中。例如,处理器可以计算与第一条数据相对应的第一代表值和与第二条数据相对应的第二代表值。处理器可以将第一代表值和第二代表值的加权和与预设阈值进行比较。每个代表值可以是通过将原始数据乘以预设常数而得到的值,并且可以被表示为1或0的判定。例如,判定为1可以表示成功的语音识别,判定为0可以表示不成功的语音识别。例如,处理器可以将第一到第n频带(例如,n是奇数)中的代表值与预先存储的每个频带中的和用户语音相关的数据进行比较以得出判定(子频带判定),并且然后可以通过最终确定算法得出最终判定。此外,处理器可以通过组合所得出的判定来确定语音识别是否成功。107.参考图9b,处理器可以计算第一条数据和第二条数据的原始数据(例如,0.889、0.93和0.6)的加权和。处理器可以包括在语音识别模块920中。处理器可以将计算出的加权和与预设阈值进行比较。在执行语音识别时,处理器可以在计算结果大于预设阈值时确定语音识别成功。在执行语音识别时,处理器可以在计算结果小于预设阈值时确定语音识别不成功。108.参考图9c,基于关于接受的数量和拒绝的数量的投票结果,处理器可以确定语音识别成功或不成功。处理器可以包括在语音识别模块930中。当在第一频带中的投票结果、第二频带中的投票结果、......、第n频带中的投票结果(例如,n表示奇数)中超过50%的投票结果为接受(例如,存在接受和拒绝,并且接受的数量大于n/2)时,处理器可以确定语音识别成功。当在第一频带中的投票结果、第二频带中的投票结果、......、第n频带中的投票结果(例如,n表示奇数)中超过50%的投票结果为拒绝(例如,存在接受和拒绝,并且拒绝的数量大于n/2)时,处理器可以确定语音识别不成功。109.图10a和图10b是示出根据各种示例实施例的使用神经网络的语音识别方法的示例图。110.参考图10a,处理器(例如,图1所示的处理器110)可以对通过声音传感器(例如,图1所示的声音传感器120)感测的至少一个声音数据执行基于频带的计算。处理器可以包括在语音识别模块1010中。例如,处理器可以计算与第一条数据相对应的第一代表值和与第二条数据相对应的第二代表值。处理器可以将第一代表值和第二代表值的加权和与预设阈值进行比较。每个代表值可以是通过将原始数据乘以预设常数而得到的值,并且可以被表示为1或0的判定。例如,判定为1可以表示成功的语音识别,判定为0可以表示不成功的语音识别。例如,处理器可以将第一到第n频带(例如,n是奇数)中的代表值与预先存储的每个频带中的和用户语音相关的数据进行比较以得出判定(子频带判定),并且然后可以通过组合所得出的判定来确定语音识别是否成功。语音识别模块1010可以神经网络来确定语音识别是否成功。例如,神经网络可以重复地将与电子设备(例如,图1所示的电子设备100)的多个注册用户的语音相关的数据和接收到的声音数据进行比较。神经网络可以通过考虑由用户身体状况的变化引起的声音数据变化来使用通过重复语音识别而获得的结果以自适应地执行语音识别。神经网络可以包括处理器或者可以附加地包括神经处理器。111.参考图10b,处理器可以计算第一条数据和第二条数据的原始数据(例如,0.889、0.93和0.6)的加权和。处理器可以包括在语音识别模块1020中。处理器可以将计算出的加权和与预设阈值进行比较。在执行语音识别时,处理器可以在计算结果大于预设阈值时确定语音识别成功。在执行语音识别时,处理器可以在计算结果小于预设阈值时确定语音识别不成功。例如,神经网络可以重复地将与电子设备的多个注册用户的语音相关的数据和接收到的声音数据进行比较。神经网络可以通过考虑由用户身体状况的变化引起的声音数据变化来使用通过重复语音识别而获得的结果以自适应地执行语音识别。神经网络可以包括处理器或者可以附加地包括神经处理器。112.图9a至图10b中所示的语音识别模块910、920、930、1010和1020中的每一个可以具有用于确定语音识别是否成功的算法。例如,语音识别模块910、920、930、1010和1020中的每一个可以具有图9a至图10b所示的算法中的至少一种算法并且可以使用该至少一种算法来执行语音识别。113.根据实施例的一方面,一种电子设备可以包括:存储器;声音传感器;以及处理器,其中,处理器可以被配置为:从声音传感器接收包括与第一频带相对应的第一条数据和与第二频带相对应的第二条数据的声音数据,其中第二频带与第一频带不同;从存储器接收与注册用户的语音相关的数据;通过将第一条数据和第二条数据与和注册用户的语音相关的数据进行比较来执行语音识别;以及根据语音识别的结果来确定输出。114.声音传感器可以包括多个机械振荡器,并且多个机械振荡器可以被配置为根据频带感测声音数据。115.多个机械振荡器可以包括被配置为感测第一频带中的声音数据的至少一个机械振荡器和被配置为感测第二频带中的声音数据的至少一个机械振荡器。116.与注册用户的语音相关的数据可以包括第一频带中的用户语音数据和第二频带中的用户语音数据。117.当处理器执行语音识别时,处理器还可以被配置为:将第一条数据与第一频带中的用户语音数据进行比较,并将第二条数据与第二频带中的用户语音数据进行比较。118.在执行语音识别时,处理器还可以被配置为:计算第一代表值和第二代表值,第一代表值是第一条数据的代表值,第二代表值是第二条数据的代表值;以及将第一代表值和第二代表值的加权和与预设阈值进行比较。119.在执行语音识别时,处理器还可以被配置为:计算第一条数据的原始数据和第二条数据的原始数据的加权和;以及将计算出的加权和与预设阈值进行比较。120.处理器还可以被配置为:基于第一条数据与第一频带中的用户语音数据之间的比较结果,来确定声音数据是否与第一频带中的注册用户语音匹配;以及基于第二条数据与第二频带中的用户语音数据之间的比较结果,来确定声音数据是否与第二频带中的注册用户语音匹配。121.处理器还可以被配置为:当加权和大于预设阈值时,确定语音识别成功。122.处理器还可以被配置为:当第一频带中的确定结果与第二频带中的确定结果之和大于预设阈值时,确定语音识别成功。123.根据另一实施例的一方面,可以提供一种使用电子设备识别语音的方法,该方法包括:从声音传感器接收包括与第一频带相对应的第一条数据和与第二频带相对应的第二条数据的声音数据,其中第二频带与第一频带不同;从存储器接收与注册用户的语音相关的数据;通过将第一条数据和第二条数据与和注册用户的语音相关的数据进行比较来执行语音识别;以及根据语音识别的结果来确定输出。124.声音传感器可以包括多个机械振荡器,并且该方法还可以包括通过使用多个机械振荡器根据频带感测声音数据。125.根据频带感测声音数据可以包括:通过使用多个机械振荡器中的至少一个来感测第一频带中的声音数据;以及通过使用多个机械振荡器中的至少一个来感测第二频带中的声音数据。126.与注册用户的语音相关的数据可以包括第一频带中的用户语音数据和第二频带中的用户语音数据。127.执行语音识别可以包括:将第一条数据与第一频带中的用户语音数据进行比较;以及将第二条数据与第二频带中的用户语音数据进行比较。128.执行语音识别还可以包括:计算第一代表值和第二代表值,第一代表值是第一条数据的代表值,第二代表值是第二条数据的代表值;以及将第一代表值和第二代表值的加权和与预设阈值进行比较。129.执行语音识别还可以包括:计算第一条数据的原始数据和第二条数据的原始数据的加权和;以及将计算出的加权和与预设阈值进行比较。130.该方法还可以包括:基于第一条数据与第一频带中的用户语音数据之间的比较结果,来确定声音数据是否与第一频带中的注册用户语音匹配;以及基于第二条数据与第二频带中的用户语音数据之间的比较结果,来确定声音数据是否与第二频带中的注册用户语音匹配。131.确定输出可以包括:当加权和大于预设阈值时,确定语音识别成功。132.确定输出可以包括:当第一频带中的确定结果与第二频带中的确定结果之和大于预设阈值时,确定语音识别成功。133.如上所述,根据上述示例实施例中的一个或多个,在语音识别方法中,可以通过能够根据频带区分地感测语音数据的多频带声音传感器来接收用户的语音数据。当电子设备的声音传感器根据频带区分地接收声音数据时,可以在每个频带中执行用户语音识别。当声音传感器包括多个机械振荡器时,电子设备可以通过根据多个频带的特性执行语音识别来提高语音识别的准确度。134.在执行用户语音识别时,电子设备可以通过声音传感器接收每个频带中的语音数据。电子设备可以通过在每个频带中将接收到的语音数据与更新并存储在存储器中的用户语音数据进行比较来减少语音识别中的错误。135.应当理解,本文所描述的示例实施例应当被认为仅是描述性的,而不是为了限制目的。对每个示例实施例中的特征或方面的描述应当典型地被看作是可用于其他示例实施例中的其他类似特征或方面。尽管已参考附图描述了一个或多个示例实施例,但本领域普通技术人员应当理解,在不脱离所附权利要求所限定的精神和范围的情况下,可以进行形式和细节上的多种改变。









图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!




内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!




免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

相关内容 查看全部