计算;推算;计数设备的制造及其应用技术1.本发明涉及知识追踪领域,具体为一种融合遗忘因素和学习能力的知识追踪方法及系统。背景技术:2.随着互联网的迅速发展,线上教育也逐渐扩大规模,线上教育能够通过学习者的学习轨迹挖掘潜在的学习规律从而实现个性化学习云计算、大数据、人工智能等技术的发展为线上教育实现个性化学习提供了强有力的支持,个性化学习受到越来越多的关注,知识追踪 (knowledge tracing,kt)技术是实现个性化学习的关键技术,知识追踪任务可以描述为:通过学生在学习过程中习题交互序列对学生的知识掌握状态进行追踪,进而预测学生在下个时刻正确回答题目的概率。3.现有多数知识追踪模型在一定程度上提高了模型准确率,解决了一些原始模型中存在的问题,但往往忽略了学生学习过程中的遗忘行为和学生自身的学习能力对知识追踪产生的影响。根据教育心理学理论,人类在学习之后会立刻开始遗忘,德国心理学家h.ebbinghaus 提出了遗忘曲线,揭示了遗忘规律,该规律指出,在最开始阶段是遗忘速度最快的阶段,随着时间推移遗忘的速度会减慢,这说明学生通过学习知识点和复习已经学过的知识点得到的知识掌握程度会随时间减少,如果按照遗忘规律对学习的知识进行复习后能够有效减小遗忘的速度。知识点掌握程度和学生自身的学习能力也息息相关,不同学习能力的学生在学习和复习之后相应知识点的掌握程度的变化也不相同。技术实现要素:4.针对以上问题,本发明公开了一种融合遗忘因素和学习能力的知识追踪方法及系统,考虑了遗忘因素和学习能力对知识追踪的影响,融合长短期记忆网络和键值对神经网络,增强知识追踪模型的可解释性和预测能力,能够对学生的知识掌握程度实时追踪,预测学生的未来答题表现。5.为解决上述技术问题,本发明提供一种融合遗忘因素和学习能力的知识追踪方法,包括以下步骤:6.s1:获取知识追踪数据集,所述知识追踪数据集包括:回答习题标签、习题回答结果、重复答题时间间隔、序列时间间隔和历史答题次数;7.s2:将所述知识追踪数据集输入到知识追踪模型中,将习题标签向量化得到嵌入向量kt,根据所述嵌入向量kt和知识点存储矩阵获取注意力权重wt,并根据所述注意力权重wt和知识掌握状态矩阵获取读相关向量rt;8.s3:根据所述知识追踪数据集获取遗忘向量ft和元组(qt,rt),将所述元组(qt,rt)进行向量化处理得到答题嵌入向量vt,将所述答题嵌入向量vt和所述遗忘向量ft连接得到向量并根据所述向量获取记忆擦除向量et和记忆更新向量at;9.s4:通过所述记忆擦除向量et和所述记忆更新向量at对当前知识掌握状态矩阵进行更新,获取遗忘处理后的中间知识状态矩阵10.i表示习题;11.s5:根据所述答题嵌入向量vt、对应的注意力权重wt(i)和所述中间知识状态矩阵获取由长短期记忆网络学习之后的知识掌握状态矩阵12.β表示偏置向量;13.s6:预测正确答题概率pt,通过所述正确答题概率pt和真实的习题回答结果rt之间的交叉熵损失函数对所述知识追踪模型进行优化,所述交叉熵损失函数14.log的底数为e或2。15.在本发明的较佳实施例中,上述方法还包括:16.s7:根据所述交叉熵损失函数最小化的梯度最优值,获取所述知识掌握状态矩阵和偏差参数矩阵的优化值。17.在本发明的较佳实施例中,上述方法还包括:18.重复执行s2至s7的步骤,深度遍历所述知识追踪数据集中的每一条知识追踪序列数据,对所述知识掌握状态矩阵和所述偏差参数矩阵循环优化,至损失不再下降时结束。19.在本发明的较佳实施例中,上述s2的步骤之后,包括:20.将所述读相关向量rt和所述嵌入向量kt串联,并通过全连接层tanh函数获取汇总向量ft;21.根据所述全连接层tanh函数和所述汇总向量ft,获取用户的学习能力水平:22.θti=tanh(wφft+bφ)23.其中,θti表示对于在t时刻标签为i的习题,用户的学习能力水平,wφ表示全连接层函数的权重系数,bφ表示全连接层函数的偏置向量。24.在本发明的较佳实施例中,上述s2的步骤之后,包括:25.根据所述习能力水平θti和sigmoid激活函数预测用户的正确答题概率pt:[0026][0027]其中,为权重向量,b2为偏置向量。[0028]在本发明的较佳实施例中,上述记忆擦除向量et:[0029][0030]所述记忆更新向量at:[0031][0032]其中,和为权重向量,be和ba为偏置向量。[0033]在本发明的较佳实施例中,上述s5的步骤,包括:[0034]使用所述答题嵌入向量vt和对应的注意力权重wt(i)作为长短期记忆网络的输入,以及所述中间知识状态矩阵作为上个长短期记忆网络节点的输出门结果输入当前节点,获取长短期记忆网络输出学习之后的知识掌握状态[0035]一种融合遗忘因素和学习能力的知识追踪系统,用于实现上述方法。[0036]本发明的有益效果在于:考虑了重复答题时间间隔、序列时间间隔、历史答题次数等遗忘因素以及学习能力水平对知识追踪的影响,融合了长短期记忆网络和键值对神经网络,增强了模型的可解释性,提高了模型预测准确率。附图说明[0037]图1为本发明示出的一种融合遗忘因素和学习能力的知识追踪方法的流程图。[0038]图2为本发明示出的一种融合遗忘因素和学习能力的知识追踪模块图。[0039]图3为本发明示出的一种长短期记忆网络网络单个细胞结构图。具体实施方式[0040]为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明的实施例保护的范围。通过具体实施方式的说明,当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,而且所附图式仅是提供参考与说明之用,并非用来对本发明加以限制。[0041]请参考图1,图1为本发明示出的一种融合遗忘因素和学习能力的知识追踪方法的流程图。[0042]如图1所示,该实施例所述的融合遗忘因素和学习能力的知识追踪方法方法,包括以下步骤:[0043]s1:获取知识追踪数据集,所述知识追踪数据集包括:回答习题标签、习题回答结果、重复答题时间间隔、序列时间间隔和历史答题次数;[0044]s2:将所述知识追踪数据集输入到知识追踪模型中,将习题标签向量化得到嵌入向量kt,根据所述嵌入向量kt和知识点存储矩阵获取注意力权重wt,并根据所述注意力权重wt和知识掌握状态矩阵获取读相关向量rt;[0045]s3:根据所述知识追踪数据集获取遗忘向量ft和元组(qt,rt),将所述元组(qt,rt)进行向量化处理得到答题嵌入向量vt,将所述答题嵌入向量vt和所述遗忘向量ft连接得到向量并根据所述向量获取记忆擦除向量et和记忆更新向量at;[0046]s4:通过所述记忆擦除向量et和所述记忆更新向量at对当前知识掌握状态矩阵进行更新,获取遗忘处理后的中间知识状态矩阵[0047]i表示习题;[0048]s5:根据所述答题嵌入向量vt、对应的注意力权重wt(i)和所述中间知识状态矩阵获取由长短期记忆网络学习之后的知识掌握状态矩阵[0049]β表示偏置向量;[0050]s6:预测正确答题概率pt,通过所述正确答题概率pt和真实的习题回答结果rt之间的交叉熵损失函数对所述知识追踪模型进行优化,所述交叉熵损失函数[0051]log的底数为e或2。[0052]通过上述方式,考虑了学生在学习过程中的遗忘因素和学生自身的学习能力对知识追踪产生的影响,并融合长短期记忆网络(lstm, long short-term memory)和键值对神经网络,增强知识追踪模型的可解释性和预测能力。[0053]可选地,本发明所述的方法还包括:[0054]s7:根据所述交叉熵损失函数最小化的梯度最优值,获取所述知识掌握状态矩阵和偏差参数矩阵的优化值。[0055]可选地,本发明所述的方法还包括:[0056]重复执行s2至s7的步骤,深度遍历所述知识追踪数据集中的每一条知识追踪序列数据,对所述知识掌握状态矩阵和所述偏差参数矩阵循环优化,至损失不再下降时结束。[0057]可选地,s2的步骤之后,包括:[0058]将所述读相关向量rt和所述嵌入向量kt串联,并通过全连接层 tanh函数获取汇总向量ft;[0059]根据所述全连接层tanh函数和所述汇总向量ft,获取用户(即学生)的学习能力水平:[0060]θti=tanh(wφft+bφ)[0061]其中,θti表示对于在t时刻标签为i的习题,用户的学习能力水平,wφ表示全连接层函数的权重系数,bφ表示全连接层函数的偏置向量。[0062]可选地,s2的步骤之后,包括:[0063]根据所述习能力水平θti和sigmoid激活函数预测用户的正确答题概率pt:[0064][0065]其中,为权重向量,b2为偏置向量。[0066]可选地,所述记忆擦除向量et:[0067][0068]所述记忆更新向量at:[0069][0070]其中,和为权重向量,be和ba为偏置向量。[0071]可选地,s5的步骤,包括:[0072]使用所述答题嵌入向量vt和对应的注意力权重wt(i)作为长短期记忆网络的输入,以及所述中间知识状态矩阵作为上个长短期记忆网络节点的输出门结果输入当前节点,获取长短期记忆网络输出学习之后的知识掌握状态[0073]示例性地,本发明所述融合遗忘因素和学习能力的知识追踪训练过程为:[0074]获取训练所用的知识追踪数据集,该训练用知识追踪数据集包括多个时间序列步骤,每一个时间序列步骤包括学习者回答习题标签、习题回答结果(即习题回答正确或习题回答错误)和遗忘因素:重复答题时间间隔、序列时间间隔和历史答题次数。[0075]将处理好的数据集输入到知识追踪模型中,习题标签向量化得到嵌入向量kt,再用kt与知识点存储矩阵中每个记忆槽mk(i)做内积后通过全连接层softmax激活函数计算出注意力权重wt,通过注意力权重wt和知识掌握状态矩阵计算出读相关向量rt。然后将读相关向量rt与嵌入向量kt串联后通过全连接层tanh函数/tanh激活函数计算出汇总向量ft。再将汇总向量ft作为输入,使用全连接层tanh函数/tanh激活函数建立学生能力网络层。计算公式为:θti= tanh(wφft+bφ),其中,θti表示对于在t时刻标签为i的习题学生的学习能力水平,wφ表示全连接层函数的权重系数,bφ表示全连接层函数的偏置向量。再通过学习能力水平在全连接层中使用sigmoid 激活函数预测出学生正确答题概率,计算公式为:其中,为权重向量,b2为偏置向量。[0076]将三种遗忘因素标量进行组合得到遗忘向量ft,将习题标签qt和习题回答结果rt组合成元组(qt,rt);将元组(qt,rt)和嵌入矩阵相乘得到答题嵌入向量vt(vt用来表示学生尝试答题得到的知识增量),再将答题嵌入向量vt和遗忘向量ft连接得到向量再使用向量计算记忆擦除向量et和记忆更新向量at。[0077]使用记忆擦除向量et和记忆更新向量at对当前知识掌握状态矩阵进行更新,得到遗忘处理后的中间知识状态矩阵[0078][0079]将答题嵌入向量vt和对应的注意力权重wt(i)作为lstm网络的输入,中间知识状态矩阵作为上个lstm节点的输出门结果输入当前节点,由lstm网络输出学习之后的知识掌握状态矩阵:[0080][0081]使用预测的正确答案概率pt和真实的习题回答结果rt之间的交叉熵损失函数来对模型进行优化,通过交叉熵损失函数最小化对模型进行更新,例如,将模型中的嵌入矩阵a和b、神经网络权重、偏置向量和记忆矩阵进行更新。交叉熵损失函数为:[0082][0083]其中,为交叉熵损失函数,log的底数为e或者2。[0084]利用所得损失函数,计算损失函数最小化的梯度最优,得到所述知识掌握状态矩阵和偏差参数矩阵的优化值。[0085]重复执行上述步骤,深度遍历知识追踪数据集中的每一条知识追踪序列数据,对所述知识掌握状态矩阵和偏差参数矩阵循环优化,至损失不再下降为止。[0086]请参阅图2,图2是本发明示出的一种融合遗忘因素和学习能力的知识追踪模块图。该模块图包含以下步骤:[0087]获取训练所用的知识追踪数据集,该训练用知识追踪数据集包括多个时间序列步骤,每一个时间序列步骤包括学习者回答习题标签、改题目回答是否正确的结果、重复答题时间间隔、序列时间间隔、历史答题次数;[0088]将处理好的数据集输入到模型中,习题标签向量化得到嵌入向量 kt,将该向量输入改进后的键值对神经网络中。[0089]将三种遗忘因素标量进行组合得到遗忘向量ft,将元组(qt,rt)和嵌入矩阵相乘得到答题嵌入向量vt,再将写向量vt和遗忘向量ft连接得到向量将该向量输入到改进后的键值对神经网络中。[0090]改进后的键值对神经网络内部计算出读相关向量,并对知识掌握状态矩阵进行更新。[0091]使用计算得出的读相关向量计算出知识掌握状态和学习能力,进而得到最终答题正确预测概率。[0092]示例性地,图2中改进后的键值对神经网络,即本发明在原有的键值对神经网络后加入lstm/长短期记忆网络后构成的模型。[0093]请参阅图3,图3为本发明示出的一种长短期记忆网络单个细胞结构图。将答题嵌入向量vt和对应的注意力权重wt(i)作为lstm网络的输入,中间知识状态矩阵作为上个lstm节点的输出门结果输入当前节点,由lstm网络输出学习之后的知识掌握状态矩阵。[0094]表1[0095][0096]上表为本发明与贝叶斯知识追踪模型和深度知识追踪模型之间的对比结果。评价指标采用auc值,auc为深度学习预测分类中的常用指标,auc越大,说明预测精度越高。本例在两个真实采集的数据集assist 2012、slepemapy.cz上测试评价,均取得了最佳效果。[0097]本发明提供的融合遗忘因素和学习能力的知识追踪方法,通过神经网络对学习能力建模,提高了知识追踪过程的可解释性,考虑了遗忘因素和学习能力对知识追踪的影响,融合lstm网络和键值对神经网络,增强知识追踪模型的可解释性和预测能力。[0098]本发明还提供一种融合遗忘因素和学习能力的知识追踪系统,用于实现上述任一实施例中的融合遗忘因素和学习能力的知识追踪方法的步骤。[0099]本发明还提供一种智能终端,智能终端包括存储器、处理器,存储器上存储有融合遗忘因素和学习能力的知识追踪程序,融合遗忘因素和学习能力的知识追踪程序被处理器执行时实现上述任一实施例中的融合遗忘因素和学习能力的知识追踪方法的步骤。[0100]本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有融合遗忘因素和学习能力的知识追踪程序,融合遗忘因素和学习能力的知识追踪程序被处理器执行时实现上述任一实施例中的融合遗忘因素和学习能力的知识追踪方法的步骤。[0101]在本发明提供的融合遗忘因素和学习能力的知识追踪系统、智能终端和计算机可读存储介质的实施例中,可以包含任一上述融合遗忘因素和学习能力的知识追踪方法实施例的全部技术特征,说明书拓展和解释内容与上述方法的各实施例基本相同,在此不再做赘述。[0102]可以理解,上述场景仅是作为示例,并不构成对于本发明实施例提供的技术方案的应用场景的限定,本发明的技术方案还可应用于其他场景。例如,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。[0103]上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。[0104]在本发明中,对于相同或相似的术语概念、技术方案和/或应用场景描述,一般只在第一次出现时进行详细描述,后面再重复出现时,为了简洁,一般未再重复阐述,在理解本发明技术方案等内容时,对于在后未详细描述的相同或相似的术语概念、技术方案和/或应用场景描述等,可以参考其之前的相关详细描述。[0105]本发明技术方案的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本发明记载的范围。[0106]以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
融合遗忘因素和学习能力的知识追踪方法及系统
作者:admin
2022-08-31 11:58:58
878
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术
- 下一篇: 一种用于环保检测的土壤取样装置的制作方法
- 上一篇: 一种交互式糖人打印机