机械加工,机床金属加工设备的制造及其加工,应用技术1.本发明涉及一种热轧预测方法及系统,更具体地说,涉及一种热轧加热炉出钢板坯粗轧出口温度的预测方法及系统。背景技术:2.热轧带钢作为钢铁行业的重要产品之一,已经在国防装备、汽车制造、航空航天等领域扮演着重要角色。带钢热连轧生产过程工艺流程复杂。其中,温度的变化是一个非常重要的因素,其可使热轧带钢内部的微观组织发生变化,从而使带钢产品的力学性能发生变化,最终影响成品带钢的性能与质量。3.对于给定规格的钢种,热轧加热炉板坯出炉温度,直接影响粗轧出口温度。遗憾的是,加热炉板坯出炉温度,目前没有办法直接测量,只能采用数学模型进行间接计算,同时,操作人员凭经验进行调整。由于不同的操作班组,水平不一,导致粗轧出口温度的波动,从而影响产品的尺寸精度和性能。4.加热炉操作主要参考粗轧出口温度,根据粗轧出口中间板坯实际测量温度的高低,根据经验调节加热炉炉气温度,尽量减少粗轧出口钢坯温度的偏差,使其接近工艺规定的粗轧出口目标温度。但是,由于实际生产中,热轧加热炉抽出板坯到达粗轧机出口,需要一个比较长的滞后时间,导致操作人员调节滞后,从而引起温度产生比较大的波动。5.对于给定规格的钢种,利用加热炉实际数据和粗轧出口温度的历史数据,准确预测加热炉待抽出板坯在粗轧出口的温度,进行提前预判,指导加热操作,这将有利于板坯温度的精准控制及提高热轧产品质量。6.目前,有关热连轧带钢的温度预测模型也出现了一些公开的专利文件,例如,名称为《一种提高热轧中间坯头部温度计算精度的方法》(专利号:zl201510668578.9)文件中记载的方法:将线性计算区间扩大,并采用线性算法和平均值算法相结合的方式,在自动化一级和二级中同时对温度假数进行过滤,并将二级模型默认的温度值根据成品带钢厚度进行细分,从而提高了精轧预计算准确性。名称为《一种基于速度调节的热轧带钢终轧温度控制方法》(专利号:zl201710194635.3)的文件中记载的方法:设置带钢目标厚度与第一加速度的对应表、终轧温度偏差与第二加速度的对应表,以及带钢目标厚度与加速修正系数的对应表;根据带钢目标厚度查找对应的第一加速度,使用第一加速度对带钢进行升速轧制;根据带钢的终轧温度偏差查找对应的第二加速度;根据带钢的目标厚度查找对应的加速修正系数;利用第二加速度乘以加速修正系数得到第三加速度;使用第三加速度进行速度调节,该发明提供的基于速度调节的热轧带钢终轧温度控制方法,可以有效地提高轧制温度控制精度。以上专利的局限在于:没有利用加热炉和轧制生产过程积累的大量历史数据进行建模,没有充分挖掘历史数据中蕴含的模型规律,没有建立起基于数据驱动的加热炉待出钢板坯在粗轧出口温度的预报模型。以上专利的局限在于:没有利用轧制生产过程积累的大量历史数据进行建模,没有充分挖掘历史数据中蕴含的模型规律。7.近年来,随着人工智能与大数据分析技术的快速发展,基于数据驱动的预测方法越来越受到各国学者的欢迎和青睐。在热连轧生产过程中,计算机和传感器采集到了大量的实际生产过程数据,利用机器学习方法可以从这些大量的、有噪声的、模糊的实际生产数据中预测出板坯在粗轧机架出口的温度。技术实现要素:8.针对现有技术中存在的上述问题,本发明的目的是提供一种加热炉出钢板坯粗轧出口温度的预测方法及系统,从而提升温度预测精度。9.为实现上述目的,本发明采用如下技术方案:10.一种加热炉出钢板坯粗轧出口温度的预测方法,包括:采集热轧板坯生产过程数据;对生产过程数据进行预处理;构建基于长短期记忆神经网络的粗轧出口温度预测模型;添加历史时刻的粗轧出口温度作为新的输入变量,用于预测当前时刻热轧加热炉板坯的粗轧出口温度;选择预测效果最好的温度预测模型作为选定模型;使用随机森林算法对生产过程数据进行重要性排序;逐步剔除经随机森林筛选的重要性评分低的生产过程数据,将剩余生产过程数据重新输入到选定模型用以预测粗轧出口温度,直至筛选出使得选定模型精度最高的生产过程数据组合。11.进一步地,生产过程数据包括:材料实际宽度、材料实际厚度、材料长度、材料实际重量、装炉板坯重量、加热炉号、炉内列号、在炉内时间、实际装炉温度、实际出炉温度、出炉温度目标值、出炉温度负公差、出炉温度正公差、预加热段结束温度、预加热段加热时间、第一加热段加热时间、第二加热段加热时间、均热段加热时间、第一加热段段末温度、第二加热段段末温度、均热段段末温度、粗轧出口温度。12.进一步地,预处理包括:剔除生产过程数据中有缺失项的带钢记录;将每条生产过程数据按照生产时刻从先到后进行排序;将生产过程数据进行最大最小归一化处理。13.进一步地,将每一块板坯对应的粗轧出口温度作一个时间序列,并截取当前板坯之前的连续n个板坯的粗轧出口温度作为新的输入变量。14.进一步地,若当前待预测板坯的前一块板坯的粗轧出口温度数据可测得,则将t-1、t-2、…、t-n时刻的粗轧出口温度作为n个新的输入变量;若当前待预测板坯之前的第二块板坯的粗轧出口温度数据可测得,则将t-2、t-3、…、t-n时刻的粗轧出口温度作为n个新的输入变量;若当前待预测板坯之前的第三块板坯的粗轧出口温度数据可测得,则将t-3、t-4、…、t-n时刻的粗轧出口温度作为n个新的输入变量;其中t表示当前t时刻板坯的粗轧出口温度。15.进一步地,根据温度预测模型预测的精度,选择精度最高的模型所对应的n值,并将该n值所对应的温度预测模型作为选定模型。16.进一步地,剔除经随机森林筛选的重要性评分低的生产过程数据,将剩余变量输入到选定模型用以预测粗轧出口温度,并记录短期选定模型的精度;反复上述操作,直至选定模型的精度明显连续变低,则停止删除生产过程数据;对比所有选定模型的精度,选出具有最高精度的选定模型;将具有最高精度的选定模型对应的生产过程数据作为最终的生产过程数据组合。17.为实现上述目的,本发明还采用如下技术方案:18.一种加热炉出钢板坯粗轧出口温度的预测系统,包括:数据采集模块,数据采集模块采集热轧板坯生产过程数据,并对生产过程数据进行预处理;预测模块,预测模块构建基于长短期记忆神经网络的粗轧出口温度预测模型,添加历史时刻的粗轧出口温度作为新的输入变量,用于预测当前时刻热轧加热炉板坯的粗轧出口温度,最终选择预测效果最好的温度预测模型作为选定模型;排序筛选模块,排序筛选模块使用随机森林算法对生产过程数据进行重要性排序,并逐步剔除经随机森林筛选的重要性评分低的生产过程数据,将剩余生产过程数据重新输入到预测模块的选定模型用以预测粗轧出口温度,直至筛选出使得选定模型精度最高的生产过程数据组合。19.进一步地,生产过程数据包括:材料实际宽度、材料实际厚度、材料长度、材料实际重量、装炉板坯重量、加热炉号、炉内列号、在炉内时间、实际装炉温度、实际出炉温度、出炉温度目标值、出炉温度负公差、出炉温度正公差、预加热段结束温度、预加热段加热时间、第一加热段加热时间、第二加热段加热时间、均热段加热时间、第一加热段段末温度、第二加热段段末温度、均热段段末温度、粗轧出口温度。20.进一步地,数据采集模块剔除生产过程数据中有缺失项的带钢记录,将每条生产过程数据按照生产时刻从先到后进行排序,再将生产过程数据进行最大最小归一化处理。21.进一步地,预测模块将每一块板坯对应的粗轧出口温度作一个时间序列,并截取当前板坯之前的连续n个板坯的粗轧出口温度作为新的输入变量,根据温度预测模型预测的精度,选择精度最高的模型所对应的n值,并将该n值所对应的温度预测模型作为选定模型。22.进一步地,排序筛选模块剔除经随机森林筛选的重要性评分低的生产过程数据,将剩余变量输入到选定模型用以预测粗轧出口温度,并记录短期选定模型的精度;排序筛选模块反复上述操作,直至选定模型的精度明显连续变低,则停止删除生产过程数据,此时对比所有选定模型的精度,选出具有最高精度的选定模型,最后将具有最高精度的选定模型对应的生产过程数据作为最终的生产过程数据组合。23.在上述技术方案中,本发明从带钢热连轧生产过程数据中采集可能对坯粗轧出口温度有影响的变量因子,利用随机森林算法从上述变量中筛选出重要的影响变量,剔除冗余变量,实现对模型输入数据的降维,并在此基础上建立热轧加热炉板坯在粗轧机架出口的温度预测模型。附图说明24.图1是本发明方法的流程图;25.图2是lstm网络神经元结构示意图;26.图3是lstm预测模型整体展开示意图;27.图4是本发明系统的架构图;28.图5是本发明一实施例中mtry与各随机森林模型决定系数的关系。具体实施方式29.下面结合附图和实施例进一步说明本发明的技术方案。30.本发明的目的是提供一种加热炉待出钢板坯在粗轧机架出口的温度预测方法及系统,使得加热炉操作人员可以提前预知待抽出板坯在粗轧机架出口的温度,从而及时指导加热炉操作,克服加热炉板坯温度缺少直接温度测量,调节不及时的缺陷,提高板坯温度的控制水平,实现更加精准的粗轧板坯温度控制,有利于解决热连轧生产过程粗轧板坯温度波动大导致热轧带钢产品质量与性能不稳定的技术问题。31.因此,参照图1,本发明首先公开一种加热炉待出钢板坯在粗轧机架出口的温度预测方法,其主要包括以下步骤:32.s1:采集热轧板坯生产过程数据。33.s2:对生产过程数据进行预处理。34.s3:构建基于长短期记忆神经网络(lstm)的粗轧出口温度预测模型。35.s4:添加历史时刻的粗轧出口温度作为新的输入变量,用于预测当前时刻热轧加热炉板坯的粗轧出口温度。36.s5:选择预测效果最好的温度预测模型作为lstm的选定模型。37.s6:使用随机森林算法对生产过程数据进行重要性排序。38.s7:逐步剔除经随机森林筛选的重要性评分低的生产过程数据,即剔除重要性排在最后面的n个变量,初始n=1。39.s8:将剩余生产过程数据重新输入到基于lstm的选定模型用以预测粗轧出口温度。40.s9:重复迭代步骤s8直至达到预定的迭代次数。41.s10:记录选定模型的精度。42.s11:增加n值,即n=n+1。43.s12:随着n值增加,判断选定模型的精度是否明显连续变低?若是则继续步骤s13,若否则返回步骤s7。44.s13:停止训练,对比各个选定模型的精度,筛选出使得选定模型精度最高的生产过程数据组合。45.如图1所示,本发明首先执行步骤s1,即采集热轧板坯生产过程数据,并对实际生产过程数据进行预处理。46.本发明为了预测热轧加热炉待出钢板坯在粗轧出口的温度,收集的相关数据包括:材料实际宽度、材料实际厚度、材料长度、材料实际重量、装炉板坯重量、加热炉号、炉内列号、在炉内时间、实际装炉温度、实际出炉温度、出炉温度目标值、出炉温度负公差、出炉温度正公差、预加热段结束温度、预加热段加热时间、第一加热段加热时间、第二加热段加热时间、均热段加热时间、第一加热段段末温度、第二加热段段末温度、均热段段末温度等21个自变量以及粗轧出口温度这个响应变量。如表1所示:47.[0048][0049]表1 实验数据组成情况[0050]备注:粗轧机架有4个,本发明以r4为例采集出口温度作为粗轧出口温度。[0051]接着,执行步骤s2,即对上述采集到的热连轧粗轧板坯生产过程数据进行必要的预处理:[0052](1)剔除数据记录中有缺失项数据的带钢记录;[0053](2)将每条热连轧板坯数据按照生产时刻从先到后进行排序;[0054](3)将数据进行最大最小归一化处理,使原始数据线性转换到[0,1]的范围,归一化公式如下:[0055][0056]是对xij最大最小归一化处理后的值,xij是第i条数据第j个变量的值,xj min是第j个变量的所有数据的最小值,xj max是第j个变量的所有数据的最大值。[0057]上述流程完成之后,执行步骤s3,即构建基于长短期记忆神经网络(lstm)的粗轧出口温度预测模型。[0058]本发明采用长短期记忆神经网络(lstm)来预测粗轧出口温度,lstm网络是的一种特殊的递归神经网络(rnn)。相比于bp、cnn等前馈神经网络每层神经元的信号只能向上一层传播,样本的处理在各个时刻独立,rnn具有自反馈机制,能够将先前输入产生的信号向下传递,可更好地处理时序性数据。lstm网络是在普通循环神经网络(rnn)的基础上,在隐藏层各神经单元中增加记忆单元,从而使时间序列上的记忆信息可控,每次在隐藏层各单元间传递时通过几个可控门(遗忘门、输入门、输出门),可以控制之前信息和当前信息的记忆和遗忘程度,从而使rnn网络具备了长期记忆功能,可以处理长期依赖问题。在热连轧生产过程中,前几块板坯的温度影响下一块板坯的温度,从全局角度分析样本之间存在着时间序列关系,利用lstm网络可以挖掘数据样本之间的时间序列特性,有利于热连轧板坯粗轧出口温度的预测。[0059]原始rnn的隐藏层只有一个状态,即h,它对于短期的输入非常敏感。lstm在rnn的基础上增加了一个元胞状态,即c,让它来保存长期的状态。lstm的关键就是怎样控制长期状态c。在这里,lstm的思路是使用三个控制开关。第一个开关就是遗忘门,负责控制继续保存长期状态c;第二个开关是输入门,负责控制把即时状态输入到长期状态c;第三个开关是输出门,负责控制是否把长期状态c作为当前的lstm的输出。lstm网络通过3个“门”将有用的信息长期保留传递下去,过滤掉无用信息,使得网络具备长期记忆与学习能力,能够有效处理长期依赖问题,挖掘数据样本之间的时间序列特性。[0060]lstm网络是的一种特殊的递归神经网络(rnn),lstm的核心之处就是它的神经元状态,ct和ct-1表示当前时刻神经元状态和上一时刻神经元状态,ft、it、ot分别表示遗忘门、输入门、输出门在t时刻的输出结果,为内部隐藏状态。同一时刻,一个lstm元组包含了三种输入,当前时刻输入xt,上一时刻的输出ht-1,以及上一时刻的神经元状态ct-1。σ表示sigmoid激活函数,tanh表示tanh激活函数,如图2中所示。[0061]sigmoid激活函数公式如下所示:[0062][0063]sigmoid激活函数能够把输入的连续实值“压缩”到0到1之间。[0064]tanh激活函数公式如下所示:[0065][0066]tanh激活函数能够把输入的连续实值“压缩”到-1到1之间。[0067]lstm网络神经元由三部分组成:遗忘门(forget gate)、输入门(input gate)、输出门(output gate)。[0068]遗忘门:遗忘门是以上一层的输出ht-1和本层要输入的序列数据xt作为输入,通过一个激活函数sigmoid,得到输出为ft。ft的输出取值在[0,1]区间,表示上一层细胞状态被遗忘的概率,1是“完全保留”,0是“完全舍弃”。遗忘门会决定丢弃它认为不重要的信息,让有用的信息得以保留。具体计算公式如下:[0069]ft=σ(wf·[ht-1,xt]+bf)ꢀꢀꢀꢀꢀꢀꢀꢀꢀ(4)[0070]输入门:输入门包含两个部分,第一部分使用sigmoid激活函数,输出为it,第二部分使用tanh激活函数,输出为it是在[0,1]区间取值,表示中的信息被保留的程度,表示该层被保留的新信息。[0071]it=σ(wi·[ht-1,xt]+bi)ꢀꢀꢀꢀꢀꢀ(5)[0072][0073]ft是遗忘门的输出,控制着上一层细胞状态ct-1被遗忘的程度,为输入门的两个输出乘法运算,表示有多少新信息被保留,基于此,可以把新信息更新这一层的神经元状态ct。[0074][0075]输出门:输出门用来控制该层的神经元状态有多少被过滤。首先使用sigmoid激活函数得到一个[0,1]区间取值的ot,接着将神经元状态ct通过tanh激活函数处理后与相乘ot,即是本层的输出ht。[0076]ot=wo·[ht-1,xt]+boꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(8)[0077]ht=ot*tanh(ct)ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ(9)[0078]公式(11)-(15)中的wf、wi、wc、wo分别表示遗忘门、输入门、细胞状态、输出门的权重矩阵,bf、bi、bc、bo分别表示遗忘门、输入门、细胞状态、输出门的偏置向量。[0079]本发明在上述的lstm网络神经元结构基础上,设置时间步长为20,构造20个用于记忆过去时刻网络状态的节点,神经网络层神经元数目设置为10,并且使用adam算法作为优化算法,adam(adaptive moment estimation)是一种可以替代传统随机梯度下降过程的一阶优化算法,它能基于训练数据迭代地更新神经网络权重。adam算法和传统的随机梯度下降不同。随机梯度下降保持单一的学习率更新所有的权重,学习率在训练过程中并不会改变,而adam通过计算梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。它的优点主要在于经过偏置校正后,每一次迭代学习率都有个确定范围,使得参数比较平稳。[0080]整体lstm预测模型展开图如图3所示,用测试集训练lstm网络,然后用测试集测试模型精度。本发明采用mae(平均绝对误差)和rmse(均方根误差)作为精度评价指标。[0081]mae:平均绝对误差,是绝对误差的平均值,平均绝对误差能更好地反映预测值误差的实际情况。[0082][0083]rmse:均方根误差,衡量观测值与真实值之间的偏差。[0084][0085]为了权衡考虑mae与rmse,定义模型的整体精度acc由mae和rmse加权得到,计算公式如下:[0086]acc=0.6*mae+0.4*rmseꢀꢀꢀꢀꢀꢀ(12)[0087]上述流程完成之后,执行步骤s4,即在上述影响因素的基础上,添加历史时刻的粗轧出口温度作为新的输入变量,用于预测当前时刻热轧加热炉板坯的粗轧出口温度。[0088]考虑到热连轧板坯生产数据的时序性,可将热轧板坯粗轧机架的出口温度当作一个时间序列,每一块板坯都有一个对应时刻的粗轧出口温度。如将当前板坯的粗轧出口温度作为t时刻的粗轧出口温度,那么当前板坯前一块的粗轧出口温度作为t-1时刻的粗轧出口温度,当前板坯前面第二块的粗轧出口温度作为t-2时刻的粗轧出口温度。[0089]因此,要预测当前t时刻板坯的粗轧出口温度,可以在原来21个影响因素的基础上,继续添加t-1、t-2、…、t-n时刻的粗轧出口温度作为n个新的输入变量,一起用来预测当前t时刻板坯的粗轧出口温度。[0090]n的初始值可取10,具体取值由后续的实验验证进行优化确定。[0091]值得注意的是,添加历史时刻的粗轧出口温度作为新的输入变量时,由于生产时间关系,可能不能及时拿到当前待预测板坯的前一块板坯的温度数据,甚至也拿不到当前待预测板坯的前两块板坯的温度数据。因此,需要根据实际情况建立三种不同的模型来预测粗轧出口温度,具体地:[0092](1)可直接拿到当前待预测板坯的前一块板坯的粗轧出口温度数据。[0093]这种情况下,将t-1、t-2、…、t-n时刻的粗轧出口温度作为n个新的输入变量,预测当前板坯的出口温度。[0094](2)不能拿到当前待预测板坯的前一块板坯的出口温度数据,但能拿到前面其他板坯的出口温度数据。[0095]这种情况下,将t-2、t-3、…、t-n时刻的粗轧出口温度作为n个新的输入变量,预测当前板坯的粗轧出口温度。[0096](3)不能拿到当前待预测板坯的前两块板坯的出口温度数据,但能拿到前面其他板坯的出口温度数据。[0097]这种情况下,将t-3、t-4、…、t-n时刻的粗轧出口温度作为n个新的输入变量,预测当前板坯的粗轧出口温度。[0098]上述流程完成之后,执行步骤s5,即根据温度预测模型预测的精度,选择预测效果最好的lstm温度预测模型作为选定模型。预测效果最好的lstm温度预测模型即精度最高的模型,记录其所对应的n值,并将该n值所对应的温度预测模型作为选定模型,该选定模型应用在后续步骤中作为后续步骤的lstm温度预测模型。[0099]上述流程完成之后,执行步骤s6,即使用随机森林(random forest,英文简写是rf)算法对上述相关过程变量进行重要性排序。[0100](1)生成自生数据集dn:针对原始数据集,使用bootstrap重抽样方法进行有放回地随机数据抽取,形成与原始数据集大小相同的自生数据集dn。[0101](2)由dn生成回归树树tn:设原始数据的自变量总个数为p,在每一颗树的每个节点处随机选取mtry个自变量(1≤mtry≤p)作为备选分枝变量,基于备选分枝变量选取最优分枝,采用cart(classification and regression tree)算法生成一棵没有剪枝的回归树;[0102]cart生成回归树算法如下:[0103]在训练数据集的输入空间中,递归地将每个区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树:[0104]①选择最优切分变量j和切分点s,求解:[0105][0106]r1(j,s)={x|x(j)≤s},r2(j,s)={x|x(j)>s}ꢀꢀꢀꢀ(14)[0107][0108]针对遍历变量j,递归选择切分点s,将样本分别划分到r1、r2两个子区域,即将变量j的值小于切分点s的样本划分到r1区域,大于切分点s的样本划分到r1区域,c1、c2分别为r1、r2区域的所有样本的输出变量y(即r4出口温度)的平均值。将使得式(13)取得最小值的切分点s作为变量j的最优切分点。[0109]②遍历变量j,选出使得式(13)取得最小值的变量以及其最优切分点s,将其作为最终的最优切分变量j和切分点s。[0110]③预测:根据前面的分裂规则(最优切分变量j和切分点s),判断样本x属于哪个叶子节点(子区域),将该叶子节点(子区域)中所有样本实测值的均值(也就是c)作为样本x的预测值。[0111](3)利用袋外数据评价热轧板坯生产过程中的过程变量(参数)重要性在利用bootstrap重抽样方法生成自生数据集时,原始数据集中每个数据未被抽中的概率为这里的k为原始数据集中数据的总量。当k足够大时收敛于这表明在每一轮的随机抽样中,原始数据集中接近36.8%的数据不会出现在自生数据集,称这些数据为袋外(out of bag,oob)数据,利用袋外数据来估计模型的性能称为oob估计。[0112]袋外数据的一个重要应用就是评价自变量的重要性,其主要思路是对oob样本中的某个自变量进行随机置换,计算该自变量置换前后oob样本预测误差的变化,若误差变化大,则该自变量重要性高。具体过程如下:[0113]①当随机森林建立完成,对于森林中的第n棵回归树tn,其对应的袋外数据记为oobn,则有当原始数据量n足够大时,k≈0.368*n。使用回归树tn对oobn进行预测,得到oobn的预测均方误差msen:[0114][0115]其中,yi为oobn中响应变量的第i个实测值,为oobn中响应变量的第i个预测值。[0116]于是,对于整个随机森林可得到ntree个袋外数据的预测均方误差,即:[0117][mse1…msen…msentree][0118]②针对自变量xj(1≤j≤p),在ntree个oob样本中,保持其他列数据不变,对各样本中的第j列数据进行随机置换,形成ntree个新的oob样本,计算各新oob样本的预测均方误差,得到:[0119][msej1…msejn…msejntree],则对所有自变量有如下预测均方误差矩阵:[0120][0121]③用上述矩阵的第j行向量减去[mse1…msen…msentree],平均后再除以原始数据集中自变量xj的标准误差,得到自变量xj的重要性评分(increase of mean squared error,incmse),即:[0122][0123][0124]其中,xi为自变量xj的第i个实测值,为自变量xj的均值,n为原始数据集中数据的总量。特别的,当公式(18)等于0时,重要性评分incmsej无需除以对应标准差std,且这种情况下对应自变量的重要性评分几乎总是为0。[0125]④输出所有变量的重要性评分,然后按照重要性评分从大到小的顺序对所有变量进行排序。[0126]由随机森林算法的过程可以看出其需要优化的参数主要有两个:[0127]1)随机森林中决策树的个数ntree。设置较大的ntree可以获得更加稳定可靠的结果,应该尽可能提高ntree,因此本发明将ntree设置为5000,即随机森林中包含5000棵决策树。[0128]2)每一颗树在每个节点随机选取作为备选分枝变量的个数mtry。设置ntree=5000,分别构建mtry取不同值(1≤mtry≤p,p为总输入变量个数)时的随机森林模型,基于相应的袋外数据计算各随机森林模型的决定系数(r-square,rsq),取决定系数最大的随机森林模型对应的mtry作为mtry最终取值,最终计算公式如下:[0129][0130][0131][0132]其中,yi为响应变量的第i个实测值,为响应变量的均值,为响应变量的第i个预测值,k应该是测试集样本总数目。[0133]上述流程完成之后,执行步骤s7,即逐步剔除经随机森林筛选的重要性评分排在后面的相关变量,将剩余变量输入到lstm模型预测粗轧出口温度,筛选出使得lstm模型精度最高的相关变量组合。[0134]例如重要性排序如:“炉内列号”<“出炉温度负公差”<“出炉温度负公差”<…<“均热段段末温度”。那么先剔除“炉内列号”这个重要性评分排在最后面的特征变量,将剩下的特征变量输入到lstm预测模型预测r4出口温度,并记录模型精度。接着剔除“炉内列号”、“出炉温度负公差”这两个重要性评分排在最后面的特征变量,将剩下的特征变量输入到lstm预测模型预测r4出口温度,并记录模型精度。再接着剔除最后重要性评分排在最后面的:3个特征变量、4个特征变量、…,上述流程完成之后,执行步骤s8,即将剩余特征变量输入到lstm预测模型预测r4出口温度,继续反复迭代一定次数,例如800次(步骤s9),完成迭代之后记录模型精度(步骤s10)。[0135]上述流程完成之后,执行步骤s11,即增加n的值,使得n=n+1。[0136]当由于剔除的变量过多导致模型精度明显下降时,执行步骤s12,即停止删除特征变量。最后,执行步骤s13,即对比前面记录的模型精度,选出精度最高的模型,并将此模型的输入变量组合作为最终的输入变量组合。[0137]上述步骤s1-s13的流程全部完成之后,将选定模型在线应用。[0138]利用正常工况下采集到的热轧加热炉生产过程数据以及粗轧温度历史数据,其中加热炉待出钢板坯的均热段段末温度、实际出炉温度和均热段在段时间,可以采用加热炉模型控制系统的预测计算值,也可以采用刚刚出钢板坯的均热段段末温度、实际出炉温度和均热段在段时间实绩值;然后,采用前面建立的lstm粗轧出口温度预测模型,在线预测加热炉待出钢板坯在粗轧机出口的温度。这个预测值可以用来评估加热炉待出钢板坯是否可以达到粗轧出口规定的目标温度,为加热炉精准控制提供超前指导。[0139]需要注意的是,根据实际生产情况,本发明的实施例列举了应用三种场景的温度预测模型:[0140](1)可直接拿到当前待预测板坯的前一块板坯的粗轧出口温度数据。[0141]这种情况下应用模型1:添加了t-1、t-2、…、t-n时刻的粗轧出口温度作为新的输入变量的粗轧出口温度预测模型。[0142](2)不能拿到当前待预测板坯的前一块板坯的出口温度数据,但能拿到前面其他板坯的出口温度数据。[0143]这种情况下应用模型2:添加了t-2、t-3、…、t-n时刻的粗轧出口温度作为新的输入变量的粗轧出口温度预测模型。[0144](3)不能拿到当前待预测板坯的前两块板坯的出口温度数据,但能拿到前面其他板坯的出口温度数据。[0145]这种情况下应用模型3:添加了t-3、t-4、…、t-n时刻的粗轧出口温度作为新的输入变量的粗轧出口温度预测模型。[0146]参照图4,除了上述方法,本发明还公开一种加热炉待出钢板坯在粗轧机架出口的温度预测系统,该系统主要包括数据采集模块、预测模块和排序筛选模块。[0147]如图4所示,数据采集模块执行本发明方法的步骤s1及s2,即采集热轧板坯生产过程数据,并对生产过程数据进行预处理。[0148]预测模块执行本发明方法的步骤s3-s5,即构建基于长短期记忆神经网络的粗轧出口温度预测模型,添加历史时刻的粗轧出口温度作为新的输入变量,用于预测当前时刻热轧加热炉板坯的粗轧出口温度,最终选择预测效果最好的温度预测模型作为选定模型;[0149]排序筛选模块执行本发明方法的s6-s13,即使用随机森林算法对生产过程数据进行重要性排序,并逐步剔除经随机森林筛选的重要性评分低的生产过程数据,将剩余生产过程数据重新输入到预测模块的选定模型用以预测粗轧出口温度,直至筛选出使得选定模型精度最高的生产过程数据组合。[0150]本发明系统中的数据采集模块、预测模块和排序筛选模块执行对应方法的流程,因此这里不再赘述。[0151]下面通过几个实施例来进一步说明本发明的技术方案。[0152]本发明搜集了国内某大型热连轧机组连续一年的热连轧带钢生产过程数据,删除其中的缺失数据,共有65533条数据。每一条热轧板坯数据除粗轧出口温度外还有21个过程变量。本发明在该数据集上进行具体的建模与预测实验。粗轧出口温度预测模型的整体流程如图1所示。[0153]实施例1[0154]1.将热轧板坯数据按照生产时刻排序,剔除缺失项数据。[0155]在采集数据的时候,容易漏掉少许采集点上变量的值,而这些漏采点的值在数据中的表现形式是用0代替的。由公式(1)可知,如果不将这些含0的数据剔除掉,那么这些0值数据将影响归一化的结果,进而影响到模型的收敛性以及模型最终精度。所以,要将变量值为0的数据剔除掉。此外,考虑到采集的每条板坯数据在时间上的连续性,将每条数据按照生产时刻的先后顺序排列,增强数据在时间上的相关性。[0156]2.搭建lstm预测模型,训练lstm网络权重。[0157]将热轧板坯所有变量组成的数据集按照训练集∶测试集=7∶3划分,利用lstm网络对训练集进行训练,设置学习率为0.0006,时间步长为20,神经网络层的神经元数目设为10,迭代系数设为800,学习上述公式(9)-(14)中的参数wf,bf,wi,bi,wc,bc,wo,bo的值,并使用adam优化器优化这些网络参数。[0158]先进行不添加历史时刻的粗轧出口温度的建模实验。结果表明:在不添加历史时刻的粗轧出口温度时,模型在测试集上的预测精度指标mae为9.87,rmse为12.67,acc为10.99。[0159]3.添加历史时刻的热轧板坯粗轧出口温度作为新的输入变量,来预测当前时刻热轧板坯的粗轧出口温度。[0160]预测当前t时刻的热轧板坯粗轧出口温度,添加t-1、t-2、…、t-n时刻热轧板坯粗轧出口温度。也就是预测某一块板坯的粗轧出口温度,添加这块板坯前面n块板坯的粗轧出口温度作为新的输入变量。模型在测试集上的预测精度随n的大小的变化如下3表所示:[0161][0162]表3 模型在测试集上的预测精度随n值的变化[0163]由表3可知:[0164]1)相对于不添加历史时刻的粗轧出口温度,添加历史时刻的粗轧出口温度作为新的输入变量,预测模型的mae下降率2左右(不添加历史粗轧出口温度时模型的mae为9.87),rmse下降了2.3左右(不添加历史粗轧出口温度时模型的rmse为12.67)。[0165]2)当n=3时模型精度最高。所以,将需要预测板坯的前三块板坯的粗轧出口温度作为新的输入变量,预测模型效果最好。[0166]4.基于实验数据集,使用随机森林计算各影响因素的重要性排序。[0167]设置ntree=5000,分别构建mtry取不同值(1≤mtry≤24)时的随机森林模型,mtry与各随机森林模型决定系数的关系如图2所示。由图2可知,当mtry取值为9的时候,决定系数达到最大,此时建立的随机森林模型对响应变量的解释性最强,所以本发明将mtry的取值定为9。[0168]图5示出了mtry与各随机森林模型决定系数的关系。如图5所示,设置ntree=5000、mtry=9,使用随机森林模型获得相关变量的重要性排序如表4所示。[0169][0170]表4 热轧板坯粗轧出口温度相关变量的重要性评分[0171]5.逐步剔除经随机森林筛选的重要性评分排在后面的相关变量,将剩余变量组成新的训练集和测试集,重新训练lstm预测模型和测试新的模型的精度,反复此过程,直至筛选出使得lstm模型精度最高的相关变量组合,并得到精度最高的lstm粗轧r4出口温度预测模型。具体过程如下:[0172]1)剔除重要性评分排在最后面的m个变量,最开始令m=1,将剩余的变量组成的数据划分为训练集和测试集,按照训练集∶测试集=7∶3划分。[0173]2)将训练集放入lstm网络训练,设置学习率为0.0006,时间步长为20,神经网络层的神经元数目设为10,迭代系数设为800,训练后用测试集测试模型精度,并保存模型精度,然后令m=m+1。模型精度acc由mae和rmse加权得到,计算公式如式(12)所示。[0174]3)重复步骤1)和2),若随着m的增加模型精度明显连续下降,则停止实验。[0175]4)比较所有模型的精度,筛选出精度最高的模型及其相关变量组合。[0176]剔除重要性评分排在最后面的m个变量,随着m的变大,实验结果如下表5所示:[0177][0178]表5 lstm预测模型测试集精度变化[0179]由上表可知:[0180]1)当剔除重要性评分排在最后面的9个变量时,lstm预测模型精度最高。即输入变量为:t-1时刻出口温度、t-2时刻出口温度、t-3时刻出口温度、均热段段末温度、材料实际厚度、实际出炉温度、均热段加热时间、第二加热段段末温度、材料长度、加热炉号、第一加热段加热时间、在炉内时间、第二加热段加热时间、实际装炉温度、预加热段加热时间共15个变量。[0181]此时的模型精度为:mae=7.45(表示粗轧r4出口温度的平均预测误差为7.45℃),rmse=9.98,acc=8.46。当剔除的变量超过9个以后,模型精度逐渐降低。[0182]2)相比于不剔除任何变量时的模型精度,剔除重要性评分排在最后面的9个变量后,mae下降了0.21,rmse下降了0.25,模型精度确实有所提高,这表明此模型能更好地解释粗轧出口温度和各变量之间的关系。[0183]实施例2:[0184]考虑到在添加历史时刻热轧板坯的粗轧出口温度作为新的输入变量时,理论上添加要预测板坯的前三块板坯的粗轧出口温度作为新的输入变量,但是由于时间关系,可能不能及时拿到当前待预测板坯的前一块板坯的出口温度数据,只能从当前待板坯前面的第二块板坯开始拿出口温度数据。这时,就要根据实际情况建立不同的模型预测预测热轧板坯的粗轧出口温度。[0185]这种情况下,由于不能拿到当前待板坯的前一块板坯的出口温度数据,所以只能将当前待板坯前面的第二、三、四块板坯的出口温度作为新的输入变量,预测当前板坯的出口温度。即输入变量为:t-2时刻出口温度、t-3时刻出口温度、t-4时刻出口温度、均热段段末温度、材料实际厚度、实际出炉温度、均热段加热时间、第二加热段段末温度、材料长度、加热炉号、第一加热段加热时间、在炉内时间、第二加热段加热时间、实际装炉温度、预加热段加热时间共15个变量。[0186]lstm预测模型网络结构与实施例1保持一致;超参数也保持一致:隐含层神经元数目为10,学习率为0.0006,时间步为20,训练迭代次数为800次。[0187]在这种情况下,由于隔了一块板坯将历史出口温度作为新的输入变量,对比情况(1),模型精度有所下降,rf-lstm模型在测试集上预测精度为:mae=8.10,rmse=10.80。[0188]实施例3:[0189]考虑到由于时间关系,可能不能及时拿到当前待预测板坯的前一块板坯的出口温度数据,甚至拿不到当前待预测板坯的前面两块板坯的出口温度数据,只能从当前待板坯前面的第三块板坯开始拿出口温度数据。这时,就要根据实际情况建立不同的模型预测预测热轧板坯的粗轧出口温度。[0190]这种情况下,由于不能拿到当前待板坯的前两块板坯的出口温度数据,所以只能将当前待板坯前面的第三、四、五块板坯的出口温度作为新的输入变量,预测当前板坯的出口温度。即输入变量为:t-2时刻出口温度、t-3时刻出口温度、t-4时刻出口温度、均热段段末温度、材料实际厚度、实际出炉温度、均热段加热时间、第二加热段段末温度、材料长度、加热炉号、第一加热段加热时间、在炉内时间、第二加热段加热时间、实际装炉温度、预加热段加热时间共15个变量。[0191]lstm预测模型网络结构与实施例1保持一致;超参数也保持一致:隐含层神经元数目为10,学习率为0.0006,时间步为20,训练迭代次数为800次。[0192]在这种情况下,由于隔了两块板坯将历史出口温度作为新的输入变量,对比情况(1)、(2),模型精度都有所下降,rf-lstm模型在测试集上预测精度为:mae=8.47,rmse=11.23。[0193]最后,为了说明本发明的有益效果。本发明还对比了mlp(多层感知机)网络预测模型和svr(支持向量回归)预测模型,对比结果如下表6。实验结果显示,lstm预测模型和rf-lstm预测模型(基于随机森林筛选相关变量后的lstm预测模型)的精度明显优于mlp和svr算法,这表明了在预测热轧板坯粗轧出口温度的问题上,本发明的基于随机森林筛选相关变量后的lstm预测模型具有明显的优势和针对性。[0194][0195]表6 不同算法检测精度对比[0196]技术先进性[0197]1.热连轧生产过程中,每块板坯都紧跟着上一块板坯在几乎相同的条件下进行同样的工序,计算机和传感器所采集到的热轧生产数据也是一块板坯接着一块板坯采集的,在时间上具有序列性。针对此特点,本发明选用lstm(长短期记忆神经网络)模型,预测加热炉出钢板坯在粗轧出口温度。因为由于独特的设计结构,lstm非常适合用于处理与时间序列高度相关的问题。[0198]并且由表6可知,在预测粗轧出口温度的问题上,lstm模型的精度明显优于mlp和svr模型。显然,lstm模型在处理热轧生产数据上更具有针对性。[0199]2.计算机和传感器采集的热轧生产数据具有近30个变量,过多的变量会不可避免地引入大量的噪声和冗余因子,影响模型的精度。所以应该删去一些无关变量,甚至是干扰变量,提取有用的变量,提高模型精度和解释力度。本发明利用随机森林算法对所有变量进行重要性评分,评价每个变量对预测粗轧出口温度的重要性,以此筛去部分相关性较低的变量,实现更加精准的粗轧出口温度预测。[0200]并且由表4和表5可知,利用随机森林筛去9个重要性评分较低的变量后,mae(平均绝对误差)下降了0.21,rmse下降了0.25(均方根误差),可见模型的预测精度明显有所提高,证明了本发明的先进性。[0201]本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
一种加热炉出钢板坯粗轧出口温度的预测方法及系统与流程
作者:admin
2022-07-30 07:10:26
806