打开文本图片集
摘 要:为研究各种配料与球团矿性能之间的关系,建立偏最小二乘回归分析模型得到线性方程式,运用偏最小二乘的非线性神经网络模型,利用神经网络进行拟合可以得到较好的球团矿各种配料与性能之间的关系效果。比较拟合值和实际值之间的相关系数,得出神经网络方法比偏最小二乘方法拟合精度高,因此各种配料和球团矿间具有一定非线性关系。
关键词:球团矿性能;偏最小二乘回归分析;非线性神经网络模型
1 偏最小二乘线性和非线性模型建立
1.1 偏最小二乘回归
偏最小二乘法是综合了主成分分析、典型相关分析、多元线性回归等特点,建立一种线性的回归模型,用来解决回归分析中自变量多重共线性的问题。
1.1.1.多重相关性
多重相关性现象[1]是指在自变量之间存在着线性相关的现象。球团矿配料之间存在一定的线性相关关系,由于钙含量与碱度R2正相关,镁含量与碱度R3正相关而且由于样本的数目比较少,多重相关性现象就很有可能存在。将每一个自变量对其余自变量做回归分析,并求相应的复测定系数 ,然后进行F检验[2]。
1.1.2 标准化处理
将6个自变量分别表示为 ,2个因变量分别表示为 。
对X与Y进行标准化处理,得到标准化后的自变量矩阵 和因变量矩阵 。
1.1.3 偏最小二乘回归的计算
求矩阵 最大特征值所对应的特征向量 ,求得成分得分 和残差矩阵 。求矩阵 最大特征值所对应的特征向量 ,求得成分得分向量 和残差矩阵 。
一直到第r步,求矩阵 最大特征根所对应的特征向量 ,求得成分得分 。
根据交叉有效性,确定共抽取r个成分 可以得到一个预测模型,则求 在 上的普通最小二乘回归方程。
1.1.4 误差分析
通过SPSS相關性检验可以得到熟球抗压拟合值和实际值的相关系数为0.831,同样可以得到粘结率的拟合值和实际值的相关系数为0.710。
1.2 非线性最小二乘分析
根据25组数据,20组作为样本进行训练,另外5组为测试样本检验训练精度。
1.2.1 BP神经网络构建
(1)隐层数设计。本文采取单隐层结构。
(2)输入节点数。选取PLS提取的2个成分能够提高准确性,输入节点数为2。
(3)输出变量。输出变量代表要实现的目标功能,输出变量个数设置为2个。
(4)隐含层节点数,通过公式 (m为隐含层节点,n为输入层节点,l为输出节点数,a是1-10的常数)计算隐含层的初始值是2,最大为12,可以分别得到训练误差曲线,通过比较,可以得出当m为10时收敛速度最快。
(5)神经网络训练参数。根据实际经验,网络性能目标一般在[0,1]之间,经过反复试验,选择神经网络训练参数。训练次数为1000,网络性能目标为0.01。在满足上述任意一个条件时,网络训练就会结束。
1.2.2 模型求解
通过构建神经网络,在MATLAB中得到BP神经网络训练结果,样本训练完之后得到神经网络数据网络可以用来预测不同配料下的球团矿的性能。
训练过程中,网络训练到第2代就到了最优训练效果,训练的的相关系数达到0.9848,接近1,综合判断正确率高,基于非线性最小二乘BP神经网络有较好的训练结果。
1.3 偏最小二乘回归分析和非线性最小二乘分析比较
通过计算得到神经网络方法计算的实际值与拟合值之间相关系数为0.9848,比偏最小二乘回归分析计算的拟合值与实际值之间的相关系数0.831大。因此,神经网络方法比偏最小二乘方法的拟合精度高。
参考文献
[1] 孔祥玉,曹泽豪,安秋生,徐中英,罗家宇.偏最小二乘线性模型及其非线性动态扩展模型综述[J/OL].控制与决策:1-12[2018-01-28].https://doi.org/10.13195/j.kzyjc.2017.1306.
[2] 杨波. 基于偏最小二乘的财务危机预警模型研究[D].中国财政科学研究院,2017. 7.