打开文本图片集
摘要:为降低建筑能耗影响因素间复杂相关性对模型性能的影响,建立了一种基于KPCA-WLSSVM的建筑能耗预测模型。利用核主元分析(KPCA)对输入变量进行数据压缩,消除变量之间的相关性,简化模型结构;进一步采用加权最小二乘支持向量机(WLSSVM)方法建立建筑能耗预测模型,同时结合一种新型混沌粒子群-模拟退火混合优化(CPSO-SA)算法对模型参数进行优化,以提高模型的预测性能及泛化能力。通过将KPCA-WLSSVM模型方法应用于某办公建筑能耗的预测中,并与WLSSVM、LSSVM及RBFNN模型相比,实验结果表明,KPCA-WLSSVM模型方法能有效提高建筑能耗预测精度。
关键词:建筑能耗;预测;核主元分析;支持向量机
中图分类号:TU831 文献标志码:A 文章编号:1674-4764(2015)05-0109-07
Abstract:The correlations among the building energy consumption factors can corrupt the prediction model’s performance, and get undesirable results. A prediction model based on KPCA-WLSSVM is proposed to forecast building energy consumption. The kernel principal component analysis (KPCA) method could not only solve the linear correlation of the input and compress data but also simplify the model structure. A novel hybrid chaos particle swarm optimization simulated annealing (CPSO-SA) algorithm is applied to optimize WLSSVM parameters to improve learning performance and generalization ability of the model. Furthermore, the KPCA-WLSSVM model is applied to the energy consumption prediction for an office building, and the results show that the KPCA-WLSSVM has better accuracy compared with WLSSVM model, LSSVM model and RBF neural network model. and the KPCA-WLSSVM is effective for building energy consumption prediction.
Key words:energy consumption of building; forecasting; kernel principal component analysis; support vector machines
随着建筑能耗在能源消耗中所占比重的快速增长,建筑节能受到越来越多的关注,准确有效地预测建筑能耗是开展节能评估工作的重要基础,也是进行建筑节能优化设计的主要依据。由于建筑能耗系统涉及到机理复杂的热湿传递过程,是一个典型的多变量、非线性、强耦合和多扰动的复杂系统,采用机理方法建立建筑能耗预测模型十分困难。人工神经网络由于对非线性函数具有很强的拟合和逼近能力,作为一种有效的非线性建模方法,目前已有许多学者将其成功应用于建筑能耗预测领域[1-4]。但由于神经网络训练基于经验风险最小化原则,易产生过学习导致泛化能力下降,另外还存在诸如网络结构难以确定和过分依赖大样本学习等缺陷,因而在建筑能耗预测领域还难以大范围推广。
支持向量机(Support Vector Machines, SVM)是Vapnik等[5-6]基于统计学习理论提出的一种新的有监督机器学习方法。支持向量机利用结构最小化原理来提高其泛化能力,较好地解决了小样本、非线性、高维数、局部极小等实际问题,目前已成为建筑能耗预测领域的研究热点[7-8]。最小二乘支持向量机(Least Squares Support Vector Machines, LS-SVM) 是标准SVM的扩展,LS-SVM模型在优化目标函数中选取了误差(松弛变量)二范数的形式,将SVM中需要求解的二次规划问题转化为线性方程组求解问题,从而降低了计算复杂度,有效提高了学习速度,较好地解决了大样本数据情况下SVM计算复杂的问题[9]。文献[10-12]基于LSSVM回归方法建立了建筑能耗预测模型,并获得了较好的预测结果。针对LSSVM算法鲁棒性能欠佳的问题,Suykens等[13]提出了加权最小二乘支持向量机算法(Weighted Least Squares Support Vector Machines, WLSSVM)。WLSSVM在建模过程中依据训练样本的重要性分别赋予其不同权重,从而克服了奇异点对LSSVM鲁棒性能的影响。文献[14]基于该算法建立了建筑能耗预测模型。尽管支持向量机回归方法能够有效处理高维数、非线性数据建模问题,但是建筑能耗受到气候条件、建筑特征参数、围护结构热工性能、室内热扰、新风负荷、室内环境参数、空调运行模式等众多因素的影响,且各影响因素之间严重相关,不可避免存在一定的噪声和冗余信息,在建模过程中会降低精度,增加计算复杂度[15-16]。因此,有必要对能耗建模样本数据进行数据压缩和特征提取,通过降维处理来去除样本数据集合中的冗余信息以及消除噪声,以提高模型的预测精度和泛化能力。核主元分析法(KPCA)作为一种数据压缩和特征提取的非线性技术,已在数据处理中的到了广泛应用[17-18]。KPCA采用核函数的方法,把过程数据或变量组成的原始数据空间映射到高维特征空间,在高维特征空间使用线性PCA方法来寻找主成分。特征空间中的主元变量则保留原始变量的特征信息而消去冗余信息,它是解决数据相关问题,提高模型运算速度的重要工具。
为了提高建筑能耗预测模型的精度和可靠性,笔者提出了一种基于KPCA和WLSSVM的建筑能耗预测方法。首先采用KPCA方法对输入变量进行特征提取,有效消除变量之间的相关性,降低输入变量的维数;将通过特征提取后的数据集作为输入变量建立WLSSVM建筑能耗模型;考虑到LSSVM的正则化参数和核宽参数对模型拟合精度和泛化能力都有较大影响,利用混沌粒子群-模拟退火混合优化(CPSO-SA)算法对LSSVM的参数进行优化选择,从而建立起具有较高预测精度和泛化能力的建筑能耗预测模型。基于DEST仿真平台的模拟数据,对南方地区某办公建筑的能耗进行预测,并与WLSSVM、LSSVM和RBF神经网络预测模型的性能进行比较,结果表明,KPCA-WLSSVM预测模型的性能优于另外3种预测模型。
1 KPCA-WLSSVM模型算法
1.1 核主元分析
2 基于KPCA-WLSSVM建筑能耗预测
2.1 建筑能耗影响因素分析
建筑能耗系统是一个复杂的非线性系统,影响建筑能耗的因素众多,主要分为4大类[12、15-16]:外部气候条件、围护结构、设备因素以及建筑运行管理模式。外部气候条件是影响建筑能耗的“自然”因素,包括温度、湿度、日照及风速等参数,它们能够直接影响热量通过围护结构的传递,进而对建筑能耗产生影响;围护结构可以看作是影响建筑能耗的“人为”因素,包括了反映建筑热工性能的围护结构传热系数、遮阳率等参数和反映建筑体形特征的体形系数、建筑面积、朝向、窗墙比等参数,这类因素可以通过改善建筑本身的热工性能及相关参数对建筑能耗起到积极作用;设备因素包括照度标准、灯具类型、设备功率等参数,这些参数取决于建筑的使用功能;建筑运行管理模式也是影响建筑能耗的重要因素之一,它包括了通风次数、人员密度、设备运行时间、新风指标等参数。
2.2 建模步骤
由于建筑能耗与众多能耗影响因素之间存在复杂的非线性关系,在建模过程中会增加计算复杂度,降低建模精度。因此,有必要通过降维处理去除样本数据集合中的冗余信息以及消除噪声,以提高模型的预测精度和泛化能力。笔者提出的KPCA-WLSSVM的建筑能耗预测模型首先利用KPCA提取能耗因子的非线性特征,消除数据冗余并降低模型输入维数,然后采用WLSSVM方法建立能耗预测模型。模型的结构如图1所示。
同时,为减少试验次数,并保证试验的全面性,采用正交试验方法获取数据样本集。DEST中影响因素的取值,采用事先设定好的水平值,每个因素选取4个水平值,选用L64(421)正交表进行试验计算,建筑物能耗的基准值采用动态负荷计算软件DEST-C的计算值。为获得较为理想的训练数据,选用4组正交试验,并且每组正交试验中每个因素选取不同的水平值,经过DEST-C动态计算,获得建筑物全年能耗结果。经DEST-C计算获256组实验数据,随机取其中的3/4作为训练样本,余下的1/4作为测试样本验证模型的预测性能。
2.3.3 模型训练
通过KPCA计算,取主元个数为8个,此时累计贡献率已经超过90%。碎石图如图3所示。另外,核参数和正则化参数是WLSSVM性能的重要影响因素,不同的参数组合将得到不同的学习性能和泛化性能。为避免主观经验选取的盲目性,采用CPSO-SA算法对模型的两个参数进行寻优,优化后的参数分别为C=326.7、σ=0.86,满足预测模型对精度的要求,建筑能耗模型训练结果如图4所示,拟合值和期望值基本吻合。
2.3.4 结果与分析
为比较分析组合模型的预测效果,同时建立了LSSVM、WLSSVM和RBFNN神经网络模型对建筑能耗进行预测。通过MATLAB平台实现上述4种预测模型对建筑能耗进行预测,预测值和实际值的对比如图5所示。从图中可以知道,4种模型的预测结果大都能够反映能耗的变化,但有个别样本点偏差较大,组合模型的预测值和期望值基本重合,相比于单一的LSSVM、WLSSVM和RBFNN神经网络模型,组合预测模型的预测效果较好。
为了从整体上评价4种预测模型的预测精度和稳定性,按式(21)、(22)及(23)对上述4种模型进行评价,计算结果如表1所示。
从表1的计算结果可以看出,采用RBF神经网络和LSSVM方法预测虽然具有很高的训练精度,但是当其用于预测时,误差较大,泛化性能差,预测效果不理想;采用WLSSVM进行预测,由于该方法对每个样本进行了加权处理,有效消除了显著误差的影响,具有较好的预测精度,其平均预测误差和均方根误差比LSSVM有所降低,但预测效果仍有待提高;KPCA-WLSSVM方法首先采用KPCA对能耗样本数据进行数据压缩和特征提取,去除样本数据中的冗余信息以及消除噪声,使得WLSSVM模型的预测效果得到了很大的改善,最大相对误差绝对值从7.81%降到2.81%,相对误差绝对值平均值从1.13%降低到0.89%,这表明组合模型具有更高的预测精度和预测稳定性,泛化能力得到显著提高。通过对比分析模型的性能指标,结果表明KPCA-WLSSVM模型具有更好的预测效果,是一种有效、可行的建筑能耗预测方法。
3 结 论
通过4个模型的预测结果及性能评价指标的比较可以看出,基于KPCA-WLSSVM能耗预测模型的预测效果要优于其他3种模型,表明了KPCA- WLSSVM模型在建筑能耗预测中的有效性和优越性。主要结论为:
1)核主元分析能够消除建筑能耗影响因素间的冗余性和共线性,正确提取输入样本的特征信息,简化模型的输入样本。
2)WLSSVM充分考虑了各样本对建模的影响,有效地赋予各样本合适的权值,优化了LSSVM模型,使得模型具有良好的非线性处理能力。
3)采用CPSO-SA优化算法对模型的参数进行优化选择,避免了经验选择的缺陷,在此基础上建立的建筑能耗预测模型具有更好的学习精度和推广应用能力。
参考文献:
[1] Wong S L, Wan K K W, Lam T N T. Artificial neural networks for energy analysis of office buildings with daylighting [J]. Applied Energy, 2010, 87(2): 551-557.
[2] Azadeh A, Ghaderi S F, Tarverdian S, et al. Integration of artificial neural networks and genetic algorithm to predict electrical energy consumption [J]. Applied Mathematics and Computation, 2007, 186(2): 1731-1741.
[3] 喻伟, 李百战, 杨明宇, 等. 基于人工神经网络的建筑多目标预测模型[J]. 中南大学学报:自然科学版, 2012, 43(12): 4950-4955.
Yu W, Li B Z, Yang M Y, et al. Building multi-objective predicting model based on artificial network [J]. Journal of Central South University: Science and Technology, 2012, 43(12): 4950-4955. (in Chinese)
[4] Mathieu J L, Price P N, Kiliccote S, et al. Quantifying changes in building electricity use, with application to demand response[J]. IEEE Transactions on Smart Grid, 2011, 2(3): 507-518.
[5] Vapnik V. The nature of statistical learning theory [M]. Springer, 2000.
[6] Cortes C, Vapnik V. Support vector networks [J]. Machine Learning, 1995, 20(3): 273-297.
[7] Dong B, Cao C, Lee S E. Applying support vector machines to predict building energy consumption in tropical region [J]. Energy and Buildings, 2005, 37(5): 545-553.
[8] Li Q, Meng Q L, Cai J J, et al. Applying support vector machine to predict hourly cooling load in the building [J]. Applied Energy, 2009, 86(10): 2249-2256.
[9] Suykens J A K, Van G T, De B J, et al. Least squares support vector machines [M]. Singapore: World Scientific, 2002.
[10] Li X M, Shao M, Ding L X, et al. Particle swarm optimization-based LS-SVM for building cooling load prediction [J]. Journal of Computers, 2010, 5(4): 614-621.
[11] Jung H C, Kim J S, Heo H. Prediction of building energy consumption using an improved real coded genetic algorithm based least squares support vector machine approach [J]. Energy and Buildings, 2015, 90: 76-84.
[12] Zhao H X, Magoules F. Parallel support vector machines applied to the prediction of multiple building energy consumption [J]. Energy, 2009, 4(2): 231-249.
[13] Suykens J A K, de Brabanter J, Lukas L, et al. Weighted least squares support vector machines: robustness and sparse approximation [J]. Neurocomputing, 2002, 48: 85-105.
[14] Guo Y, Nazarian E, Ko J, et al. Hourly cooling load forecasting using time-indexed arx models with two-stage weighted least squares regression [J]. Energy Conversion and Management, 2014, 80:46-53.
[15] Li Q, Meng Q L, Cai J J, et al. Predicting hourly cooling load in the building: a comparison of support vector machine and different artificial neural networks [J]. Energy Conversion and Management, 2009, 50(1): 90-96.
[16] Crawley D B, Hand J W, Kummert M, et al. Contrasting the capabilities of building energy performance simulation programs [J]. Building and Environment, 2008, 43(4): 661-673.
[17] Fan Z Z, Wang J H, Xu B G, et al. An efficient KPCA algorithm based on feature correlation evaluation [J]. Neural Computing and Applications, 2014, 24(7/8):1795-1806.
[18] Jia P F, Tian F C, He Q H, et al. Feature extraction of wound infection data for electronic nose based on a novel weighted KPCA [J]. Sensors and Actuators, B: Chemical, 2014, 201:555-566.
[19] Suykens J A K. Least squares support vector machines [J]. Neural Processing Letters, 1999, 9(3):293-300.
[20] 樊晓雪. 最小二乘支持向量机的参数选择[D]. 河北 保定: 河北大学, 2012.
Fan X X. Least squares support vector machine parameter selection [D]. Baoding: Hebei University, 2012. (in Chinese)
[21] 康一亭, 于丹, 苏华, 等. 办公建筑能耗基准中影响因子对建筑能耗的影响度[J]. 中南大学学报: 自然科学版, 2012, 43(Sup1): 146-150.
Kang Y T, Yu D, Su H, et al. Impact factors of energy consumption benchmarking in office buildings [J]. Journal of Central South University: Science and Technology, 2012, 43(Sup1): 146-150. (in Chinese)
(编辑 胡英奎)