崔翔鹏,黄洪琼
(上海海事大学 信息工程学院,上海 201306)
:为了提高船舶交通流预测的效率和准确率,分析了船舶流量预测中的影响因素多、非线性、随机性等问题,建立了ELM(极限学习机)预测模型。同时为了避免极限学习机算法受输入权值矩阵和隐含层偏差随机性的影响,算法又采用GA(遗传算法)对极限学习机的输入权值矩阵和隐含层偏差进行优化,建立GAELM船舶交通流预测模型。利用上海洋山港船舶流量对该模型进行了实例分析,通过MATLAB仿真进行预测,将GAELM模型与单纯的BP模型、ELM模型进行对比和分析,结果表明:GA-ELM模型具有更高的预测精度和效率,从而能够相对准确、高效地对船舶交通流量进行预测。
:船舶交通流量;遗传算法;极限学习机;预测
:TP391.9文献标识码:ADOI:
10.19358/j.issn.1674-7720.2017.09.005引用格式:崔翔鹏,黄洪琼.基于GA优化ELM的船舶交通流预测模型[J].微型机与应用,2017,36(9):15-17,21.
0引言
近年来,随着社会经济和对外贸易的迅速发展,各种水域的船舶流量不断增加,导致了航行水域的船舶交通事故频发,不仅带来了巨大的经济损失更是造成了人员伤亡。因此,提升航行水域船舶流量预测的准确性和高效性尤为重要。同时,预测的准确性和高效性又为航道的规划设计和船舶通航管理提供了有力的依据。目前国内外研究船舶流量预测的方法有支持向量机预测[1]、回归分析[2]、灰色分析[3]等方法,然而这些预测方法都很难满足预测的高效性和准确性。
针对现有预测方法存在的泛化能力不强、训练速度慢、预测准确率不高等不足之处,本文采用了一种新的船舶交通流量预测模型,即GA-ELM预测模型,首次将遗传算法(GA)对极限学习机(ELM)进行优化的方法用于船舶交通流量预测。遗传算法具有良好的随机搜索能力,它是根据生物界的进化规律演化而来;而极限学习机(ELM)算法具有获得唯一最优解以及学习速度快、泛化性能好等优点。将两者结合,利用GA优化ELM的输入层与隐含层间的连接权值及隐含层神经元的阈值,实现了预测船舶交通流量的目的。
1极限学习机(ELM)
南洋理工大学副教授黄广斌于2004年提出极限学习机(Extreme Learning Machine,ELM)算法,ELM是一种改进的前馈神经网络(SLFN)学习算法,相比于传统
的SLFN,ELM具有训练速度快、获得全局唯一的最优解且具有良好的泛化能力[4]。另外,在样本数据不足的情况下,ELM的预测结果也较好,其结构如图1所示,由输入层、隐含层和输出层三部分组成。
通常设wij(i=1,…,l,j=1,…,n)为输入层和隐含层之间的连接权值;bk(k=1,…,l)为隐含层神经元的阈值;βjk(j=1,…,l,k=1,…,m)为隐含层和输出层之间的连接权值;wij表示输入层第i个神经元和隐含层第j个神经元的连接权值;βjk表示隐含层第j个神经元与输出层第k个神经元的连接权值。设训练集输入矩阵X和输出矩阵Y分别为
X=[x1,x2,…,xn]T,Y=[y1,y2,…,ym]T(1)
设隐含层神经元的激励函数为Sigmoid,其表达式为:
式中,j=1,2,…,n;
wi=[wi1wi2…wim]。则式(4)可以表示为Hβ=T′,式中,T′为T的转置矩阵。神经网络隐含层的矩阵H为:
当隐含层的神经元数目等于训练集样本数目时,设定w和b,单隐层前馈神经网络(Singlehidden Layer Feedforward Neural Network,SLFNN)能够没有误差接近训练样本[5],即:
式中,j=1,2,…,m。然而当训练集X的样本数较多时,通常取隐含层神经元的个数K<n,SLFN的训练误差可以任意逼近[5]ε>0,即:
当选定激励函数g(x)可以无限可微时,取w和b,β值可以通过式(8)求得最小二乘解,即:
minβHβ-T′(8)
解得:
β=H+T′(9)
其中,H+为隐含层输出矩阵H的MoorePenrose逆。
2GA-ELM预测模型的建立
遗传优化算法是根据生物界的进化规律演化而来的随机化搜索方法,在内在的隐并行性、实用性和全局寻优能力等方面具有较大优势。
由于ELM模型隐含层输入权值和偏差是随机给定的,可能存在某些随机设定值为0时,导致部分隐含层节点失效。因此本文采用遗传算法对输入权值和偏差进行优化,其通过遗传算法的选择、交叉、变异操作得到最优的初始权值和阈值,进而得到最优的ELM模型。图2为GA-ELM模型的流程图,训练步骤如下:
(1)设定适应度函数、种群个数k及进化次数p,本文选取测试集样本数据均方差作为适应度函数。适应度函数值越小,模型越精确。
(2)规定种群。种群个数k一般设定为20~40个。个体的长度是由隐含层输入权值矩阵和偏差向量构成,即D=L(n+1),其中L为隐含层节点数量,n为输入层神经元数量,即输入向量的维度。
Qγ=[aγ11,aγ12,…,aγ1L,aγ21,aγ22,…,aγ2L,…aγL1,aγL2,…,aγLL,bγ1,bγ2,…,bγL],其中Qγ表示种群中第γ个个体,1≤γ≤k,aij、bj在区间[-1,1]随机取值。
(3)局部求解最优适应度函数αbest。αbest初始值为
10,θ及γ的初始值为0,把训练数据归一化后带入模型,依次求出每个个体的适应度函数,直到γ=k时循环终止,解得αbest的值[6]。
(4)全局求解最优适应度函数αbest。每次解得最优适应度函数后,采用交叉、变异将种群进行优化,检验进化代数θ,当θ小于等于p时,将γ值初始为0,退回到步骤(3),直到θ大于p停止运算,即得出的αbest为最优适应度函数,根据所对应的参数便可得到优化的ELM模型。
3实验仿真及分析
3.1实验数据及设置
以上海洋山深水港经过的船舶为研究对象,根据上海洋山港统计的数据,选取2016年4月10日至2016年7月16日的船舶流量数据作为预测数据。前60天数据作为预测数据,后37天数据作为测试数据。选取自然因素、船舶平均吨位、物流成本、业务指数、上海经济指数5个因素来建立预测模型。为降低预测误差,对样本数据按式(10)归一化处理[7]。
仿真实验时,利用MATLAB中的Sheffield工具箱实现GA,构建最佳的GAELM船舶流量预测模型。设定GA的参数如下:种群大小为20,最大遗传代数为100,交叉概率0.75,变异概率0.02,代沟0.95。
3.2实验仿真效果及分析
为了对实验的效果进行比较,本文分别记录BP、ELM和GAELM 3种算法的MAE、MAPE、RMSE和仿真时间。令pt为实际测量值,预测值为t,n为观测序列总数,预测指标如下[8]:
将这3种模型进行性能比较,其结果如表1所示。此外,对BP神经网络、ELM模型和GAELM模型分别进行了仿真实验和对比,仿真结果如图3~图5所示。
从表1及图3~图5可见,BP神经网络和ELM模型都得到了相应的预测效果,但在预测的准确性上不及GA_ELM模型。由于BP神经网络对样本数存在较高的要求,会存在过拟合现象以及ELM中随机赋值问题,导致这两种算法预测的准确性受到了影响。GA具有更好的全局寻优能力,采用GA优化ELM模型的随机赋值问题,使其得到最优解,得到的预测误差变小。
由表1可见,GA-ELM预测模型的平均绝对误差、平均绝对百分误差、均方根误差和仿真时间都明显小于BP模型和ELM模型。因此,GA-ELM模型比BP模型以及ELM模型在预测的准确性和高效性等方面具有更好的优势。
4结论
本文首次将遗传算法优化的极限学习机模型应用于船舶流量预测中,根据GA算法原理,对ELM预测模型的参数的选择进行优化,避免随机性对模型预测的准确性的影响,提高了预测精度。
利用GA-ELM对船舶交通流量进行预测,将预测效果与BP模型和ELM模型进行对比分析。结果表明,GA-ELM具有更好的泛化能力和良好的稳定性,预测结果与实际船舶交通流量相吻合,可以准确、高效地预测船舶交通流量,为船舶交通流量的预测提供了一种新方法。
参考文献
[1] 冯宏祥,肖英杰,孔凡邨.基于支持向量机的船舶交通流量预测模型[J].中国航海,2011,34(4):62-66.
[2] 王东, 熊锡龙. 基于影响因素分析的船舶交通流量预测多元线性回归模型[J]. 船海工程, 2010, 39(3):178-180.
[3] 李俊, 徐志京, 唐贝贝. 基于GA优化的灰色神经网络船舶交通流量预测方法研究[J]. 船海工程, 2013, 42(5):135-137.
[4] HUANG G B, ZHU Q Y,SIEW C K. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006, 70(13):489-501.
[5] HUANG G B, ZHU Q Y,SIEW C K. Extreme learning machine: a new learning scheme of feedforward neural networks[J]. Proceedings of International Joint Conference on Neural Networks, 2004, 2(2):985-990.
[6] 王新民, 李天正, 张钦礼. 基于 GA-ELM 浆体管道输送临界流速预测模型研究[J]. 中国安全生产科学技术, 2015(8):101-105.
[7] 钮浩东, 黄洪琼. 基于FOA优化GRNN的船舶交通流预测模型[J]. 微型机与应用, 2016, 35(12):81-83.
[8] 郎茂祥. 预测理论与方法[M]. 北京:清华大学出版社, 2011.