作者简介:李晓伟(1985—),男,西安建筑科技大学讲师、东南大学交通学院博士后研究人员.研究方向:多模式交通协同规划.E-mail:185381729@qq.com
中文责编:方 圆; 英文责编:子 兰
1)东南大学交通学院,江苏南京210096; 2)西安建筑科技大学土木工程学院,陕西西安 710055 3)现代城市交通技术协同创新研究中心,江苏南京 210096; 4)西部建筑科技国家重点实验室,陕西西安 710055
Li Xiaowei1,2,3,4,Wang Wei1,3,Yang Min1,3, Wang Hao1,3, and Xu Chengcheng1,31)School of Transportation, Southeast University, Nanjing 210096, Jiangsu Province, P.R.China2)School of Civil Engineering, Xi'an University of Architecture & Technology, Xi'an 710055, Shaanxi Province, P.R.China3)China Collaborative Innovation Center of China's Modern Traffic Technology, Nanjing 210096, Jiangsu Province, P.R.China4)State Key Laboratory of Architecture Science and Technology in West China, Xi'an 710055, Shaanxi Province, P.R.China
transportationsystems engineering; civil aviation; high-speed rail; radial basis function(RBF)neural network; logistic regression analysis; transportation system planning
DOI: 10.3724/SP.J.1249.2016.06653
分析旅客个体出行需求和交通供给对影响民航运输与高铁竞争的因素,选取6个维度17个影响因子,利用径向基(radial basis function, RBF)神经网络和Logistic 回归方法分析影响飞机和高铁竞争的主要驱动力.结果表明,RBF神经网络分析得到影响飞机与高铁竞争的驱动因子从大到小依次是运行时间、出行距离、票价、准时性和到站时间; Logistic回归分析得到影响飞机高铁竞争的显著性因素依次是运行时间、出行距离、票价、到站时间和准时性; 飞机与高铁竞争受运输方式自身属性(如运行时间、票价和准时性)影响最大,其次是接驳属性(如到站时间),而个体属性和购票属性特征的影响相对较小.
The competitive factors that affect civil aviation transportation and high speed railway are analyzed from two aspects of individual travel demand and traffic supply. Seventeen factors of six dimensions are selected, and radial basis function(RBF)neural network and logistic regression are used to analyze the main competitive factors of the aircraft and the high speed railway. The results show that competitive factors in decending order of influence in turn are the running time, travel distance, fare, reliability, punctuality and arrival time according to the conclusion of RBF. However, the competitive factors from large to small in turn are the running time, travel distance, fare, reliability, arrival time, and punctuality according to the logistic regression analysis. Overall, the greatest factor affecting the competition between civil aviation and high-speed rail is the transport mode property, such as running time, price and punctuality, followed by connection property, such as arrival time. The influence of individual attributes and ticket attributes is relatively little.
高铁站和飞机场等综合交通枢纽是国家现代化的重要标志,并已成为国家综合运输网络的主要节点.目前,中国已成为世界上快速交通网络发展最为迅速的国家.随着中国高速铁路网络的不断完善,普通铁路旅客运输供小于求的现象逐渐好转,但航空运输业受此影响较大.在高速铁路网络较完善的中国东部沿海区域,由于中国民航空域限制等原因,已经投入运营的高铁以其时间和成本优势吸引了相当一部分民航客流,出现了某些航空公司因客流大量流失而减少航班甚至停运的现象.面对高铁强有力的竞争,分析影响民航运输和高铁运输竞争的主要因素,是制定交通运输政策、合理配置运输能力的重要依据.
对于高铁运输和民航运输的相互影响,已有学者做了大量研究.Janic[1]从中长期运营的角度分别阐述了民航运输和高铁运输的效益与成本之间的关系,指出旅行时间是影响高铁运输和民航运输竞争的关键因素; Martín等[2]通过分析马德里—巴塞罗那综合运输通道旅客的出行数据,研究了到(离)站时间对高铁和航空运输竞争的影响,研究结果表明,除价格因素外接驳服务也是影响高铁飞机竞争的重要因素; Dobruszkes[3]从供给的视角研究欧洲5个城市对间航空运输与高铁运输的竞争,结果表明,与航空服务相比,高铁运输中服务策略的改善是有限的,而航空公司可通过增加航班次数和降低席位数量来提高竞争优势; 张旭等[4]以武汉—广州运输通道沿线高铁与航空运输的实地调查数据为基础,建立了描述武广沿线高铁与航空运输竞争模型,研究了不同机票折扣下两种运输的竞争程度.何韬[5]利用武广高铁和长广高铁的旅客出行数据,分析了高速铁路与民航的技术经济特性,研究了影响城际间各种客运出行方式选择的主要因素.芮海田等[6]将旅客的个人特征和出行特征作为影响因素,建立了旅客中长距离出行时高铁与民航运输方式选择行为度量模型,并结合弹性理论分析了各影响因素的敏感度.
上述研究中,Logistic回归作为一种成熟的统计方法现已较多用于高铁与民航运输的竞争研究中.然而,旅客出行方式选择的影响因素诸多,包括旅客的性格、习惯与收入,旅客的出行距离和购票方式,运输主体的票价、安全性和舒适性以及配套的接驳服务等,这些因素之间存在的复杂交互作用,对旅客出行选择的决策结果有着不确定性影响.为此,本研究针对现有研究的不确定性,在科学合理设计离散选择行为实验的基础上,引入具有较强容错能力、自适应能力和自组织能力的径向基(radial basis function, RBF)神经网络方法,对影响民航运输与高铁竞争的主要因素进行定量分析,通过与Logistic 回归方法进行对比,寻找影响民航与高铁运输竞争的主要驱动力,以期揭示两种运输方式竞争的因素,为区域综合运输体系规划和运输方式结构宏观调控提供决策支持.
旅客出行决策过程的本质是一个反复分析、比较和权衡,直至做出抉择的复杂过程.旅客出行决策受多种因素的制约,按照时间先后顺序本研究将此过程分为4个阶段:第1阶段是旅客购票阶段; 第2阶段是旅客从出发地到所在城市的对外交通枢纽,包括到站和中转换乘阶段; 第3阶段是旅客在所在出发地城市对外交通枢纽选择运输方式到达目的地城市对外交通枢纽,即城市间出行阶段; 第4阶段是旅客从目的地城市对外交通枢纽到达目的地,即离站阶段.
旅客在第3阶段的运输方式选择行为是本研究的重点.旅客在第3阶段的出行距离长,旅行费用高,且不同交通运输工具的供给特征不同,表现在票价、运行时间、舒适性和准时性等方面的差异,对旅客有着不同的吸引力; 同时,旅客也需从自身条件考虑,包括个人的经济能力和出行目的等,再综合判断以哪种交通运输方式完成出行.另外,旅客的购票方式、行程中的接驳时间和费用以及中转换乘耗时等因素也有可能对旅客出行的选择产生影响.
本研究将离散选择行为实验用于高铁与民航运输的竞争因素研究,在分析已有高铁和民航运输竞争因素的基础上[7-14],通过研究旅客出行决策过程,从购票、到站、中转换乘、出行和离站全过程的视角出发,确定旅客出行选择的多维影响因素,包括购票维度、接驳属性维度、中转换乘维度、出行方式维度,以及旅客个体特征和出行需求特征.各维度既包括传统的属性特征,又引入新的购票方式、到离站方式的费用和时间、运输方式准时性等变量,能够较全面地体现旅客实际出行的决策过程.在此基础上,设计涵盖旅客上述活动特征的调查问卷,并确定各变量类型和属性的取值方法,如表1.
采用旅客行为调查(revealed preference,RP)法,在京沪高铁沿线的车站和机场对旅客就乘车选择行为进行问卷调查,共计发放问卷1 200份,回收有效问卷数n=893份.调查数据显示,调查样本中男、女所占比例分别为55%和45%,出行旅客以20~59岁的中青年为主,中等收入人群占大部分,商务和旅游目的的旅客比重较大,数据分布较均衡,能够满足统计分析的需要.各维度变量因子类别与基本统计特征如表2.
RBF神经网络是一种典型的包含输入层、隐含层和输出层的3层神经网络模型,其模型如图1.
其中, R、 S和N分别为输入层、隐含层和输出层的神经元数; X=[x1, x2, …, xR]T为输入样本; Y=[y1, y2, …, yN]T为网络输出; Wjk为第j个隐含层神经元到第k个输出层神经元的连接权值.和BP(back propagation)神经网络不同的是,RBF神经网络的隐含层激励函数采用径向基函数,它对于输入空间的某一局部区域只存在少数的神经元用于决定网络的输出,即对于每一对输入/输出数据,只需调整网络的部分参数,就可加快网络的学习速度,使其在学习速度方面优于BP神经网络.径向基函数通常选用高斯函数,则第j个隐含层神经元的输出αj(x)的表达式为αj(x)=exp((-=X-cj=2)/(2σ2j)), j=1,2,…,S(1)
其中, cj为第j个隐含层神经元高斯函数的中心向量; σj为基宽度[17],是第j个隐含层神经元的变量.
RBF网络并不存在输入层到隐含层的连接权矩阵,隐含层神经元以样本 X到该隐含层神经元的径向基函数的中心向量 cj的欧氏距离=X-cj=作为“净输入”.所以,RBF网络隐含层的训练不是对连接权矩阵的调节,而是对每个隐含层神经元的径向基函数的中心向量cj和基宽度σj进行调节,一旦cj和σj确定,从输入层到隐含层的非线性映射关系也就确定了.RBF神经网络的输出层采用线性权加和实现从隐含层到输出层的线性映射.第j个隐含层神经元到第k个输出层神经元的线性映射关系为
yk=∑Sj=1Wjkαj(x), k=1,2,…,N(2)
网络输出中隐含层到输出层的连接权值Wjk满足线性关系,网络连接权值由线性方程解出,大大提高了网络学习速度,规避了BP神经网络易陷入局部极小值的问题,具有较强的模式分类能力.RBF神经网络的学习分为2部分:① 通过无导师学习确定隐含层神经元数目S、 隐含层神经元的中心向量 cj和基宽度σj; ② 通过有导师学习确定隐含层到输出层的连接权Wjk. 第①部分的学习常采用最近邻聚类算法进行聚类,将各类的中心和方差分别作为各隐含层神经元径向基函数的中心和方差,并以聚类后的类别数目作为隐含层神经元数,规避了因隐含层神经元之间相关性太强而使输出矩阵奇异的问题.当隐含层的结构以及中心和宽度确定后,从输入层到隐含层的非线性映射关系也就确定了,此时对于隐含层到输出层的连接权值Wjk,则以输出偏差平方和最小为目标优化,采用有导师学习的最小均方误差算法来学习.
Logistic回归模型为概率型非线性回归模型[18],是研究分类观察结果(因变量)与影响因素(自变量)关系的一种多变量分析方法.该方法首先将结果(因变量)出现的概率Pi与不出现的概率1-Pi相比,所得比值称为优势或发生比(odds),则odds=(Pi)/(1-Pi). 然后,进行相关变换和计算,可获得结果出现的概率为
Pi=(exp(β0+β1Z1+β2Z2+…+βmZm))/(1+exp(β0+β1Z1+β2Z2+…+βmZm))(3)
在本研究中,因变量Yi为出行方式变量,自变量Zm为竞争因素变量,可以是连续变量、有序分类(等级)变量和无序分类变量, βm为待估系数. Logistic回归模型的参数可以采用最大似然法计算.Logistic回归现已被广泛用于交通行为研究中,该方法基于数据的抽样,通过逐步回归对运输方式选择的可能概率进行诊断,筛选出影响运输方式选择较为显著的因素,并确定它们间定量关系和作用的相对大小.
本研究在统计产品与服务解决方案(statistical product and service solutions, SPSS)软件中进行RBF神经网络训练,通过RBF神经网络分析个体属性特征、出行需求特征、购票属性、接驳属性、中转换乘属性和方式属性6个维度的因素对民航运输与高铁运输竞争的影响.表3给出了RBF神经网络分析得到的各影响因素对运输方式竞争的影响力及排序.
由表3可见,影响选择民航或高铁的最大因素是运输方式的运行时间,在所有17个驱动因素中,其影响力贡献率达到了18.80%; 其他驱动因子从大到小依次是出行距离、票价、准时性、到站时间、离站时间、到站费用、购票方式、月收入、换乘时间、年龄、舒适性、离站费用、职业、是否拥有私家车、性别和出行目的.由表3可见,方式属性对高铁和民航运输竞争的影响较大,4个方式属性因素在所有影响因素中分别位列1、3、4和12位,其中3个因素位居前5,而且其总影响力达41.6%,也就是说方式属性很大程度上决定了飞机与高铁之间的竞争,表明飞机与高铁的竞争主要受运输方式自身属性的影响.出行需求中目的地的远近对飞机和高铁的竞争产生重要影响,由于高铁和飞机为中长距离的运输方式,仅出行距离会对两者的竞争影响较大,出行目的影响力则较弱,仅为1.0%.接驳属性因子中到站时间和离站时间对高铁和飞机运输竞争的影响力,分别为6.0%和5.7%,说明到站时间和离站时间对旅客选择高铁或飞机出行具有一定的影响,这意味着实现交通枢纽与市区的快速接驳,在一定程度上也可提升该运输方式的竞争力.换乘属性中换乘时间因子在所有因子中居第10位,影响力较弱.个体属性因子中,月收入的影响力为4.8%,说明它能在一定程度上对旅客运输方式的选择产生影响,而其他个体属性对运输方式选择的影响较低.
在17个驱动因子中,年龄、运行时间、出行距离、票价、到离站时间、到离站费用为连续性变量和有序分类变量,其他变量如年龄、职业、出行目的、购票方式和出行方式等为无序分类变量.Logistic 回归需要对无序分类变量引入哑变量进行分析,本研究中所有无序分类变量均以最后一个类别作为参照对象,其他类型分别与其进行对比,而运输方式因子是将高铁为参照对象,飞机与其进行对比.
首先对各个自变量进行相关性检验,得到相关系数R2的取值范围为0.02~0.65,均小于临界值0.8[19],表明各个自变量之间的相关性较小,所有自变量都可进入Logistic 回归模型.模型利用Homsmer-Lemeshow进行拟合优度检验,Logistic模型估计结果包括回归系数(β)、 Wald 统计量、显著性水平SIG和exp(β)等.其中,正的回归系数值表示解释变量每增加一个单位值时发生比会相应增加.相反,当回归系数为负值时,说明增加一个单位值时发生比会相应减少.Wald统计量表示模型中每个解释变量的相对权重,用来评价每个解释变量对事件预测的贡献力.模型参数估计结果如表4.
表4 运输方式选择行为模型的参数估计1)
Table 4 Significant parameter estimation of transport mode choice behavior model1)
由Logistic 模型估计结果(表4)可以看出,运行时间、出行距离、票价、到站时间和准时性对旅客选择飞机出行的影响显著.方式属性维度中最重要的影响因子为运行时间,其回归系数是正值(β>0), 表明选择飞机出行的概率随着运行时间的增加而降低,运行时间每增加1个单位,发生比将减小64.6%.出行距离的回归系数是正值,说明出行距离越远,旅客选择飞机出行的概率越大,出行距离每增加1 km,发生比将增加0.4%.票价的回归系数是正值,表明选择飞机出行的概率随出行费用的增加而变大,每增加1元,发生比将增加0.6%.其余的主要驱动因素中,到站时间的回归系数为正值,表明旅客到站时间越长,越有可能选择飞机出行,这与机场的布局和可达性有关.一般机场布局在郊区,与高铁站相比,距离市区较远; 准时性的回归系数是负值,说明飞机的准时性相对较低,对准时性要求较高的旅客选择飞机出行的可能性也就不大.
本研究分别利用RBF神经网络和Logistic 回归分析了影响飞机和高铁竞争的主要驱动力,得到的影响运输方式选择的前5位因素如表5.两种方法都表明,运行时间、出行距离、票价、到站时间和准时性是影响运输方式选择的主要驱动力,均位于主要因子的前5位.通过分析影响力位于前5位的影响因子可以得出:① 运行时间的影响力较大,这主要是因为飞机和高铁运输在多模式多层次的综合运输体系中均为快速运输方式,两者竞争下旅客最看重运行时间; ② 出行距离的大小对运输方式的选择也有影响,距离越远,选择飞机出行的可能性越大; ③ 票价也是影响飞机和高铁运输方式选择的重要因素之一,居第3位; ④ RBF分析显示准时性居第4位,到站时间居第5位,而Logistic分析结果显示到站时间、准时性分别居第4和第5位,在影响程度上略有差异.
1)通过RBF神经网络分析得到影响飞机高铁竞争的影响因素依次是:运行时间、出行距离、出行费用、准时性和到站时间.通过Logistic回归分析得到影响飞机高铁的前5位影响因素依次是: 运行时间、出行距离、出行费用、到站时间和准时性.两种方法分析得出的主要影响因子完全相同,仅在准时性和到站时间的影响程度略有不同.
2)RBF神经网络的分析结果显示,方式属性的4个特征总的影响力贡献率达41.6%,说明旅客出行方式选择主要受运输方式的属性特征决定.接驳属性中只有到站时间的影响力较高,为6.0%.个体属性因子中,旅客的收入水平虽然有一定的影响力,但其贡献率仅为4.8%.
3)Logistic 回归分析结果得出,飞机和高铁运输方式的选择是受方式属性、出行需求属性和接驳属性共同影响的.其中以方式属性中运行时间对运输方式竞争的影响最大,是飞机与高铁竞争的最主要驱动力,其次是出行需求中的距离因素,接驳属性对两者竞争的影响较小.
4)通过RBF神经网络和Logistic 回归模型两种分析方法可以得出,运行时间、出行距离、票价、到站时间和准时性是影响高铁和飞机运输竞争的主要驱动力,均位于主要因素的前5位.总体来说,高铁和飞机竞争受运输方式属性的影响最大,而个体属性的影响力相对较小,出行需求和接驳属性中则只有出行距离和到站时间的影响力较大.
5)应用RBF神经网络研究高铁和飞机运输竞争,能得出各个驱动因子的相对影响力大小,获得的结果比较直观形象; 而运用Logistic回归模型研究,在自变量是分类变量时需要引入哑元变量,使结果解释较为复杂,但能反应旅客不同运输方式的选择行为,两者各有优劣.
深圳大学学报理工版
JOURNAL OF SHENZHEN UNIVERSITY SCIENCE AND ENGINEERING
(1984年创刊 双月刊)
主 管 深圳大学
主 办 深圳大学
编辑出版 深圳大学学报理工版编辑部
主 编 阮双琛
国内发行 深圳市邮电局
国外发行 中国国际图书贸易集团有限公司(北京399信箱)
地 址 北京东黄城根北街16号
邮 编 100717
电 话 0755-26732266
0755-26538306
Email journal@szu.edu.cn
标准刊号 ISSN 1000-2618
CN 44-1401/N