發布時間:2021-07-06所屬分類:免費文獻瀏覽:1次
摘 要: 微型電腦應用
《基于手機信令大數據的軌道交通短時流量預測》論文發表期刊:《微型電腦應用》;發表周期:2021年03期
《基于手機信令大數據的軌道交通短時流量預測》論文作者信息:周劍明(1982-),男,碩士,工程師,研究方向:大數據交通出行識別。
摘要:針對軌道交通短時流量預測存在流量波動預測精度較低、運行時間較長等問題,提出了基于手機信令大數據的軌道交通短時流量預測方法。獲取用戶手機信令數據和軌道交通路線信息,并將發出手機信令大數據的手機基站擬合至軌道交通路線上,根據手機信令數據切換確定手機基站切換序列與軌道交通路線基站切換序列間的相似度,確定軌道交通路線上的手機用戶,構建軌道交通路線上的大量手機用戶信令樣本數據庫。根據預測當日交通軌道流量數據特征,在已構建的數據庫內采用歐氏距離作為距離度量方式確定特征近鄰,依照確定的K組近鄰值數據預測下一時刻軌道交通流量。結果顯示K取值為4時,該方法預測精度最高,預測日全天平均絕對百分比誤差低于5%
關鍵詞:手機信令;大數據;軌道交通;短時;流量預測;基站;K值
Abstract: Aiming at the problems of low prediction accuracy and long running time of short-term traffic flow prediction of rai transit, a short-term traffic forecasting method based on big data of mobile phone signaling is proposed. The mobile phone sig-
naling data and rail transit route information of users are obtained, and the mobile base stations that send mobile phone signaling big data are fitted to the rail transit route. According to the mobile phone signaling data switching, the similarity between the mobile phone base station switching sequence and the rail transit line base station switching sequence is determined, and themobile phone users on the rail transit line are determined, and a large number of mobile phone users on the rail transit line areconstructed, and user signaling sample database is established. According to the characteristics of rail traffic flow data on the day of prediction, the Euclidean distance is used as the measurement method to determine the characteristic nearest neighbor in the constructed database, and the rail transit flow at the next moment is predicted according to the K group of nearest neighbor Hata. The results show that when K value is 4, the prediction accuracy is the highest, and the average absolute percentage error of the whole day is less than 5%.
Key words: mobile phone signaling; big data; rail transit; short term; traffic prediction; base station; K value
0引言
軌道交通方式成為我國大中型城市的主要交通方式之一,但巨大的客流量為軌道交通的運營管理帶來新的挑戰[1。短時流量預測是軌道交通運營管理的基礎,流量預測是以時間序列為基礎預測未來時間段的客流量[2,一般情況下,短時流量預測的時間粒度小于20min,短時流量預測可以為軌道交通客運管理與組織安排提供有力參考并緩解軌道交通擁堵概率,提升交通服務質量。手機基站發出的信令數據具有數據量大、客觀真實和易獲取等優勢[3],隨著手機用戶數量的提升,手機定位技術的信令數據重要性日漸增強。同時與基于交通大數據[或基于組合模型的流量預測方法相比[5],手機信令數據還具有低成本,高覆蓋區域等優勢。因此,在軌道交通短時流量預測過程中融入手機信令,提出基于手機信令大數據的軌道交通短時流量預測方法以預測軌道交通短時流量。
1基于手機信令大數據的軌道交通短時流量預測
基于手機信令大數據的軌道交通短時流量預測方法的整體架構,如圖1所示。
預測過程主要分為以下幾個環節:由手機網絡運營商處和軌道交通運營商處分別獲取用戶手機信令數據和軌道交通路線信息;依照道路匹配算法確定軌道交通路線上移動的手機用戶[6];搭建軌道交通流量大數據庫,實時更新軌道交通路線上手機用戶的手機信令數據;分析軌道交通流量特性;基于K值自適應算法預測軌道交通短時流量。
1.1 手機信令與軌道交通路線的獲取
基于手機網絡運營商的BSS(Business Support System,業務支撐系統)域數據管理系統設定手機信令數據采集時間閾值,根據設定閾值實時采集城市范圍內手機用戶的信令數據。所采集手機信令數據為從某運營商處獲得的脫敏數據,可以在不違反系統規則條件下,改造真實數據并提供測試使用[。所采集手機信令數據結構,如表1所示。
在采集的手機信令數據內,各用戶具備唯一的身份識別ID,經緯度維數為手機基站的所在位置,當用戶手機達到基站服務范圍內基站自動生成時間戳,并記錄用戶手機在該基站范圍內停留時間,再獲取城市軌道交通路線信息。
1.2 道路匹配與用戶判定
選取GIS緩沖分析方法對基站與軌道交通路線實施疊加,根據手機信令數據將手機基站擬合至軌道交通路線上。由于城市內基站服務范圍通常為500m,因此設定緩沖半徑為500 m,基站與交通軌道路線擬合結果,如圖2所示。
基于 GIS緩沖分析方法對基站與軌道交通路線的擬合,
確定 不 同 軌 道 交 通 路 線 上 的基站分布序列,用 Qi = n1,n2,…,n { }f 表示,Qi 和nf 分別表示第i條軌道交通路線和基站序列內第f 個基站,將 Qi= n1,n2,…,n { }f 作為軌 道交通路線的基站切換序列。依據時間維度整理排列用戶手機信令切換數據,能夠確定不同用戶經過基站的切換順序, 用Pj= n1,n2,…,n { }m 表示用戶手機基站切換序列,Pj 和 nm 分別表示第j 個手機用戶和其經過的第m 個基站。計算Pj= n1,n2,…,n { }m 和 Qi = n1,n2,…,n { }k 之 間 的 相 似 度(歐氏距離),如式(1)。
基于式(1)確定手機用戶移動軌跡與軌道交通路線匹配的信息,當相似度高于設定值時,即可判定該手機用戶為軌道交通路線上的手機用戶。
1.3軌道交通短時人流量特性分析利用以上獲得的手機用戶和Oracle Database關系數據庫管理系統,構建手機信令樣本數據庫,手機信令數據采集時間閾值實時更新數據庫信息并分析軌道交通流量特性,可知城市軌道交通短時人流量時間序列存在顯著的周期性變化特征。由于交通流量及具體運行模式不同時,其預測的精度和動態特征也不同,為了以最低計算量獲取相關的交通短時流量參數,本文采用基于K值自適應的軌道交通短時流量預測算法預測城市軌道交通短時流量。
1.4 K值自適應的軌道交通短時流量預測算法利用軌道交通路線上用戶手機信令樣本數據庫,依照軌道交通人流量特性生成K近鄰模型的狀態向量。依照距離度量方式與自適應K值計算確定近鄰搜索機制。根據當前時刻軌道交通流量數據預測下一時刻軌道交通流量。狀態向量是對比交通軌道流量歷史狀態與當前狀態的標準,如式(2)
K 近鄰模 型 中,K 值表示數據庫內選取近鄰數量的參數,該值直接影響預測精度。因此選取基于平均絕對百分比誤差最小的 K 值自適應計算模型計算 K 值。計 算 模 型,如 式(4)。
式中,λ和δ分別表示自適應搜索邊界值和預測值數量;^gi和gi分別表示預測值與實際值。K 值計算,如式(5)、式(6)。
依照確定的K組近鄰值數據預測下一時刻軌道交通流量可得式(6).s+1)和V,分別為數據庫內獲取的第j個近鄰所對應的1+1時刻軌道交通流量和當前時刻數據與第j個近鄰的距離。
2應用分析
采用本文方法對某市軌道交通二號線進行短時流量預測以測試性能。預測過程中使用的手機信令大數據來源于同三大營銷商的合作項目,軌道交通路線信息來自研究對象所在城市軌道交通運營商。
2.1預測結果
2.1.1 K取值
采用本文方法進行研究對象短時流量預測,基于數據庫內已有數據得到不同 K 值下的預測結果平均絕對百分比誤差,其中曲線表示平均絕對百分比誤差值,如圖3所示。
分析圖3能夠得到,隨著K取值的提升,短時流量預測結果的平均絕對百分比誤差整體表現出先下降后提升的趨勢。當K取值在1-4時,預測結果平均絕對百分比誤差從0.056下降至0.038;當K取值在4-16時,預測結果平均絕對百分比誤差從0.038上升至0.076,這是因為當K取值過大或過小時,均會提升研究對象短時流量預測結果的平均絕對百分比誤差,而4恰巧在取值過大或過小的中間節點上,因此此取值為預測精度最高。實驗結果表明采用本文方法預測研究對象短時流量時,K取值為4時,本文方法預測精度最高。
2.1.2 流量預測
以2020年5月1日(法定節假日)和5月6日(非節假日)
為預測日,采用本文方法進行研究對象短時流量預測,設定預測時間粒度為20 min,K取值為4,預測結果,如圖4所示。
綜合圖4(a)與圖4(b)的數據能夠得到本文方法針對節假日條件下研究對象流量預測結果較好。整體預測過程中本文方法對于研究對象流量的變化趨勢感知較為敏感,可依照實時流量波動快速修正預測趨勢。本文方法在節假日條件下針對研究對象進行流量預測過程中,全天平均絕對百分比誤差低于5%,滿足實際預測需求。且本文方法針對非節假日條件下研究對象流量預測結果與實際流量基本一致,預測過程中,全天平均絕對百分比誤差低于3%。證明了本文方法可準確預測研究對象短時流量,并根據實際流量,實施修正預測趨勢,提升后續預測精度。
2.2預測性能對比分析
選取均方根誤差(其值越小誤差越小)和運行時間(其值越大方法復雜度越高)作為預測性能評價指標。針對研究對象5月6日流量預測結果的評價指標,以文獻[4]和文獻[5]
中方法對比本文方法,如表2所示。
分析表2可得,本文方法在均方根誤差上的評價結果與基于交通大數據的預測方法差距較小,但顯著優于基于組合模型的預測方法;在運行時間方面的評價結果與基于組合模型的預測方法差距較小,但顯著優于基于交通大數據的預測方法。綜合可知本文方法預測性能優于對比方法。
3總結
本文提出基于手機信令大數據的軌道交通短時流量預測方法,擬合手機基站與交通軌道路線,根據手機信令數據判斷交通軌道路線上的用戶,采用基于K值自適應的軌道交通短時流量預測算法進行實時準確的短時流量預測。但本文方法在研究過程未考慮天氣異常與突發事件等條件,因此,在后續優化過程中將基于此對方法實施改進。
參考文獻
[1]Derrmann T,Frank R,Viti F,et al.How road and mobile networks correlate:estimating urban traffic r sing handovers[J].IEEE Transactions on Intelligent Transportation Systems,2020,21(2):521-530.
「2]林培群,雷永巍,張孜,等,面向手機信令數據的交通樞紐人流量短時預測算法[J].哈爾濱工業大學學報,2018,50(9):89-95.
[3]謝棟燦,王德,鐘煒菁,等,上海市建成環境的評價與分析:基于手機信令數據的探索[J].城市規劃,2018,42(10):97-108.
[4]蔡曉禹,譚宇婷,雷財林,等,交通大數據環境下短時交通流量預測研究[J].鐵道運輸與經濟,2018,40(8):88-93.
[5]楊靜,朱經緯,劉博,等,基于組合模型的城市軌道交通短時客流預測[J].交通運輸系統工程與信息,2019,19(3):119-125.
[6]Zhong G,Yin T T,Zhang J,et al.Characteristics analysis for travel behavior of transportation hub passengers using mobile phone data[J].Transportation.2019,46(5):1713-1736.
[7]方珊珊,陳艷艷,劉小明,等,基于手機信令數據的快遞人員辨識方法[J].北京工業大學學報,2017,43(3):413-421.
SCISSCIAHCI