多源多態的智能交通數據涵蓋軌道交通、線路交通、浮動車交通及步行等多種居民出行模式,其多源性體現在數據源(多種交通工具),多態性體現在數據形式(浮動車輛軌跡、公共交通刷卡記錄)。與此同時,智能交通數據本身的海量性和高維度性,及數據缺失、冗余和噪聲問題,都給多源多態的智能交通數據的熔合和後續處理帶來了巨大的挑戰。針對這些難題,智能交通研究室在初探研究中針對多源多態的智能交通數據進行了細致的逐一分析,並利用交通模型自身的空間域和時間域的一致性針對智能交通大數據提出了數據處理和數據熔合模型。

以數據預處理為例,智能交通研究室在初探研究中利用城市道路網絡的時域自相關性和空間域互相關性,僅利用了有限的浮動車輛(約壹萬輛出租車)約20%時空覆蓋率的觀察數據,實現了某壹線城市道路網絡(2000平方公裏)100%的交通通行速度的交通感知,平均精度在85%以上。該研究將壹條道路的流速表達為時域上的交通通行速度的浮點序列,並在引入了推薦系統中常用的壓縮感知技術的前提下,利用相關性分析技術對道路進行空間相關性建模。從而使得觀察數據較為稀疏的道路能夠通過具有空間強相關性的觀察數據較多的其他道路得到更準確的數據推理,以此解決相關研究中,不同道路交通補缺效果差別過大的缺點,提高了整體的數據補全精度。在後續研究中,智能交通研究室計劃將自研的基於機器學習技術的稀疏表達技術(H. Xiong  et al. 2019),通過海量歷史數據,將道路交通的時域與空間域相關性轉化為更高維度的非線性表達,從而獲取更精準的交通信息補缺。

完成了多源多態智能交通數據的預處理研究後,智能交通研究室在後續研究中提出了一個具有創造性的統一架構,該架構能夠利用城市交通網絡的時域和空間域特性,熔合多種實時交通數據,並基於多源多態的交通數據進行交通出行的推薦。該框架涵蓋三大模塊。最底層的是基於多源多態交通數據特性設計的實時數據吸收模塊(Real-Time Data Feed Layer)。這壹模塊以分布式系統為根基(Hadoop、Spark),對數據進行實時的補全、冗余、去噪等預處理,在這壹過程中,智能交通研究室提出了基於數據負載均衡的分布式處理模式 (Z. Yu et al. 2018)。在此模塊之上,是居民出行模式抽象模塊(Mobility Abstraction Layer)。這壹模塊對居民出行模式進行了定義,並提出了針對各種多源多態數據的離線和在線推理算法 (H. Zhang et al. 2018)。數據吸收模塊中收集的多源多態數據將會在這壹模塊中被熔合為統一的出行模式以進行後續分析。在這模塊之上是應用模塊(Application Layer),智能交通的各種應用建立於此模塊之中並調用居民出行模式抽象模塊的API進行基於交通數據的分析處理。實驗表示,該系統對用戶出行模式的歸納和推理有75%以上的精度,基於此系統的乘客實時出行系統能夠為用戶減少36%的出行時間消耗。而基於本系統的用戶出行模式分析結果,也被廣泛用於如無線充電選址研究 (L. Yan et al. 2017)等智能交通應用研究中。

在完成多源多態的數據熔合處理後,智能交通研究室基於智能交通數據進行了後續的智能交通應用研究,其中一個示範研究項目是基於索引的大規模網絡的最短路徑分析 (Y. Li et al. 2017)。這研究主要提出利用道路網絡空間特性的的快速索引建立。該研究將獲取道路網絡特性的計算有效地與索引建立本身進行結合。實驗表示,在保證了索引高速有效的前提下(單次查詢僅需1微秒),索引建立的速度在路網上比相關研究提升數倍到數十倍。

相關文章

  1. H. Xiong*, K. Wang*(equal), et al, SpHMC: Spectral Hamiltonian Monte Carlo, Proc. of AAAI, 2019.
  2. H. Zhang, et al, Urban-Scale Human Mobility Modeling With Multi-Source Urban Network Data. IEEE/ACM Transactions on Networking 26(2): 671-684 (2018).
  3. Z. Yu, et al, MIA: Metric importance analysis for big data workload characterization, IEEE Trans. on Parallel and Distributed Systems, 29(6):1371-1384, June 2018.
  4. L. Yan, et al. CatCharger: Deploying wireless charging lanes in a metropolitan road network through categorization and clustering of vehicle traffic. INFOCOM 2017:1-9.
  5. Li, Ye, Man Lung Yiu, and Ngai Meng Kou. “An experimental study on hub labeling based shortest path algorithms.” Proceedings of the VLDB Endowment 11.4 (2017): 445-457.
點擊了解更多相關成果