發布時間:2020-05-08所屬分類:科技論文瀏覽:1次
摘 要: [摘要]本文針對湖南省矢量空間數據來源復雜、格式不一等問題,建立了一套多源矢量空間數據集成框架。該框架以基礎地理信息數據分類分層體系為依據,從數據空間、屬性、格式等方面制定數據集成規則,實現多源異構矢量空間數據集成。建立的多源矢量空間數據集
[摘要]本文針對湖南省矢量空間數據來源復雜、格式不一等問題,建立了一套多源矢量空間數據集成框架。該框架以基礎地理信息數據分類分層體系為依據,從數據空間、屬性、格式等方面制定數據集成規則,實現多源異構矢量空間數據集成。建立的多源矢量空間數據集成框架為湖南省地理空間數據交換共享數據庫構建提供了重要支撐。
[關鍵詞]多源矢量空間數據;地理空間數據集成;地理空間信息交換共享
0引言
隨著測繪地理信息技術的快速發展和廣泛應用,當前我國各省市已經積累了大量不同來源、不同尺度、不同時相、不同格式的地理空間矢量數據,如何實現多源異構數據的集成、管理、交換共享及應用,提升測繪地理信息數據的應用價值和服務水平是政府部門面臨且需亟待解決的問題[1]。
多源地理空間矢量數據集成是把不同來源、格式、比例尺、多投影方式或大地坐標系統的地理空間數據在邏輯上或物理上的有機集中,從而實現地理信息的共享[2]。矢量空間數據的集成研究始于20世紀60年代,尤其是伴隨著地理信息系統的出現,多源矢量空間數據的集成日益迫切[3]。國際上在多源矢量數據集成與共享方面研究起步較早,北美、西歐及國際組織早期開展數據管理體系、數據資源共享、數據信息規范化標準化等研究,構建了符合實踐的空間數據運行體制[4]。國內學者也針對多源矢量空間數據集成的理論與方法開展了基礎性的研究工作,如坐標與投影變換、數據格式轉換、語義編碼轉換等[5-7]。近年來,我國隨著信息化技術、地理信息技術、云計算技術的發展,各行業對空間地理信息的需求增強,但各行業數據格式、數據標準不統一,空間參考基準、數據資源組織不一致,信息資源共享與整合程度低,缺少統一集成的數據庫,空間地理信息得不到充分挖掘,無法“盤活”空間地理信息數據庫,從而無法提升空間地理信息的應用價值[8-9]。已有研究成果主要采用串行計算方法集成,串行計算方法指多個程序在同一個處理器上被執行,只有在當前的程序執行結束后,下一個程序才可以開始,所以處理過程慢,且以庫級別的粒度集成,管理難度大。
因此,本文從湖南省地理空間數據現狀、特點、數據標準規范等方面進行分析,開展基于云GIS平臺的湖南省地理空間數據集成研究,研究基于云GIS平臺流程化動態建模技術。云GIS平臺是指采用虛擬化技術、分布式存儲技術、并行計算技術等技術構建的地理空間數據管理平臺,平臺將海量的多源異構數據進行分布式存儲,在一個計算機服務器集群中采用多個節點對地理空間信息數據進行并行處理,建立空間數據、相關的文檔及屬性數據關聯關系。在云GIS平臺上搭建數據處理規則引擎,對多源多時相多尺度數據進行流程化規則化集成處理,并構建數據庫資源目錄組織管理體系,為湖南省地理空間信息交換共享提供數據支撐,為湖南省時空大數據的匯集打下基礎[10-11]。
1湖南省多源矢量空間數據
目前,湖南省內管理的矢量數據具有明顯的多源、多尺度、多格式、多參考系及多語義的特點:
(1)多源性。湖南省現有測繪地理信息數據主要來源包括基礎測繪成果、地理國情監測成果、數字城市成果以及交通、環保、教育等行業部門交換共享的地理空間數據。
(2)多尺度。當前湖南省管理和存儲的矢量空間數據比例尺主要包括:1∶500、1∶1000、1∶2000、1∶5000、1∶1萬及1∶5萬。
(3)多格式。當前數據格式包括MDB、GDB、E00、SHP、COV、DWG、MAPGIS等。
(4)多空間參考系。現存的各類地理空間信息數據主要采用西安80坐標系統、2000國家坐標系統,行業專題數據多采用西安80坐標系、北京54坐標系。
(5)多語義性。不同來源屬性信息、圖層分類不一致,例如基礎測繪矢量數據分為9大類、17個中類、39個圖層,幾何特征包含點、線、面,地理國情基礎性監測矢量數據分為10個一級類,58個二級類,135個三級類,屬性增加CC碼用于地表覆蓋分類。相比基礎測繪矢量數據,地理國情普查數據分類較細,數據內容較為豐富,屬性信息較為完整,數據分層及數據采集標準不一致。對于同一個空間單元,現實世界中其幾何特征一致,但可對應多種語義。例如,地理國情數據中構筑物點、線、面層,在基礎測繪中則分別表達為水系構筑物、道路構筑物。
2多源矢量空間數據集成框架
本文在進行多源矢量空間數據集成時,首先指定數據集成的總體原則,進而分步驟指定具體集成策略。
2.1數據集成總體原則
(1)空間參考要求:考慮到湖南省跨三個度帶,所有地理空間數據統一轉成地理坐標系,便于統一存儲與管理。統一采用國家2000地理坐標系、1985國家高程基準作為數學基礎。
(2)平面位置精度要求:當需要集成的多源矢量數據平面位置精度不一致時,原則上以精度高的數據為準。
(3)數據幾何表達精細度要求:需要集成的多源矢量數據幾何表達精細度不一致時,以精細度高的數據為準。
(4)數據現勢性要求:需要集成的多源矢量數據現勢性不一致時,以現勢性高的數據為準。
(5)空間關系與邏輯一致性要求:集成后的成果數據要素空間關系正確,各類信息邏輯一致。
(6)數據內容要求:集成處理時應利用不同數據源的信息進行要素增補,集成后的成果數據應盡可能完整保留數據源中的相關信息。
2.2矢量空間數據集成方法
通過對湖南省多源矢量空間數據對比分析,本文以2000國家大地坐標系、1985國家高程基準為數學基礎,以GB/T13923-2006《基礎地理信息要素分類與代碼》為分類標準,以基礎地理信息矢量數據分層體系為分層分類依據,其他來源的矢量空間數據根據時相、精度等對基礎地理信息數據進行補充,集成不同來源、不同時相、不同尺度的矢量空間數據,具體流程如圖1所示。
(1)空間化處理
2017年4月,湖南省出臺了《湖南省地理空間數據管理辦法》省政府令,要求各行業廳局將用于交換共享的數據匯集到湖南省自然資源廳共享服務機構,自然資源廳信息中心開始收集各行業廳局的數據,收集到的大部分行業專題資料格式為excel表格等文本格式(文本中含位置信息),因此,為了集成行業專題資料,豐富基礎地理信息數據內容,首先將行業專題中的位置信息空間化處理。
空間化處理主要分兩個類別:①含經緯度坐標;②不含經緯度,但含地址信息;含坐標信息的表格數據根據點位分布形成空間化數據圖層;不含經緯度,但含位置信息的表格數據根據已有地名地址數據進行關聯處理,形成空間化數據圖層。
(2)格式轉換
為了在云GIS平臺上統一管理不同格式數據,本文研究在云GIS平臺中搭建數據格式轉換ETL處理規則(如圖2),將矢量數據轉換為通用SHAPE格式(便于交換共享應用),并依據基礎地理信息矢量數據分層體系分層,分類體系中缺少的圖層,則根據實際做適當擴展。
(3)空間數據匹配
以湖南省地理空間數據基本比例尺、基本時相為依據,匹配多來源、多尺度、不同時相的地理空間數據,并進行類別劃分,將相同尺度、相同時相的數據集成在一個數據庫中,并根據《基礎地理信息要素分類與代碼》分類到對應的圖層中。湖南省地理空間數據基本比例尺為:1∶500、1∶1000、1∶2000、1∶5000、1∶1萬,從國家申請的小比例尺數據也要進行管理,因此,擴充尺度為:1∶5萬、1∶25萬。湖南省已有數據時相為:2010年-2017年。
(4)一致性處理
一致性處理主要針對矢量數據語義一致性處理。湖南省地理空間數據來源于國家指導生產、省級自主生產,數據生產標準不統一,數據語義存在較大不一致性。因此,本文研究抽取時相高的圖層,以GB/T13923-2006《基礎地理信息要素分類與代碼》為語義標準,按照分類分層體系組織圖層,形成相同尺度下的矢量數據層,從而構建不同尺度、不同年度的矢量數據層,如:1∶1萬尺度下道路、水系、鐵路層分別用字符串LRDL、HYDL、LRRL表示,有些數據相同尺度表示的要素相同但圖層語義不一致則進行一致性處理等。
(5)屬性結構調整
為便于查詢、檢索、空間分析等應用,按照云GIS平臺建庫數據標準,將經過格式轉換、一致性處理后的數據作為數據輸入,從中抽取相應的屬性信息、空間信息錄入到標準數據框架中,構建標準化地理信息矢量數據。
(6)集成規則
根據數據管理要求,本文設計不同集成操作的處理規則,主要有數據格式轉換規則、數據抽取規則、數據檢查規則等數據處理規則,這些處理規則搭載在湖南省地理信息公共交換共享平臺的ETL上,形成流程化動態模型,例如數據格式轉換規則設計輸入任何格式的地理空間信息數據,通過分析源數據格式與目標數據格式之間的差異,建立數據轉換模型,形成地理空間信息數據轉換規則,在數據處理過程中搭建不同格式的數據轉換規則流,批量轉換地理空間信息數據,數據集成規則及詳細處理流程如圖2。
數據抽取規則設計查找全部地理空間信息數據圖層及元數據,對比圖層的連接性、時效性、完整性,按照分層標準體系,抽取地理空間信息數據圖層,并進行合并,規則處理流程見圖3、圖4。
推薦閱讀:測繪高工論文需要在哪些雜志上發表
3地理空間數據組織管理
地理空間數據集成后數據量達上百TB,為了高效管理、快速渲染海量地理空間數據,本文采用基于高性能云GIS平臺構建的湖南省地理信息公共交換共享平臺大數據管理中心管理集成后的地理空間數據,大數據管理中心采用在通用的虛擬化環境運行,提供海量空間數據的分布式存儲,支持并行計算的空間索引,大幅提高海量空間數據的動態渲染(無須切片緩存)及空間分析的速率,并提供高性能的空間數據可視化、空間分析及地理計算等服務。
本文設計在大數據管理中心中設置原始庫、母庫,原始庫主要收集管理各個單位生產項目匯交的數據。母庫則是從原始庫中通過抽取、匹配、語義一致性處理、屬性規整等操作處理,集成地理空間數據成果,集成后的數據按照矢量數據、影像數據、高程數據、地名地址數據、元數據、地圖文檔等分類管理,生產單位匯交的數據為全省范圍分幅或分縣管理的MDB格式、GDB格式、歷史數據的E00格式的數據,其比例尺、格式、語義由于生產項目不同,所以生產標準不一致,造成不同比例尺、不同時相、不同格式、不同語義的多源異構地理空間矢量數據,通過本文研究的數據集成規則引擎在線處理,集成為按比例尺、時相、統一格式、統一屬性結構及語義的地理空間矢量數據庫數據。
4結束語
本文針對湖南省矢量空間數據來源復雜、格式不一、海量地理空間數據管理難等問題,通過分析湖南省地理空間數據管理的現狀及數據特點,提出了基于云GIS平臺的多源矢量空間數據的集成原則和方法,并將研究成果運用于湖南省地理信息公共交換共享平臺數據庫建設中,取得了良好的應用成效,為湖南省地理空間數據的交換共享打下了堅實基礎。
SCISSCIAHCI