|
7技术专题-浅析多源空间数据的集成
|
| |
浅析多源空间数据的集成
文/北京市信息资源管理中心 田 鹏
多源空间数据共生问题自地理信息系统(GIS)产生以来一直存在,多源信息的集成和融合是地球信息科学领域的一大热点问题。它的意义和必要性与地球信息本身的特征、采集手段特征、信息处理平台或系统的特点紧密相联,它的应用和集成备受关注。
何谓多源空间数据集成
地理信息系统(GIS)自产生以来,得到了飞速的发展,各种软件平台应运而生,形成了百家争鸣、百花齐放的局面,如美国MapInfo Corporation的MapInfo软件、ESRI公司的Arc/Info软件、Geostar、MapGIS等等。但同时,一开始就孕育的多源数据共生问题也一直存在。多源空间数据有广义和狭义之分。广义上讲,多源空间数据可以包括多数据来源、多数据格式、多时空数据、多比例尺(多精度)、多语义性几个层次。狭义上讲,多源空间数据主要是指数据格式的多种样式,包括不同数据源的不同格式及不同数据结构导致的数据存储格式的差异。本文涉及的是狭义上的多源空间数据。 当然,多源空间数据的侧重点不同,所用的集成方法以及所涉及的理论也会有差异。比如,遥感数据与GIS的集成、多源遥感影像的融合、GIS中多格式数据的集成、分幅意义上的集成、基于具体的应用等等。本文所涉及的多源空间数据的集成是对数据形式特征(如格式、单位、分辨率、精度等)和内部特征(特征、属性、内容等)作全部或部分的调整、转化、合成、分解等操作,其目的是形成充分兼容的数据库。
理论溯源
多源信息的集成和融合是地球信息科学领域的一大热点问题。它的意义和必要性与地球信息本身的特征、采集手段特征、信息处理平台或系统的特点这三方面紧密相联。然而现实中,一方面是丰富的不同格式的海量数据;另一方面是人们对数据的需求不能满足。现在也提出了一些相关理论进行不同格式的数据转换,但是转换的过程复杂,耗费时间和人力资源,并且容易丢失信息。 从数据共享意义上来讲也需要进行数据集成的研究,而且GIS应用需要集成多种数据源以及不同格式的数据才能完成。GIS迈向社会化产业化的发展方向,也对多源空间数据的无缝集成提出了迫切需要解决的任务。
研究现状
在众多观点中,空间数据集成方式可以大致分为三种,但都可以总结为直接操作格式转换、互操作格式转换和中间模块操作转换。 直接操作格式转换就是把其他格式的数据经过专门的转换程序变成本系统的数据格式,这是当前GIS软件系统共享数据的主要办法,但是这种转换模式会造成信息丢失。许多GIS软件为了实现与其他软件交换数据,制订了明码的交换格式,如ArcInfo的E00格式、ArcView的Shape格式、MapInfo的Mif格式等,美国国家空间数据协会(NSDI)制定了统一的空间数据格式规范SDTS。 目前,ESRI在ARC/INFO中提供了SDTSIMPORT以及SDTSEXPORT模块,Intergraph公司在MGE产品系列中也支持SDTS矢量格式。SDTS在一定程度上解决了不同数据格式之间缺乏统一的空间对象描述基础的问题。但SDTS目前依然还很不完善,还不能完全概括空间对象的不同描述方法,不能统一为各个层次以及从不同应用领域为空间数据转换提供统一的标准,也还没有为数据的集中和分布式处理提供解决方案,所有的数据仍需要经过格式转换才能进到系统中,不能自动同步更新。 互操作格式转换是OpenGIS Consortium (OGC) 制定的统一的规范。GIS互操作是指在异构数据库和分布计算的情况下,GIS用户在相互理解的基础上,能透明地获取所需的信息。一个系统能同时支持不同的空间数据格式,为实现不同平台间服务器和客户端之间数据请求和服务提供了统一的协议。这种模式为多源数据集成提供了崭新的思路和规范,它将GIS带入了开放的时代,从而为空间数据集中式管理、分布式存储与共享提供了操作的依据。 但数据互操作模式在应用中存在一定局限性:首先,为真正实现各种格式数据之间的互操作,需要每种格式的宿主软件都按照统一的规范实现数据访问接口,这在一定时期内还不现实;其次,一个软件访问其他软件的数据格式时是通过数据服务器实现的,这个数据服务器实际上就是被访问数据格式的宿主软件。也就是说,用户必须同时拥有这两个GIS软件,并且同时运行,才能完成数据互操作过程。最后,即使以后新建的GIS软件都支持OpenGIS,现有的GIS软件生产出来的空间数据也要转化到OpenGIS标准。 中间模块操作转换是一种解决多源数据无缝集成的比较理想的方法。之所以被称为中间模块操作转换模式是因为在源数据与处理后的结果数据之间有一个独立的处理模块,以接口方式与二者连接。 在相关资料中提到的多源空间数据无缝集成(SIMS)技术体系是一种紧凑的三层结构,包括数据消费者层、数据代理层和数据提供者层。每一层都有明确分工,实现了多格式数据直接访问、格式无关数据集成、位置无关数据集成和多源数据复合分析等功能。其中的数据代理是联系数据消费者和数据提供者的中介,也称为虚拟空间数据引擎(Virtual Spatial-data Engine),它负责把来自提供者的数据传递给消费者使用,并把消费者产生的新数据传递给提供者存储。数据中间件(Middle Ware)模式其实与虚拟空间数据引擎有很大的类似之处,它是一种独立的系统软件或服务程序,这里的中间件是GIS系统的软件插件,其原理类似于即插即用设备的驱动程序设计,即GIS软件平台开发者规定系统内部数据的读写接口,通过里面的驱动程序完成对不同来源的数据处理,从而完成多源数据的无缝集成。类似的实现空间数据的ODBC,也是一种相对独立的中间驱动程序。
解决之道
从现在看来,数据的“多源”性、复杂性、无标准性是解决多源数据集成的一个突出难点,如何设计出一种通用的而且没有信息损失的“中间件”是要完成的任务之一。所以,GIS要网络化、产业化、社会化、商业化,这些有助于数据无缝集成的问题需要首先解决。当然解决所有的问题也并非短期之内就能做到的,但是在GIS行业领域建立起一种标准性的大家都愿意接受的规范就显得很重要,使得数据逐渐标准化,使得操作逐步规范化,这是策略之一。其二是要开发出一套独立的针对所有数据格式的驱动程序作为中间接口,这是一个更为重要的任务,如何使其更节省人力物力,如何使其更适应市场需求,这需要时间的验证,需要市场机制下的优胜劣汰。
|