导航:首页 > 网络数据 > 地质大数据幻灯片

地质大数据幻灯片

发布时间:2022-09-19 20:48:51

⑴ 中国地质调查局研发的地质云是什么意思

地质云是一个基于云计算、大数据等现代信息技术,以支撑国家战略、服务经济社会发展为目标,旨在实现地质调查基础设施资源、数据资源、业务应用和服务资源的统一管理和调度。据了解,当前,地质云建设正按计划稳步推进。中国地质调查局正积极开展试点与示范,包括云计算技术在地质调查中的应用试点、大数据技术在智能地质调查中的应用示范、地学高性能计算实验等。

⑵ 城市地质信息化

一、地质勘察信息管理系统建设

(一)概述

深圳市城市地质勘察信息系统是由深圳市勘察研究单位自行投资和实施完成的一个大型GIS信息管理项目。项目开始于2002年10月,2003年12月基本完成,2005年在原系统基础上增加了Web发布功能。

系统采用深圳市1∶1000(特区外为1∶2000)地形图为地理背景底图,能实现对勘察项目、勘探点数据、原位测试和土工试验数据、水文地质试验数据、区域地层岩性空间分布数据、区域地质构造空间分布数据和其他特征性地质对象数据进行综合管理。

数据库内的管理信息工作自1983年以来,包括所完成的各类勘察工程的全部信息,以及深圳特区1∶5万地质图所包含的地层岩性和地质构造空间分布数据。除此之外,还有部分罗湖区断裂带高层建筑物沉降监测项目数据和部分地质灾害和地质遗迹数据。

该系统被列为“2003年深圳市信息化重点工程”以及“2003年深圳市建设科研项目”。

系统建设的主要目的和意义为:

1)全面有序地管理、开发、利用城市地质勘察资源。

2)提供城市规划、国土资源开发、城市建设和城市管理等决策分析的地质信息依据。

3)为深圳社会经济建设的可持续发展提供基础性地质地理信息。

4)规范统一深圳市地质资源与工程地质勘察行业技术标准,实现网络信息共享。

5)为城市防灾减灾、城市地质科学研究、岩土工程设计和工程地质勘察等领域的发展提供服务。

(二)系统建设方法与实施技术

城市地质勘察信息系统的建设,需要采用地理信息系统(GIS)技术、数据库技术和网络技术进行开发。

地理信息系统(GIS)技术,提供了将空间数据及其属性数据进行关联整合,能以地图这一图形方式进行显示,并且提供各种层次的地图空间数据查询和表现功能。目前,主流的地理信息系统(GIS)平台软件,国外平台有Arc/Info、MicroStation GeoGraphics、MapInfo和AutoMap等,国内平台有MapGIS、SuperMap等。从网络运行环境来看,又分为客户端/服务器端(C/S)和浏览器/服务器端(B/S)模式,后一种方式又称为是互联网地理信息系统(WebGIS)。

深圳市城市地质勘察信息系统也分为两个版本,前期版本为客户端/服务器端(C/S)版本,采用国内SuperMap 2000软件为平台进行开发;后期版本为浏览器/服务器端(B/S)版本,主要采用MicroStation Geographics平台下的GeoPublisher作为服务器地图数据发布引擎,客户端则采用自主开发的控件完成。

由于地理信息海量数据特点,地理信息数据存储对数据库管理系统的并发响应速度等要求较高,数据存储主要有两种方式:一种是将空间地图数据及其属性数据,统一存放到一个数据库中的图属一体化存储方式;另一种则是将空间地图数据和其属性数据分别存储的方式,即地图数据以文件方式存储(一般以图幅为分割单位),而属性数据则存储到数据库管理系统中。前一种方式是具有维护管理方便、技术先进、响应快的优点,是目前的发展方向,但技术实现费用较高、系统不稳定,因此,深圳市城市地质勘察信息系统仍采用空间地图数据和其属性数据分别存储的方式,数据库管理系统采用的是M S SQL Server2000。

图3-3-1 系统基本对象

由于计算机网络和Internet技术的普及,越来越多的计算机软件已经摆脱了单机工作环境的局限,向联网协同工作的方式转化,深圳市城市地质勘察信息系统也是一个联网运行的软件系统,设计上采用了Internet软件技术来实现,目前主要面向于局域网内应用,但其技术上也已经完全满足Intcrnet环境下的应用需求(图3-3-1)。

(三)要素分类与编码

根据建设部《城市地理信息系统建设规范》的经验和成果,深圳市城市地质勘察信息系统内分为城市地理基本数据集和城市地质基本数据集要素两类,其中城市地理基本数据集主要是指地形、地物、地下管线和测绘标志等数据要素,城市地质基本数据则指城市地质工作与工程建设所涉及的地层岩性、地质构造等空间数据,以及地质测绘和勘探所获得的各类成果数据,如勘探点(钻孔)、原位测试数据等。

深圳市城市地质勘察信息系统城市地理基本数据集要素分类与编码,基本上参照原有测绘产品要素分类规范,如《1∶500 1∶1000 1∶2000地形图要素分类与代码(G B 14804-93)》、《国土基础信息数据分类与编码》(G B/T 13923),而城市地质基本数据集由于项目建设时期国内尚没有可供遵循的规范标准,因此根据实际工作需要,系统建设者对各类要素进行了统一分类和编码,其成果已被《城市地理信息系统建设规范(C JJ100-2004)所采纳。

要素分类编码过程中,注重了以下原则:

1)唯一性:编码应唯一、无歧义。

2)扩展性:给定编码规则和扩充区间,以满足实际应用中编码扩展、增加的需求。

编号全部采用数字编码,共6位,第一位数字为主题类,第二位数字为大类,第三、四位数字为中类,最后两位数字为小类和扩充位。

下面对城市地质基本数据集作简要说明(表3-3-1~3-3-7)。

1.地层岩石

表3-3-1 地层岩石要素编码

2.地质构造

表3-3-2 地质构造要素编码

3.水文地质

表3-3-3 水文地质要素编码

4.地震地质

表3-3-4 地震地质要素编码

5.环境地质

表3-3-5 环境地质要素编码

6.地质资源

表3-3-6 地质资源要素编码

7.其他要素

表3-3-7 其他地质要素编码

续表

(四)数据组织

1.主要数据种类

系统数据主要包括基础地理数据(1∶1000地形图)、基础地质数据和工程勘察专题数据3类(图3-3-2)。

2.要素属性数据

系统主要要素的属性数据见表3-3-8~3-3-18。

表3-3-8 地层界线属性表

图3-3-2 系统管理建库的数据种类

表3-3-9 岩层属性表

表3-3-10 土层属性表

表3-3-11 勘探点属性表

表3-3-12 断层属性表

表3-3-13 地震震中属性

表3-3-14 滑坡体属性

表3-3-15 危岩体属性

表3-3-16 海水入侵带属性

表3-3-17 地质遗迹属性

表3-3-18 地面沉降区域属性

3.数据库结构

系统采用关系型数据进行组织,对于勘察项目与勘探点数据之间关系较为复杂,其各要素属性表与各辅助数据表之间结构如图3-3-3~3-3-5。

图3-3-3 勘察工程项目相关数据表及关联关系

图3-3-4 勘察工程场地(场区)相关数据表及关联关系

(五)系统功能

1.项目查询

系统提供根据关键字查询、组合信息查询数据库中的勘察项目的检索功能,或者根据地图位置点选、框选、不规则框选等功能实现对勘察项目的查询。

2.钻孔查询

系统提供点选、框选、给定坐标范围和绘制不规则区域等方式,选定数据库内的钻孔,供查询分析之用。

3.定位查询

该系统是一个标准的地理信息系统应用工程,可以实现地理信息系统所提供的各种定位查询功能。如根据坐标定位查询、根据地名定位查询、根据其他关键词定位查询、或者地图浏览定位等等。

4.区域数据提取

通过在地图上框选、或者绘制一个区域,实现选定该区域上的勘探点(钻孔),并将该部分勘探点以一个模拟“工程”的形式,将数据导出到勘察作业软件(“勘察e”软件格式),供进一步分析,如图3-3-6所示。

5.模拟钻孔生成

系统可以通过选择给定平面位置点上的周边钻孔,通过数据插值模拟手段,生成一个模拟钻孔,用于查询该点的推测地层和地层厚度。

6.报表和专题图输出

系统提供地质平面图、钻孔柱状图、钻孔剖面图、原位测试孔柱状图、地层简表、地层参数简表、土工试验和原位测试结果简表等报表和专题图输出功能。

图3-3-5 勘探孔和各类试验的数据表之间的关系

图3-3-6 W ebGIS版本下将选定钻孔输出为模拟工程数据文件

7.管理维护功能

系统提供有数据备份、访问权限控制、数据入库(数据手工录入和整体导入)等功能。

8.Web发布

系统建设初期采用了传统C/S模式,后期逐步扩展到B/S模式,通过Bentley GeoWebPublisher平台,将地理地图数据与钻孔数据以Web方式进行发布,摆脱了客户端繁琐的维护安装任务,使得网内终端,打开浏览器就能够实现对系统各种资源的访问和查找。

具体实现功能如下:

①地图的缩放、平移;②地图的查询定位;③对数据库中的勘察工程和勘探点进行各类交互式查询;④选定勘探点输出为模拟工程数据用于分析。

在客户端开发工程中,结合了Flash Active Script技术,解决了单纯采用Bentley GeoWebPublisher所提供的控件方式无法实现的大数据发布的快速响应与客户端地图操作的灵活性同时实现的问题,客户端界面更为友好和易于操作。

查询页面效果如图3-3-7所示。

图3-3-7 绘制不规则区域选定钻孔

(六)系统应用情况

系统建成后,先后在多个工程项目的地质信息收集、勘察前期准备、成果编制和周边地质信息补充等方面得到了具体应用,取得了很好的效果。这些工程包括:①深圳市轨道交通四号线二期工程;②深圳市防震减灾信息管理系统工程;③深港西部通道深圳侧接线工程;④深圳市东部沿海高速公路工程;⑤深圳市龙岗区土地储备开发中心北通道市政工程;⑥深圳和记黄埔观澜地产有限公司观澜低密度住宅发展项目。

随着项目中积累的勘探点数据和其他基础地质数据种类和数量的增加,深圳市城市地质勘察信息系统提供的信息将更为详细和准确,其管理应用价值将逐步得到提升。由于系统数据的基础性和代表性,系统所体现的公共服务价值也将逐步得到体现。

2006年,该系统被评为全国优秀地理信息系统工程。

二、“勘察e”数字化勘察作业系统

(一)建设思路

目前国内商业性工程勘察软件基本上在AutoCAD下二次开发完成,对国外软件依赖严重,用户运行成本较大,不利于软件正版化,也不符合国家支持民族软件发展的政策。另一方面,在AutoCAD下开发,所编制的软件必须牺牲很多定制特性,图属交互处理很难实现,不能满足发展的需要。随着近二十年来的技术发展,对工程勘察软件提出了更多、更新的需求,除满足常规的计算机辅助制图功能外,具备综合数据管理和分析能力、GIS应用接口、标准化程度高、可定制、扩展性强的勘察软件将是今后5~10年的主要发展方向。

针对这一形势,完全可以开发出一套有别于传统思路,以城市工程勘察为主要服务对象,通过内建自主知识产权的图形平台,能够完成勘察数据采集和处理,成果输出和管理的专业软件,“勘察e”数字化勘察信息处理软件就是这一思路的具体实现。

深圳市勘察研究单位独立开发的“勘察e”数字化勘察信息处理软件,其特点就是不依赖任何CAD软件,完全自主开发,用户一次性完成正版化,软件开发始于2003年,采用C++Bulider与Visua1 C++进行开发。软件于2004年被列为建设部“2004年重点信息化建设项目”,并于2004年通过建设部科技司组织的专家组鉴定,专家鉴定意见为“国内领先,国际先进”。

(二)“勘察e”CAD绘图平台

“勘察e”包含的自主开发二维CAD平台,是一个功能基本齐备的图形绘制环境(图3-3-8),能够满足工程勘察数据整理和图形输出的功能需求,也能为其他岩土工程应用提供基本的图形支撑环境。

1.绘制图形

“勘察e”CAD图形平台实现了类似于AutoCAD绘图操作的常用绘图功能。包括:绘制直线段、绘制多义线、绘制正多边形、绘制矩形、绘制圆弧、绘制圆、绘制椭圆、绘制样条曲线、绘制多行文本、生成块和填充。

2.编辑图形

“勘察e”CAD图形平台将实现AutoCAD常用编辑图形功能。包括:删除、拷贝、镜像、偏移、阵列、旋转、缩放、裁剪、延伸、分解和排列对齐。

3.浏览功能

“勘察e”CAD图形平台将实现AutoCAD常用的浏览功能,包括:图形窗口的放大、缩小和平移功能。提供多种放大缩小的浏览方式,包括窗口缩放、中心缩放等。

图3-3-8“勘察e”制图环境

4.辅助绘图功能

“勘察e”CAD图形平台提供捕捉、正交辅助绘图功能。捕捉点类型有:端点、中点、圆心、交点、切点、垂直点、象限点和最近点等。

5.交互式绘图

“勘察e”CAD图形平台提供命令行输入和画笔交互的方式绘图。键盘方式可以精确地输入世界坐标,弥补画笔绘图精度不足的缺点。可以ESC键取消当前的命令,也可以Enter键完成当前的命令;辅助绘图命令平移、实时缩放和滚轮缩放不中断当前的绘图、修改命令如:画直线、对象拷贝等;

6.图层管理

“勘察e”CAD图形平台提供图层管理功能。

1)建立多个图层:可以创建多个图层,每个层管理自己所拥有的实体。

2)锁定图层:将指定的图层锁定,无法编辑修改实体。

3)隐藏图层:将指定的图层隐藏,既看不到实体,也无法修改实体。

4)冻结图层:将指定的图层冻结。

5)删除图层:删除指定的图层,图层所拥有的实体也被删除。

6)实体改变图层:改变选择的实体的图层属性。

7.图形文件存取

“勘察e”CAD图形平台提供图形文件存取功能。

1)兼容AutoCAD的DXF文件格式:能够打开和保存DXF文件,暂不处理AutoCAD特有的线型、字体。

2)自定义文件格式“.CAD”:能够以文件流的形式保存为“.CAD”文件,也能够读取“.CAD”文件,并且能够兼容早期版本。

3)图源文件.wmf:能够保存为.wmf文件,但不能读取。

8.打印和打印预览功能

勘察CAD图形平台提供打印和打印预览功能。

1)能够显示当前局域网内共享、可用的打印机。

2)能够显示打印机的基本信息。

3)能够按照对象线宽和对象颜色预览和打印图形。

4)能够按照用户指定的打印样式打印和预览图形,如果同时指定了对象线宽和对象颜色,优先采用对象线宽和对象颜色。

5)能够编辑打印样式并保存为文件,以颜色值来表示打印样式,每个颜色值代表要打印的颜色、线宽和线型,最多能有256个颜色值。

6)能够指定是否按照打印样式预览和打印图形。

7)能够列出当前打印机支持的所有纸张类型。

8)能够指定打印方向:纵向、横向。

9)能够指定打印区域:图形界线、图形范围、当前显示的图形和窗选范围。

10)能够指定打印比例和打印份数。

11)能够指定按照偏移方式打印还是居中方式打印,偏移方式下可以输入相对于纸张左上角的X、Y方向上的偏移距离。

12)批量打印功能,能够批量打印输出。

(三)勘察作业功能

1.数据录入功能

提供各类勘察数据录入功能,及静力触探试验和部分土工试验软件数据直接导入系统的功能。录入界面如图3-3-9所示。

2.专题图生成功能

1)平面图布置图:可根据工程数据自动生成输出勘探点平面位置分布图,根据画笔的点击位置布置勘探点,拖拽勘探点,也可选择勘探点布置剖面线。

2)平面图:按照指定比例和原始录入参数,自动生成输出钻孔平面位置分布图。图面内容包括:钻孔、剖面线等,可叠加任意地形图及地物。

图3-3-9“勘察e”钻孔数据录入界面

3)柱状图:自动生成任意位置地质柱状图等。

4)剖面图:自动或人工划分土层,自动生成工程地质剖(断)面图,内容包括钻探数据,动、静探曲线等原位测试数据,设计标高,基础标高示意等;能够编辑处理多种特殊情况。

界面如图3-3-10所示。

5)等值线图、云图:按多种经典算法(三角网法、格网法等)自动生成地面等高线、各岩土层埋深等值线、各土层等厚线、基岩面等高线、地下水位等高线及其他等值线图等;以画线方式,自由绘制等值线图内外边界,过程直观简单。界面如图3-3-11,图3-3-12所示。

(四)模板定制

软件提供自定义模板功能,并根据模板自动生成图形。不同的单位或公司所绘制的地质勘察专题图的格式有所不同,但完全可以按照自己的要求定制模板;模板的尺寸符合国家图纸尺寸规范(图3-3-13)。

图3-3-10“勘察e”生成剖面图示意

图3-3-11“勘察e”生成云图选项对话框

图3-3-12“勘察e”等值云图生成效果

图3-3-13“勘察e”专题图模板定制示意

1.图形符号管理

系统提供自定义符号的功能。符号是有特定意义的图形块,用来生成专题图;除了系统自带的符号外,用户可以自由扩充自己的符号(图3-3-14):

1)能够将本系统中的任何图形保存为符号,并可以将符号分类显示。

2)可以将任何符号以一定的比例直接拖拽到图形中。

3)可以编辑和删除符号。

2.勘察报告生成

提供自动生成工程勘察报告初稿,自动完成土工试验、水质分析、原位测试的统计与分析。

3.辅助工程设计

提供浅基础沉降计算、桩基承载力及沉降计算功能(图3-3-15)。

(五)三维可视化功能

系统采用OpenGL技术和三维格网插值算法,实现了对地层层面三维空间分布进行模拟显示的功能。并且能够通过鼠标控制地层层面模型进行缩放、旋转等观察,以及输出视图为图形文件等功能(图3-3-16)。

图3-3-14“勘察e”的符号管理功能

图3-3-15“勘察e”的辅助计算分析对话框

有关数据的导入导出,目前“勘察e”软件能够对勘察项目数据文件整体导入到深圳市城市勘察信息系统中,同时也能够接收和打开深圳市城市勘察信息系统导出的项目数据文件。

“勘察e”网络版和单机版勘察项目数据也能够以文件整体导入导出方式进行无损交换。

图3-3-16“勘察e”三维地层层面分布模拟

(六)系统应用

目前该软件已经广泛应用于深圳及国内多个地区和单位的勘察与内部作业的生产业务,经过了“深圳市轨道交通四号线二期工程”等大型勘察项目检验,取得了很好的应用价值。

该软件还不断根据应用中实际的需求,进行持续完善升级

三、边坡工程三维可视化设计

1.概述

目前边坡支护工程设计普遍是采用二维图纸,按平面、立面加剖面的三视图设计表达的方式,由于边坡往往并不是一个空间上简单的“平面”,原始地形更是一个非常不规则的空间曲面。传统二维设计只能对上述问题进行粗略概念性的表达,无法准确地刻画支护前后的形态。不但工程量算不准确,造成预算与实际费用的偏差,也可能由于设计条件不准确,造成支护不足或过度,形成安全隐患或工程浪费。

另外,永久性边坡工程景观问题越来越得到重视,在确保安全的同时,建设工程要求边坡设计能环保美观,甚至起到景观装饰作用。用传统三视图方式,对于复杂边坡的坡面规划定位,不但费时费力,往往误差也非常严重。而且经常发现部分边坡坡面线条怪异,格构梁扭曲难看,很大程度上都是因为二维设计图表达不清、深度不够、定位不准、不能指导和约束施工的原因。

采用三维可视化边坡设计,是指采用三维空间建模技术,建立准确的边坡三维模型,在此基础上进行支护结构布置和计算分析的新一代设计方法。它可以消除传统二维设计用于复杂边坡的许多不足,深圳市勘察研究单位在这方面做了较多有效的尝试。

2.工作成果

在M icroStation平台下,开发完成了边坡三维可视化建模系统,具体实现功能如下:①通过地形图实现三维原始地形的建模;②通过钻孔信息,可以模拟三维地层空间发布规律;③模拟结构面空间产状和分布规律;④实现三维开挖模拟和土石方量算;⑤边坡支护结构的三维环境下的布设和工程量统计。

系统在空间建模基础上,还将逐步发展三维景观设计和展示、稳定性计算分析等功能。边坡可视化设计模拟效果如图3-3-17,18,19所示。

图3-3-17 钢筋砼格构梁支护方案三维建模效果

图3-3-18 锚杆钢筋砼格构梁系统三维模型(1)

图3-3-19 锚杆钢筋砼格构梁系统三维模型(2)

⑶ 国际地质信息技术的发展方向

计算机技术、数据库技术、网络技术、虚拟技术等现代化技术深入应用到了地学众多专业领域,已经由解决某一方面的问题发展到解决从数据采集、数据管理、分析处理、成果表示直至信息服务的全过程信息化问题,为资源勘查、气候变化、环境保护、灾害预警等与人类活动息息相关的各项科学研究与应用带来了革命性的进步,让大气圈、生物圈、水圈、岩石圈信息的交叉融合研究成为了可能。同时,地学信息产品服务打造的信息产品由分散的、专题性的数据扩展到了多专业、多领域、多维次、多形式的集成产品,使数字化知识的开发、整合与应用成为信息技术服务于人类与环境变化的焦点。归结起来,目前国际地学信息研究的热门领域主要有以下四个方面。

(1)“OneGeology计划”推动全球地学数据共享

英国地质调查局于2006年发起了“OneGeology 计划”,其目标是创建一个动态的全球电子地质数据库,为各国提供并开放已有的不同电子格式地质数据,通过开发并使用网络标记语言GeoSciML,促进国际地学数据互联互通。该计划由众多国家和国际组织合作开展。全球参与的国家中有60个国家提供数据服务,通过门户网站可以访问提供服务的数据目录。今后,如何在全球倡导地学数据共享理念、获得相关政府的支持与合作,推动地学数据的全球化无偿共享,达到百万比例尺地质图数据的浏览,进而实现更大比例尺、更多专业内容数据的浏览、下载等服务,将是“OneGeology计划”需要尽快解决的问题。

(2)各国都在重视地学空间数据基础设施建设与应用

无论是发达国家还是发展中国家,地学空间信息成为社会公众和政府决策的重要支撑数据,在资源环境、地质灾害、气候变化等方面有着巨大的社会需求和应用潜力,地学数据积累、共享、分发和应用已成为各国地调机构的基本职责和常态化工作。各国非常重视基础地学数据的积累、分布式数据集成与共享、数据资源开发应用和网络数据应用服务。欧盟与美国以立法的方式保障地学空间数据基础设施建设与应用的可持续发展。目前,发达国家基本完成了地学空间数据的原始积累,各国地学空间数据库基础设施向着数据产品多元化、应用服务便捷化、操作简单化、共享全球化的方向发展。特别是基于网络、云计算等新技术在分布式数据共享、服务平台建设、多学科信息融合等方面,引领了国际地学空间基础设施建设与应用的方向。

发展中国家地学空间数据基础设施建设,相对集中于海量数据资源积累与数据资源开发应用系统建设,在数据采集、大型数据库综合管理、数据共享与交换、网络服务、分析应用等方面,为公众提供公益性服务。

(3)三维地学信息产品日益增加,推动了地学知识的全面普及

3D技术在地学领域的应用是近些年的热点,主要集中在三维模型构建、三维可视化表达、三维地质填图等技术方法的研究、软件工具开发与应用。3D模型极大地扩展了2D地质图的信息含量,可以清晰展示地下结构构造,地质体360 °全景显示,可以让用户无需进行复杂的培训就能直观地看到地下的地质情况;模拟的地下模型有助于对地下地质和环境的关系进行判别,为决策者制定规划提供更清晰的依据。

当前,澳大利亚发布了三维高光谱矿物系列图——ASTER地图,这是世界上首次发布的大洲级别的地表矿物填图成果,可以在线浏览和下载。英国地质调查局则在国际地学领域三维IE技术的应用中引领了潮流,从3D模型浏览显示深入到了3D模型的分析,进而将用户由专业人员普及到普通大众,移动终端的iGeology 3D智能系统的推广更是让三维地质延伸到了普通公众的日常生活。德国GiGainfosystems UG利用WebGL技术实现了基于网络的3D模型可视化表达与交互式操作,多个用户可同时对模型的不同部分进行编辑。

(4)物联网、大数据等高新技术正逐步融入地质领域

进入21世纪,信息技术创新步伐仍未减慢,并且向高速、大容量、网络化、综合集成化方向发展的势头更加迅猛。同时,通信、光学、微机械、认知科学、传感技术等多学科相互交叉,涌现出物联网、云计算、大数据等新技术、新理念,正孕育着新的重大突破。信息技术的迅猛发展正深刻地改变着信息化发展的技术环境与条件。

1999年物联网这个概念一经提出,在传感器产业、RFID产业、通信产业等的标准化、数据存储、数据处理、智能分析及预警等多方面取得了显著进步与成果,大部分技术趋于成熟或基本成熟,相关产品已应用到智能交通、物流、军事、灾害防治等领域。美国、英国等早已开始使用具有物联网特性的地质测量、矿产开采监测、地震监测、地质灾害监测等设备,并已逐步向规模化、产业化发展。以2011年日本福岛地震预警为例,日本通过对各类地震传感器采集数据的分析,提前数十秒预警了福岛7.0级地震,避免了巨大的损失。

在物联网(Internet of Things)、云计算(Cloud Computing)、移动互联网等技术进步的推动下,数据发生了“大爆炸”,其规模呈几何级数上升,已跨入以ZB为基本计算单位(1ZB=1024 EB=1024×1024 PB=1024×1024×1024TB)的大数据(Big Data)时代。“开采”大数据以挖掘其内部蕴藏的“富矿”成为研究焦点。各国均非常重视大数据技术的发展,科技界、学术界、政府把它看成是一座可能挖掘出巨大财富的“金矿”“富矿”,均在寻找面向大数据的有效技术分析手段(如大数据分析、大数据集聚类分析、海云数据分析等)。

⑷ 美国地质调查局出版物管理办法及其借鉴意义

王海华

(中国地质图书馆北京100083)

摘要出版物凝聚了地调机构工作成果的精华,是地调机构社会化服务体系的重要组成部分。本文通过分析美国地调局出版物及其管理方法,借鉴其严谨、先进的管理理念,对中国地质调查局出版物管理提出了三点建议。

关键词出版物成果管理

出版物凝聚了地调机构工作成果的精华,是地调机构社会化服务体系的重要组成部分,在传播推广地学知识、政府决策制定、国际学术交流等方面发挥了重要作用。2007年,中国地质调查局在认真贯彻落实《国务院关于加强地质工作的决定》时,明确提出了建设世界一流地调局的奋斗目标。目前,美国地质调查局(USGS)是世界公认的自然科学领域的领跑者,本文从USGS成果出版物的管理角度,剖析其先进的管理理念和方法,旨在为我们建设世界一流地调局的出版物管理方面提供一点参考。

1 美国地质调查局出版物

USGS是美国内政部唯一的一个自然科学研究机构。他的主要任务是管理、研究国家水资源、能源、生物、矿产资源;及时为国家提供可靠的地球科学信息;减少自然灾害导致的生命和财产损失;提高人们的生活质量。USGS以内容丰富、形式多样的出版物为桥梁,向社会输送其高质量的地球科学研究成果,基本满足了美国社会各界的需求。

USGS出版物既包括快速出版的非正式报告、高度严谨的专业论文、科学报告,也有面向大众的科普宣传读物;载体形式既有印刷版、也有光盘和网络在线版。出版物按出版频率分为出版系列、期刊和特例三类。

表1是USGS现在仍在发行的出版物。序号1-10是不定期出版的系列,每个系列没有具体的学科专业方向,但根据读者对象与出版目的不同,分为科学与技术信息类、宣传教育类。科学与技术信息类又根据内容的科学性、完整性、地域性、数据与方法分为若干系列,如Professional Paper与Scientific Investigations Report同属科学与技术信息,但前者刊载内容的科学和地理范围就比后者宽泛;又如Data Series主要刊载基本数据集、数据库、多媒体;而Techniques and Methods则刊载关于科学数据的采集、分析和编制程序的技术或方法。总之,这些系列的内容几乎囊括了USGS与地学相关的全部工作。序号11-20是定期出版的期刊,均由专门部门完成,不是对外征稿型出版物。如序号11-15全部是USGS矿产信息团队的日常工作成果。该类各系列具有明显的学科性,如单独的水资源统计报告、震中的初步确定。序号21是独立于前面系列和期刊外的出版物,这类出版物非常少,应属特例,因为USGS鼓励且要求职员尽可能地把工作成果发表在系列之内。

表1 美国地质调查局出版物

2 美国地质调查局出版物管理特点

2.1 完善的制度保障

依法管理、按制度、按程序管理是USGS管理出版物的一大特色。USGS对地调成果的出版管理可以追溯到该单位成立之初。USGS信息产品出版发行的方法和标准在其手册和若干规章制度中都有体现。其中,对各类型出版物出版的过程作了全面且详细的规定,包括编制产品出版计划、产品创意至出版全过程的经费预算、产品内容及形式的同行评议、审批和发布、产品的作者、荣誉和致谢、产品中有版权资料的使用规定、产品的发行、销售、存档等。

2.2 目标明确、规划清晰

出版物是地调局社会化服务的重要媒介,为满足不同群体的需求,USGS根据读者对科学的需求程度,定义了核心专家、非核心专家、普通大众和USGS职员4种读者对象类型。核心专家是指USGS内部和外部的地球科学家。外部科学家代表其他州和国家的科学机构,非政府的科学研究组织,国际学术团体、科研机构和工业界的科学家。USGS科学家是面向这一类型读者的出版物的主要作者;非核心专家是指管理者和那些知识渊博、但不是最重要的地球科学家,他们经常是一些政策的决策者。这一类型读者通常代表的是国会、其他州和国家的政府部门、立法部门及一些非政府组织,该类型读者需要综合过的技术信息。这类出版物的作者通常是由科学家和技术专家组成的团队;普通大众,包括教师、学生、新闻媒体、自然爱好者及任何喜欢研究地球科学的人。该类作品通常使用大众语言编写,插图清晰。这类出版物通常由科学家和作家、编辑、设计者一起准备编写。

确定了读者对象,USGS又依据出版科学与技术信息还是科普读物等不同目的,将出版物划分为11个系列,并且为每一系列制定了严格的出版规划(表2)。

表2 Professional Paper的出版规划

表2是USGS出版物Professional Paper系列的出版规划。该表从读者对象、出版目的、内容、出版频率、载体形式、编辑评审、审批、发行、销售及存档等20个方面对系列作出了要求和相关规定。根据此表,可以清晰地看出USGS对出版物严格的定义和规划。

2.3 全程支持服务

在整个出版活动中,USGS采取了地区分部、学科分部、对外交流宣传推广部等多层次协调管理体系和出版编辑全过程支持服务。各级管理主体负责信息产品生命周期中相关内容的工作。出版编辑在USGS出版过程中扮演重要角色,他们与USGS总部和各地区的报告专家一起工作,帮助他们怎样使构思获得批准,怎样设计指南,怎样发行,以确保产品对读者对象产生最大影响,使有限的资金发挥最佳的效益。此外,还编写了专门的《对美国地质调查报告作者的建议》,这份在1909年即已问世,已经修订到第七版的建议书旨在为USGS出版的地质报告和地图等提供写作指南,其特色是详细地说明了地质图的准备与出版,以及地名、地层名称和各类地质专业(矿物、岩石、古生物)术语的使用等内容。

2.4 重视新技术、新方法在出版物管理中的应用

USGS为能够快速高质量的出版科研成果,非常重视新技术、新方法在出版物管理中的应用。随着信息网络技术迅猛发展,出版物载体形式出现多样化,印刷版、电子版、网络版等等,应有尽有。出版物管理方式现代化,USGS设计有专门的管理工具Visual Identity System(VIS)系统,该系统包括USGS标识、沟通平台、产品设计模版、产品规范、印刷版式及颜色模版等多个管理工具;此外设计了专门的正式报告编码系统,对所有出版物按序列统一编码,便于查询、检索、利用和存档。

2.5 强调视觉风格一致,提升USGS的影响力

USGS鼓励职员出版其科学调查成果和科学发现,以不断提升该局的科学声望。为此,USGS要求所有科学、情报、宣传及标识产品,如印刷及电子出版物、网页、展览品、报告幻灯片,甚至商务卡片、教育资料及交通工具和设备都必须使用VIS系统,以统一风格,并专设部门负责监督管理。强调规范、统一的使用机构标识和一致的版面风格,不仅使USGS的形象突出,引起了公众的重视,加深了公众对USGS的印象,同时也保护了知识产权,扩大了USGS的影响。

3 借鉴意义

USGS对出版物实施的全面规划与管理,不仅保证了出版物的质量,更重要的是高效、公平、系统地向社会各界提供了地质调查成果,由此提升了该局在国内外的声望。相比之下,我国地调局出版工作还处于单兵作战、分散甚至重复的状态,出版物内容编审、版面设计、营销等活动仍然依靠各直属单位自己负责,在局系统内没有统一规划、形成体系,没有形成出版物的品牌效应。当前这种管理模式,不仅不能统一管理公开出版的地调成果,实时掌握局系统工作人员学术成果出版动态;更重要的是不能推出持久的、科学的、有影响的产品来宣传和提升中国地质调查局的声望与地位。

地调成果出版物是显示中国地质调查局的科研水平与社会化服务的能力重要指标之一,随着经济社会的发展,社会各界对地质成果的需求与日俱增。本文立足我国地质调查局出版物的现状,借鉴USGS管理出版物的一些经验,对我国地质调查局出版物的管理提出如下建议:

3.1 建立局系统出版物统一管理体系

目前中国地质调查局科研成果出版物可以分为局内部出版物和公开出版物两类,后者包括局直属单位主办的期刊,以及局属科研工作者在国内外期刊、会议上发表的文章和出版的专著。根据我国新闻出版管理的实际情况,如果对局属期刊做大规模、大范围、深度的调整有很大难度,我们不妨先从管理那些无序出版物(专著、论文集等)和内部出版物着手调整:

(1)根据决策者、专业读者、投资者和普通大众等可能的读者类型、出版物内容等因素设计若干系列,如:科学论文系列、科普系列、地图系列、数据系列、快报系列、地调局书目通报系列等。以上系列都应制定具体的要求、规范标识、风格(颜色版式等)、内容范围、出版频率、载体形式、编辑评审、审批、发行、销售及存档等问题。

(2)建立统一编码系统和文献数据库系统,集中管理成果。统一编码系统负责给所有计划内部或公开出版的文章、专著分配一个唯一的编码;文献数据库根据编码信息负责收录所有出版物信息,建立地调局自己的科研成果文献库。这样,通过统一编码和建立数据库,就可以把中国地质调查局的所有出版物统一到一个平台上,进行全面管理。

通过出版物统一管理体系,实现对局系统出版物的全面管理;实现对出版物的动态监控;为对各单位、科研项目、科学家进行评估提供依据;集成地调局的科研成果信息,建立中国地质调查局科研成果文献数据库。通过中国地质调查局网站向社会提供服务,向世界展示我国地质调查局的科研成果和科研水平。

3.2 建立相关工作制度

建立局系统出版物统一管理体系涉及局和所属的各个单位,环节多,琐事多,需要多个部门协调负责,为保障出版物管理工作的顺畅,防止工作出现分散、重复,必须制定翔实可操作的相关规章制度和工作程序,确保工作各环节有章可依、有序开展。制度和流程的内容应该包括统一管理体系的主要工作环节和责任部门、工作的基本程序、资金预算及使用等。

3.3 使用现代技术手段为管理提供支持

依托先进的信息网络技术,开发统一管理体系平台,为管理工作创造便捷条件,提高管理水平。平台由出版物设计系统、统一编码系统、科技成果文献数据库制作和发布系统构成。不同系统支持管理工作的不同环节,比如出版物设计系统主要帮助计划出版文献的作者根据出版目的,选择读者类型,进而确定载体形式、发行范围等一系列问题;而统一编码系统则负责根据出版物选择的出版渠道,发放编码;数据库不仅要负责建库和维护工作,还要定时或根据需要提供科研成果的统计信息。

参考文献

htp://www.usgs.gov/pubprod/美国地质调查局网站

http://www.gapp.gov.cn/cms/html/21/396/List-1.html中华人民共和国新闻出版总署

⑸ 大数据下的地质资料信息存储架构设计

颉贵琴 胡晓琴

(甘肃省国土资源信息中心)

摘要 为推进我国地质资料信息服务集群化产业化工作,更大更好地发挥地质资料信息的价值,本文针对我国现有的地质资料信息集群化共享服务平台存在的缺陷和问题,基于现有系统的存储架构,设计了一种大数据下的地质资料信息存储架构,以便于我国地质资料信息服务集群化产业化工作能够适应大数据时代的数据存储。

关键词 大数据 地质资料 存储 NoSQL 双数据库

0 引言

新中国成立60多年来,我国形成了海量的地质资料信息,为国民经济和社会发展提供了重要支撑。但在地质资料管理方面长期存在资料信息分散、综合研究不够、数字化信息化程度不高、服务渠道不畅、服务能力不强等问题,使地质资料信息的巨大潜在价值未能得到充分发挥。为进一步提高地质工作服务国民经济和社会发展的能力,充分发挥地质资料信息的服务功能,扩大服务领域,国土资源部根据国内外地质工作的先进经验,做出了全面推进地质资料信息服务集群化产业化工作的部署。

目前,全国各省地质资料馆都在有条不紊地对本省成果、原始和实物地质资料进行清理,并对其中重要地质资料进行数字化和存储工作。然而,由于我国地质资源丰富,经过几十年的积累,已经形成了海量的地质资料,数据量早已经超过了几百太字节(TB)。在进行地质资料信息服务集群化工作中,随着共享数据量的不断增大,传统的数据存储方式和管理系统必然会展现出存储和检索方面的不足以及系统管理方面的缺陷。为了解决该问题,需要设计更加先进的数据存储架构来实现海量地质资料的存储。

而大数据(Big Data)作为近年来在云计算领域中出现的一种新型数据,科技工作者在不断的研究中,设计了适合大数据存储管理的非关系型数据库NoSQL进行大数据的存储和管理。本文将针对我国现有的地质资料信息集群化共享服务平台存在的缺陷和问题,利用大数据存储管理模式的思想,提出一种海量地质资料存储架构,改进现有系统存储架构,以便于我国全面推进地质资料信息服务集群化产业化工作。

1 工作现状

1.1 国内外地质资料信息的存储现状

在美国,主要有两大地质资料公共服务平台,分别是地球科学信息中心(ESIC)、地球资源观测和科学中心(EROS),其目的是通过为社会和政府提供更加便利、快速的地质信息服务。20世纪90年代初,澳大利亚出台了国家地球科学填图协议,采用先进的科学方法和技术进行数据存储,从而形成了第二代澳大利亚陆地地质图。

目前,我国地质资料信息服务集群化产业化工作刚刚起步,虽然国土资源部信息中心已经开发了地质资料信息集群化共享服务平台,并倡导各地方用户使用该系统。但由于各个地方早期的工作背景不一致,因此各地方所使用的存储系统也不尽相同,主要有Access、SQL Server、Oracle、MySQL等系统。本文以国土资源部信息中心开发的地质资料信息集群化共享服务平台的存储系统MySQL为例说明。该系统是基于关系数据库管理系统MySQL的一套分布式存储检索系统。该系统的部署使得我国地质资料信息服务集群化产业化工作取得了重大进展,同时也为我国建立标准统一的地质资料信息共享服务平台和互联互通的网络服务体系奠定了坚实的基础。然而,该系统的研发并没有考虑到地质资料信息进一步集群化以及在未来地质资料信息进入大数据时代的信息共享和存储管理问题,也没有给出明确的解决方案。

1.2 大数据的存储架构介绍

大数据是近年在云计算领域中出现的一种新型数据,具有数据量大、数据结构不固定、类型多样、查询分析复杂等特点。传统关系型数据库管理系统在数据存储规模、检索效率等方面已不再适合大数据存储。NoSQL(Not Only SQL)是与关系数据库相对的一类数据库的总称。这些数据库放弃了对关系数据库的支持,转而采用灵活的、分布式的数据存储方式管理数据,从而可以满足大数据存储和处理的需求。NoSQL基于非关系型数据存储的设计理念,以键值对进行存储,采用的数据字的结构不固定,每一个元组可以有不一样的字段,且每个元组可以根据自己的需要增加一些自己的键值对,可以减少一些检索时间和存储空间。目前,应用广泛的 NoSQL 数据库有 Google BigTable、HBase、MongoDB、Neo4 j、Infinite Graph等。

2 大数据下的地质资料信息存储架构设计

根据国土资源部做出的全面推进地质资料信息服务集群化产业化工作的部署,国土资源部倡导全国地质资料馆使用国土资源部信息中心开发的地质资料信息集群化共享服务平台,实现地质资料信息的存储和共享。该系统采用了数据库管理系统MySQL作为数据存储系统。

为了与现有系统和现有的工作进行对接,并为将来地质资料进入大数据时代后的存储工作做准备,本文设计了一种能用于海量地质资料信息存储并且兼容MySQL的分布式的数据存储架构(图1)。

整个系统可以根据不同的用户等级分为不同的用户管理层,由于图幅限制,在图1 中仅仅展示了3级:国家级管理层(即共享服务平台用户层)、省级管理层以及市级管理层(可根据实际需要延伸至县级)。

每级管理层的每个用户可以单独管理一个服务器。如国土资源部信息中心可以单独管理一个服务器;甘肃省国土资源信息中心可以单独管理一个服务器,陕西省国土资源信息中心可以单独管理一个服务器;甘肃的若干个市级国土资源局可以根据需要分别管理各自的服务器。

在服务器上分别安装两套数据库管理系统,一套是原有的MySQL数据库管理系统,另一套是为大数据存储而配备的NoSQL型数据库管理系统。在服务器上还专门开发一个数据库管理器中间件,用于进行用户层和数据库的通信以及两套数据库之间的通信。

由于各个管理层都各自维护自己的数据库和数据。当用户需要进行数据存储时,他所影响的数据库仅仅是本地数据库,存储效率较高;当用户需要从多个数据库读取数据时,顶层的共享服务平台会根据用户需求进行任务分解,将任务分发给下层的管理层进行数据库读取,由于各个数据库并行读取,从而提高了数据库读取效率。

图1 大数据下的地质资料信息存储架构框图

2.1 用户管理层

用户管理层根据权限范围,分为多层(本文以3层为例)。

位于顶层的国家级管理层(共享服务平台用户层)负责用户访问权限的分配、与其直接关联的数据库的访问、下级管理层任务的分配等工作。

用户访问权限的分配是指为访问本共享服务平台的个人用户和单位用户分配数据的使用权限、安全性的设计等。

与其直接关联的数据库访问是指直接存储在其本地数据库上的数据的访问。在该数据库中不仅要存储所需要的地质资料,还要存储注册用户信息等数据。

下级管理层任务分配是指如果用户需要访问多个下层数据库,用户只需要输入查询这几个下层数据库的命令,而如何查找下层数据库则由该功能来完成。例如某用户要查找甘肃、陕西、上海、北京的铁矿分布图,则用户只需要输入这几个地方及铁矿等查询条件,系统将自动把各个省的数据库查询任务分派到下级管理层。

同理,位于下层的省级管理层和市级管理层除了没有用户访问权限功能外,其余功能与国家级管理层是相同的。各层之间的数据库通过互联网相互连接成分布式的数据库系统。

2.2 MySQL和NoSQL的融合

MySQL是关系型数据库,它支持SQL查询语言,而NoSQL是非关系型数据库,它不支持SQL查询语言。用户要想透明地访问这两套数据库,必须要设计数据库管理器中间件,作为用户访问数据库的统一入口和两套数据库管理系统的通信平台。本文所设计的数据库管理器简单模型如图2所示。

图2 数据库管理器模型

服务器管理器通过用户程序接口与应用程序进行通讯,通过MySQL数据库接口与MySQL服务器通讯,通过NoSQL数据库接口与NoSQL数据库接口通讯。当应用程序接口接收到一条数据库访问命令之后,交由数据库访问命令解析器进行命令解析,从而形成MySQL访问命令或者NoSQL访问命令,通过相应的数据库接口访问数据库;数据库返回访问结果后经过汇总,由应用程序接口返回给应用程序。

两套数据库可以通过双数据库通信协议进行相互的通信和互访。此通信协议的建立便于地质工作人员将已经存入MySQL数据库的不适合结构化存储的数据转存到NoSQL数据库中,从而便于系统的升级和优化。

2.3 系统的存储和检索模式

在本存储框架设计中,系统采用分布式网络存储模式,即采用可扩展的存储结构,利用分散在全国各地的多台独立的服务器进行数据存储。这种方式不仅分担了服务器的存储压力,提高了系统的可靠性和可用性,还易于进行系统扩展。另外,由于地质资料信息存储的特殊性,各地方用户的数据存储工作基本都是在本地服务器进行,很少通过网络进行远程存储,所以数据存储效率较高。

在一台数据库服务器上安装有MySQL和NoSQL型两套数据库管理系统,分别用于存储地质资料信息中的结构化数据和非结构化数据。其中,NoSQL型数据库作为主数据库,用于存储一部分结构化数据和全部的非结构化数据;而MySQL数据库作为辅助数据库,用于存储一部分结构化的数据,以及旧系统中已经存储的数据。使用两套数据库不仅可以存储结构化数据而且还可以适用于大数据时代地质资料信息的存储,因此系统具有很好的适应性和灵活性。

2.4 安全性设计

地质资料信息是国家的机密,地质工作人员必须要保证它的安全。地质资料信息进入数字化时代之后,地质资料常常在计算机以及网络上进行传输,地质资料信息的安全传输和保存更是地质工作人员必须关注和解决的问题。在本存储架构的设计中设计的安全问题主要有数据库存储安全、数据传输安全、数据访问安全等问题。

数据库设计时采用多边安全模型和多级安全模型阻止数据库中信息和数据的泄露来提高数据库的安全性能,以保障地质信息在数据库中的存储安全;当用户登录系统访问数据库时,必须进行用户甄别和实名认证,这主要是对用户的身份进行有效的识别,防止非法用户访问数据库;在对地质资料进行网络传输时,应该首先将数据进行加密,然后再进行网络传输,以防止地质信息在传输过程中被窃取。

3 结语

提高地质资料数字化信息化水平,是国外地质工作强国的普遍做法。为推进我国地质资料信息服务集群化产业化工作,本文针对我国现有的地质资料信息集群化共享服务平台存在的缺陷和问题,利用大数据存储管理模式的思想,基于现有系统的存储架构,设计了一种大数据下的地质资料信息存储架构,以便于我国地质资料信息服务集群化产业化工作能够适应大数据时代的数据存储。该存储架构的设计只涉及了简单模型的构建,具体详细复杂的功能设计和软件实现还需要在进一步的研究工作中完成。

参考文献

[1]吴金朋.一种大数据存储模型的研究与应用[D].北京:北京邮电大学计算机学院,2012.

[2]吴广君,王树鹏,陈明,等.海量结构化数据存储检索系统[J].计算机研究与发展,2012,49(Suppl):1~5.

[3]黄

,易晓东,李姗姗,等.面向高性能计算机的海量数据处理平台实现与评测[J].计算机研究与发展,2012,49(Suppl):357~361.

⑹ 浅析大数据时代的地质资料管理

杜艳玲

(中石油勘探开发研究院资料中心)

摘要 长期以来,文字描述地质资料是记录地质信息的有效载体。随着大数据时代的来临,地质资料海量数据的发现与提取难度加大,地质资料信息化发展面临着二次开发与知识服务的新挑战。本文就地质资料管理的现状、管理中存在的问题进行了分析探讨,并就如何做好大数据时代的地质资料管理工作做了有益的探讨并提出了4个方面的意见和建议。

关键词 大数据 地质资料 信息化 二次开发

地质资料是地勘单位记录历史地质信息的有效载体,是工作得以有效实施的有力保障。随着社会发展进步及地质勘探技术的成熟,地质资料管理工作任务量越来越大。如何在大数据时代背景下完善地质资料的信息管理,成为所有档案工作者迫切需要解决的问题。

1 地质资料管理的现状

1.1 地质资料互相封闭

随着经济建设的快速发展,勘探开发专业人员对地质资料的需求量不断增大,但是由于大部分地质资料属于内部管理资料,只用于级别较高且承担着较大科研任务的项目使用,部分单位甚至为获取自身利益互相封锁资料,导致地质档案无法得到有效的利用。

1.2 地质资料的开发利用与资料保密处理不当

《地质资料管理条例》第十四条规定:地质资料馆和地质资料保管单位,应当建立地质资料的整理、保管制度,配置保存、防护、安全等必要设施,配备专业技术人员,保障地质资料的完整和安全。第十九条规定:地质资料馆和地质资料保管单位应当按照规定管理地质资料,不得非法披露、提供利用保护期内的地质资料或者封锁公开的地质资料。地质资料是地质工作价值的集中体现,当它实现项目所需的第一价值之后,一般就进入馆藏机构进行存储。但是地质资料还有后续价值,地质资料所承载的信息资源可以多次、长期、反复地开发利用。这样,一些国家保密矿种,国家规划矿区的地质资料一方面具有保密性,一方面又有开发利用的需求,这种矛盾显而易见。既不能一味强调保密,也不能无视《保密法》等相关规定,擅自开发利用,造成泄密。如何处理好利用与保密的关系、如何做到借阅有法可依、借阅有章可循,成为摆在所有档案工作者面前的一个难题。

1.3 地质资料的二次开发和深度开发效率较低

大量的地质资料源于长期勘探过程中的积累。如何发现已有资料的内部价值,以便延长其使用寿命,是摆在我国地矿工作者面前的紧迫任务,也是一项新的挑战。但是由于研究经费短缺、过去和现在成藏理论的限制、不同研究者研究角度不同结论不同等问题,使得我国地质资料二次开发利用率很低。据不完全统计,全国保存的非纸质介质地质资料,共有磁盘34.4万盒,磁带294.4万盒,胶片9.1万片[1]。但是由于有关人员对地质资料二次开发利用的重视程度不够,经费、人员也没有相应的落实,从而经验做法总结不够,没有形成对地质资料二次开发、深入开发的良好氛围。

2 地质资料管理面临的挑战

2.1 海量数据的提取面临新的挑战

在信息爆炸的今天,数据已经渗透到世界的每一个角落,且数据总量增长迅猛。据预测,未来每18个月,整个世界的数据总量就会翻倍,到2020年,世界的数据总量将会增长44倍[2]。以中石油勘探开发研究院为例,自1991年成立以来,已经累计积累了勘探开发资料71万件,其中包括探井36384口、生产井19617口井资料,以及研究院的各类档案92798万份,馆藏档案133186卷、786071件。面对不断丰富的馆藏资源,如何在海量的数据中快速而准确地检索到所需的信息,如何将档案资源转化为知识资源,传统的档案管理模式已经不足以满足工作需要。大数据时代的来临增加了地质资料寻找与提取的难度。

2.2 地质资料面临知识服务的挑战

大数据时代的资料用户已经不满足仅局限于数据或是文件的利用,而是希望能够获得数据背后的信息以及信息蕴藏的知识。与传统档案馆(室)藏资源或者其他应用相比,大数据时代下数字档案馆藏数量具有媒体形式多、数据量大的特点,大数据时代的用户需求变得更加个性化、多样化。特别是近年来,随着国际油价的持续攀升,矿权市场持续升温,地质资料的开发利用需求旺盛,地质资料管理人员转变为信息的咨询者和系统的服务者,这些都给地质资料的服务带来了挑战。

3 如何加强地质资料的管理

3.1 加强网络信息化建设

加强建设地质资料网络信息化建设,是提高地质资料利用率的有效途径。建立网络信息化可以实现声音、图像以及文字等多种形式的信息进行统一的处理、存储,改变了传统的地质资料信息管理只能着眼于纸张文字的单一表现形式,呈现给地勘人员更加丰富多彩的地质资料编研形式,提供了更加丰富鲜活的地质档案信息[3]。用微机对档案进行收集、筛选、加工,使之转化为微机软件形式的二次文件信息,从而作为电子文件数据提供利用。把纸质资料数据文件归档电子化,充分利用计算机、扫描仪,建立全文数据库,以便存储查找和利用,这既是地质工作现实的要求,也是档案管理的必然取向[4]

对地质资料进行现代化信息建设可以很好地实现资料的详细记录,可以为以后的相关决策提供有力的依据,在很大程度上避免了由于突发性事件或是蓄意破坏而发生的资料丢失现象。对地质资料进行信息化建设可以远程服务实现对地质资源的共享,在编纂地质文档资料的时候可以有效地缩短对地质文献信息及地质文档编著的时间,更快、更好地提高现代地质资料信息的利用率。

3.2 建立地质资料目录检索数据库

大数据时代提供了海量的数据,如何在最短的时间内最快地检索到需要的数据,成为摆在所有档案工作者面前的一大挑战。地质资料目录检索数据库很好地解决了这一问题。国土资源部出版了《地质资料档案著录细则》,对如何著录地质资料进行了详细指导。数据检索系统智能化程度很高,可以根据使用者的需求,输入任意关键词,例如资料名称、井名、勘查程度、矿种或是几个关键词的组合,均可以从数据库中检索出有关的地质资料信息,方便快捷地为地勘人员提供服务。

3.3 拓展地质资料开发利用的方式方法

技术水平直接影响服务的效率和质量,大数据为地质资料的开发利用提供了很好的平台。拓展地质资料的开发利用方式要充分利用现代化服务手段,提升现代化服务水平。重视现代地质资料服务系统、技术和标准的开发,力争在系统交换和传输技术、新方法、新手段上下功夫,推进地质资料的整合和共享。同时加快内网外网和电子政务平台的建设,加强行业和部门互动,形成多层次、多部门社会化服务网络系统,实现地质资料的开发利用和信息共享。同样重要的是,要同步更新离线服务和在线服务方式方法,提升服务效率。离线服务要突出数据加工和介质拷贝服务,在线服务要提供数据检索和下载服务,配合电子邮件、传真、电话等形式,为用户答疑解惑,提供信息服务[5]

3.4 加强地质资料的二次开发和深度开发

《国务院关于加强地质工作的决定》明确提出将“推进地质资料开发利用”作为新时期地质工作六大任务之一,充分体现了党中央、国务院对地质资料工作的高度重视,反映了经济社会发展对地质资料信息的迫切需求。地质资料具有形成成本高、应用范围广、可反复利用、经济社会效益潜力巨大等特点。地质资料的属性特征,决定了其直接价值和潜在价值远远大于其投资成本,决定了其反复永续利用的潜力。

地质资料的二次开发,绝不仅仅是对现有的地质资料进行第二轮简单的整理、归纳,而是以最新的找矿理论、技术和方法为指导,以改革创新的精神对原有的地质资料进行有效而又合理的加工、整理、归纳和总结,提炼出具有重要价值的信息资源。根据利用者的需求,组织相关的工作团队,通过人、财、物的投入,提高地质档案社会化服务附加值,从而推动地质资料的产业化[5]

2003年英国地调局运用成本效益分析法和增值法对其经济效益进行了评估,结果表明:英国地调局在2001年为英国所做的贡献相当于其年度营业额的850~1525倍。另外,据其他国家测算,地质产品中的地质图,即使按最小价值计算,其价值也是填图成本的25倍[1]。新中国成立以来,我国累计投入了大约5000亿美元的地勘费,形成了大量的地质资料,通过对丰富的地质资料开发利用,为国民经济和社会发展作出了重大贡献。在大数据时代,必须提高地质资料的利用率,加大资料二次开发和深度开发力度,围绕用户的需求而不断地创新服务,提供多方面的优质服务。

4 结语

在大数据时代,地质资料海量数据管理与服务发生深刻的变化,我们要不断加强专业知识的学习,积极探索新的管理模式和管理方法,以新思维、新技术、新举措对待地质资料的现代化建设,以便于更好地为地质勘探事业服务。

参考文献

[1]姚华军.深入贯彻学习《决定》大力推进地质资料开发利用[J].中国国土资源经济,2006(11).

[2]郑军,尹兆涛.中国石油应对“大数据的策略分析”[J].石油规划设计,2013,24(6):27~29.

[3]张艳霞.如何做好地质档案的全面管理工作[J].价值工程,2012(10).

[4]冯演.对做好地质资料档案管理工作的思考[J].中国城市经济,2010(11).

[5]马忠花.青海省地质档案的开发与利用研究[D].郑州:郑州大学,2011.

⑺ 地质遥感特点

地质遥感又称遥感地质,是综合应用现代遥感技术来研究地质规律,进行地质调查和资源勘察的一种方法。它从宏观的角度,着眼于由空中取得的地质信息,即以各种地质体对电磁辐射的反应作为基本依据,结合其他各种地质资料及遥感资料的综合应用,以分析、判断一定地区内的地质构造情况。

地质遥感工作的基本内容是:地面及航空遥感试验,网络下发挥适用于地质找矿、地质环境的遥感系统,进行图像、数字数据的处理和地质判释。地质遥感需要应用电子计算机技术、电磁辐射理论、现代光学和电子技术以及数学地质的理论与方法,是促进地质工作现代化的一个重要技术领域。

地质遥感信息传输一般有直接回收和无线电传输两种方式。直接回收是将遥感信息资料直接用飞机、气球、宇宙飞船、探测火箭等带回来,该方式便捷、保密性强,属于非实时传输方式。无线电传输是将遥感器接收到的信息通过无线电载频传输给接收站,人造卫星多用此种传输方式,该方式可以实时传输,也可以非实时传输,但不容易保密,而且因受到无线电频宽度的限制,会影响到信息容量。

蓝海大脑通过多年的努力,攻克了各项性能指标、外观结构设计和产业化生产等关键技术问题,成功研制出蓝海大脑水冷工作站、液冷服务器、大数据一体机、图数据一体机等。该产品集软硬件于一体,内置10TB存储空间,体积小、方便携带;支持多台同款设备快速组网,组网后可达到高性能集群式影像处理能力。支持各大国内外主流中高分辨率卫星影像。支持常规数码相机、其他框幅式相机等航空遥感数据。可实现大规模遥感影像从影像自动匹配、区域网平差、DEM和DOM生产到影像镶嵌分幅的高效、快速、自动化处理。应用领先的科学工作流与调度技术,生产过程覆盖数据处理、管理、调度、监控、质检等过程,形成一整套高效业务处理流程。具有超强影像处理能力,每天(24小时)可处理多达500景对(全色和多光谱)高分一号影像数据。广泛适用于基础测绘、农业、林业、水利、环保等领域,适合常规模式下测绘产品生产和应急模式下快速影像图生成。

遥感测绘主要有如下特点:
- 感测范围大:综合宏观
- 信息量大,手段多、技术先进
- 获取信息快,更新周期短、动态监测
- 用途广、效益高

遥感信息系统已广泛应用于农业、林业、地质矿产、水文、气象、地理、测绘、海洋研究、军事侦察及环境监测等领域。遥感正以其强大的生命力展现出广阔的发展前景。
型号 蓝海大脑液冷服务器

英特尔
处理器 Intel Xeon Gold 6240R 24C/48T,2.4GHz,35.75MB,DDR4 2933,Turbo,HT,165W.1TB
Intel Xeon Gold 6258R 28C/56T,2.7GHz,38.55MB,DDR4 2933,Turbo,HT,205W.1TB
Intel Xeon W-3265 24C/48T 2.7GHz 33MB 205W DDR4 2933 1TB
Intel Xeon Platinum 8280 28C/56T 2.7GHz 38.5MB,DDR4 2933,Turbo,HT 205W 1TB
Intel Xeon Platinum 9242 48C/96T 3.8GHz 71.5MB L2,DDR4 3200,HT 350W 1TB
Intel Xeon Platinum 9282 56C/112T 3.8GHz 71.5MB L2,DDR4 3200,HT 400W 1TB
AMD
处理器 AMD锐龙Threadripper Pro 3945WX 4.0GHz/12核/64M/3200/280W
AMD锐龙Threadripper Pro 3955WX 3.9GHz/16核/64M/3200/280W
AMD锐龙Threadripper Pro 3975WX 3.5GHz/32核/128M/3200/280W
AMD锐龙Threadripper Pro 3995WX 2.7GHz/64核/256M/3200/280W
AMD锐龙Threadripper Pro 5945WX 4.1G 12核/64M/3200/280W
AMD锐龙Threadripper Pro 5955WX 4.0G 16核/64M/3200/280W
AMD锐龙Threadripper Pro 5965WX 3.8G 24核/128M/3200/280W
AMD锐龙Threadripper Pro 5975WX 3.6G 32核/128M/3200/280W
AMD锐龙Threadripper Pro 5995WX 2.7G 64核/256M/3200/280W
显卡 NVIDIA A100×4, NVIDIA GV100×4
NVIDIA RTX 3090×4, NVIDIA RTX 3090TI×4,
NVIDIA RTX 8000×4, NVIDIA RTX A6000×4,
NVIDIA Quadro P2000×4,NVIDIA Quadro P2200×4
硬盘 NVMe.2 SSD: 512GB,1TB; M.2 PCIe - Solid State Drive (SSD),
SATA SSD: 1024TB, 2048TB, 5120TB
SAS:10000rpm&15000rpm,600GB,1.2TGB,1.8TB
HDD : 1TB,2TB,4TB,6TB,10TB
外形规格 立式机箱
210尺寸mm(高*深*宽) : 726 x 616 x 266
210A尺寸mm(高*深*宽) : 666 x 626 x 290
210B尺寸mm(高*深*宽) : 697 x 692 x 306
声卡:7.1通道田声卡
机柜安装 : 前置机柜面板或倒轨(可选)
电源 功率 : 1300W×2; 2000W×1
软件环境 可预装 CUDA、Driver、Cudnn、NCCL、TensorRT、Python、Opencv 等底层加速库、选装 Tensorflow、Caffe、Pytorch、MXnet 等深度学习框架。
前置接口 USB3.2 GEN2 Type-C×4
指承灯电和硬盘LED
灵动扩展区 : 29合1读卡器,eSATA,1394,PCIe接口(可选)
读卡器 : 9合1SD读卡器(可选)
模拟音频 : 立体声、麦克风
后置接口 PS2接口 : 可选
串行接口 : 可选
USB3.2 GEN2 Type-C×2
网络接口 : 双万兆 (RJ45)
IEEE 1394 : 扩展卡口
模拟音频 : 集成声卡 3口
连接线 专用屏蔽电缆(信号电缆和电源电缆)
资料袋 使用手册、光盘1张、机械键盘、鼠标、装箱单、产品合格证等{变量12}

⑻ 市县级地质资料信息化服务模式——以合肥市为例

陈忠良1 戴圣潜2 胡海风1,3 江学莲1

(1.安徽省地质调查院;2.安徽省地矿局321地质队;3.合肥工业大学资源与环境工程学院)

摘要 随着城市的发展,市县级地质资料管理与服务需求明显,且更趋专业性。本文以合肥市为例,论述市级定位于地质资料的集中管理和分布式网络化服务,并从服务对象、服务内容、服务方式等维度说明市县地质资料信息化服务模式。文中分别介绍了馆藏资料电子化查询、地质资料信息Web发布、地质资料共享与交换等信息化服务方式。本文最后对线下定制服务、地质资料多级服务等方面进行了讨论。

关键词 合肥市 地质资料 信息化 接口 模式

0 引言

地质资料是地质工作形成的重要基础信息资源。随着计算机技术的发明发展,在地学领域,数据处理技术极大地提高了地球物理和地球化学数据的处理速度;文字处理技术使地质人员部分进入无纸化调查阶段;扫描数字化等技术提高了资料保管的数字化水平,为后续信息技术的深入应用做好了前期纸质资料的信息采集准备工作;数据库技术是海量信息得以结构化保存,并为大数据应用提供了数据基础;网络技术从根本上改变了信息传播与服务的传统工作方式,特别是空间信息网格的在标准体系的支撑下,实现了异构、海量、分布的空间信息共享和应用协同。总之,信息技术的应用是地质工作现代化的巨大推动力[1~4]

现阶段,地质资料服务职能正在向市县延伸。而在市县级地质资料服务延伸过程中需要坚持以服务为出发点和立足点,结合信息化技术,推动服务水平达到新的高度[5]。上海市在开展城市地质资料信息服务过程中基本形成了以地质资料数据中心[6]为基础的地质资料信息化服务的新阶段。其注重城市规划、建设和管理对地质工作需求的把握,围绕社会需求主线,重点推进海量地质资料信息化和社会共享[7]

本文参考姜作勤、尚武等学者提出的“地质信息服务体系框架”(图1)理论[8]。本着在论述作为合肥市级所委托的公益性地质资料信息保管和服务机构角色定位的同时,着重研究市县级城市在信息化模式下如何开展地质资料信息服务,详述服务对象、服务内容、服务方式等内容。

1 市级服务定位与需求

1.1 服务定位

全国地质资料馆调研结果显示,目前全国地质资料管理向市县延伸情况主要分为以下几类:一是以江苏泰州、福建平潭为代表,建立了地质资料馆藏机构实体,有市政府正式文件,落实编制、经费、职责,建立了库房及电子阅览室,开展了资料接收与服务工作;二是以辽宁大连、鞍山为代表,以合署办公形式建立了市级地质资料馆,文件由市国土资源局下发,与局属其他单位合署办公,履行地质资料管理职责;三是以山东、广东、四川和浙江为代表,省政府或者省国土资源厅明确了地质资料管理向市县延伸,主要在实物地质资料管理方面开展了工作;四是以上海市为代表,开展地质资料集中管理,市县在行政上督促汇交。

图1 地质信息服务体系框架[8]

合肥市地质资料信息服务定位于市级所委托的公益性地质资料服务机构,文件由市国土资源局下发,开展地质资料集中管理,地质资料主管部门在行政上督促汇交。同时,面向其他中心提供分布式数据管理和网络化地质资料信息服务(图2)。本市级中心接受国家中心的业务指导,遵循国家中心发布的标准规范,在国家地质资料数据中心建设以及全国性工作项目上,接受国家的统一协调。

图2 服务定位

1.2 服务需求调研

为做好服务平台的开发,针对地勘单位和国土资源部门以外的政府部门、企事业单位开展了地质资料信息服务需求调研。调研形式上采用逐个上门,面对面询问、问卷的方式,调研其对地质资料的需求,并沟通可能的地质资料信息服务内容。

通过调研,地质资料服务需求问卷的部分结果见图3。地质资料信息服务的需求表现在:①地质资料数据库应能体现本地区地质工作的程度,辅助项目立项和编制设计工作,满足本地区地质调查项目开展过程中对地质资料信息服务的实际需求。②在地质资料需求内容上,工程地质条件、地下水状况等传统工勘资料的需求较多,地基和断层分布也是较受关注的方面。需优先保障此类资料的信息服务。③信息平台和共享服务方面,是需要重点建设的内容,需要通过信息平台,提供专家咨询、资料在线检索、目录服务和地质科普等内容。④为满足分布式的地质资料信息服务技术上需要采用OGC组织的WFS、WMS等规范来提供Web地质资料要素服务、地质资料图件服务、地质体空间分析服务与地质资料目录服务等。⑤调研者普遍赞同传统的纸质报告形式提交详尽的专业报告,对电子信息化数据也存在一定需求,也要求我们在工作中应对两种方式均予以侧重。在实施信息技术下的地质资料管理技术改造的同时,应做好传统地质信息服务与信息化服务相结合的工作。

图3 资料服务需求问卷结果

2 信息化服务方式

信息化服务的基础条件依赖于服务的网络环境。考虑到地质资料涉密问题,合肥市地质资料信息服务分为涉密和非涉密部分。具体的运行环境如图4所示。

对于需要查询资料本身的用户,一般必须经过授权,在涉密局域网环境下提供馆藏资料电子化查询。在互联网环境下,建设在线服务窗口,提供目录、地质调查成果等服务。并可部署软件系统,作为节点群提供本级地质资料目录信息服务。而对于合肥市级机构,通过政府专网实现网络在线方式数据共享。此种方式侧重分布式环境下,不同平台间的互操作。基于服务等软件技术手段实现跨单位的地质资料共享与应用,满足不同领域在线用户的信息需求。

图4 服务网络环境示意图

2.1 馆藏资料电子化查询

馆藏资料电子化查询的实践在于电子阅览室的建设。所建电子阅览室利用网络技术,连接电子阅览室和地质资料数据中心。其集地质资料查询、借阅、加工与用户信息管理等功能于一体,提供以地质图和电子文档浏览为主、以纸质借阅为补充的服务方式。在方便用户借阅的前提下有效地保护纸质地质资料,提高地质资料服务的信息化水平,实现地质资料借阅服务由以纸质借阅向以电子借阅的跨越。

此种方式的服务对象面对需要查阅地质资料信息电子扫描件和已形成的成果地质资料和专题地质资料数据库的人群。使用者通常需要获得馆藏机构的授权。

2.2 地质资料信息Web 发布

地质资料信息Web发布是在地质工作者与公众及专业用户(服务对象)之间架起沟通的桥梁,是地质工作的对外窗口(图5)。提供目录查询、地质调查成果查询、案例服务和地质科普等服务。

2.2.1 目录服务

地质资料目录在线检索功能可方便不同用户了解地质资料数据中心已有数据库数据信息,以达到进一步获取和使用所需信息的目的。查询方式分为简单查询(模糊查询)、高级查询和空间查询(地图模式)。空间查询可进行查询结果与地图(天地图底图)联动,并可通过划定感兴趣的范围(如线段、多边形、矩形)查询此范围内的地质资料信息。

2.2.2 地质调查成果查询

基于WebGIS技术的点位信息查询显示功能,可支持用户查询指定区域的地质钻孔(基本信息、分层信息、样品信息、项目信息),地震、地质灾害隐患点等信息。根据查询结果,支持用户关联查询,如钻孔查询结果可关联查询到分层信息、样品信息、柱状图。对三维地质调查成果模型也提供基于IE浏览器的在线模型浏览。

2.2.3 服务案例展示

为了说明地质资料的价值,提供对本次试点研究工作中典型案例成果的在线展示。我们将地质资料信息服务产品分为基础产品和定制产品两类。其中,基础产品是我们以一定周期编制的公共服务产品,提供在线浏览;而定制产品则是我们面向特定对象所提供,选取典型案例在线发布。

图5 地质资料信息Web发布

基础产品有地质环境图集、区调报告等;定制产品则有合肥市滨湖新区地下空间开发利用规划、合肥市活断层探测与地震危险性评价、滨湖新区应急水源地勘察等专题报告。合肥市资源综合利用(静脉)产业园地质条件评估也可作为城市发展中项目选址地质条件评估类的专业报告予以展示,以说明地质资料综合利用和二次开发的价值。

2.2.4 地质科普

网站建设者依据地质科学的原理,结合地层、构造、古生物、岩石矿物等方面的知识,介绍与合肥市有关的区域地质背景(地层、构造、岩浆岩、工程地质等)、矿产资源、地质灾害、地质遗迹(大蜀山-紫蓬山省级地质公园)、地热资源利用等方面的知识,并提供主要地质科普网站的链接。

2.3 地质资料共享与交换

对于地质资料安全保密的具体特点,在共享与交换方面将采用网络在线和离线的两种服务途径。网络在线服务模式下,需要提供目录接口服务和公开地质资料接口服务。为实现地质资料信息服务与其他国土资源信息服务(如测绘与地理信息服务)的共享和交换,需遵循OGC规范,便于各平台之间的数据调用。此种也是第三方网站共享地质资料信息的主要方式。离线途径则是数据的拷贝共享。

2.3.1 目录接口服务(CSW)

网络目录服务(Web Catalogue Service,简称 CSW),支持KVP格式请求,目前支持2.0.2版本。CSW服务包含GetCapabitities、DescribeRecord、GetDomain、GetRecords、GetRecordById、Harvest、Transaction等7个接口。所提供的目录查询接口有按档案号、题名、行政区代码等以及空间查询接口(图6)。

以查询档案号为“L0010”的目录查询接口调用为例:

var webServices: WebService =newWebService(); //定义WebService变量

webServices.loadWSDL(" http://218.22.14.114./HFWebService new/CSWService.asmx? wsdl");//加载目录服务接口地址

CallResponder.token =webServices.getDataTableByDocId(" L0010");//执行查询

图6 目录查询接口

2.3.2 地质图接口服务(WMS)

地质图服务(Web Map Service,简称WMS),利用具有地理空间位置信息的数据制作地图,将地图定义为地理数据可视的表现。服务支持KVP和SOAP格式请求,目前支持1.1.1 版本和1.3.0 版本。WMS服务包含GetCapabitities、GetMap、GetFeatureInfo等3个接口。

工程地质图服务接口用ArcGIS调用示例:

<esri:WMSLayer id=" gcdz" visible="{dz1.selected}" url=" http://218.22.14.114:8089/igserver/ogc/engpolygonlayer/WMSServer" skipGetCapabilities=" true" ><esri:visibleLayers>

<s:ArrayList>

<fx:String>engpolygonlayer:经纬度工程分区.WP</fx:String>

<fx:String>engpolygonlayer:经纬度工程地质界线.WL</fx:String>

<fx:String>engpolygonlayer:经纬度工程分区.WT</fx:String>

</s:ArrayList>

</esri:visibleLayers>

</esri:WMSLayer>

2.3.3 地质要素接口服务(WFS)

地质要素服务(Web Feature Service,简称WFS)定义了一组操作,这组操作允许用户在分布式的环境下通过HTTP对空间数据进行查询、编辑等。服务支持KVP和XML格式请求,目前支持1.0.0、1.1.0和2.0.0 版本。WFS 服务包含 GetCapabitities、DescribeFeatureType、GetFeature、GetGmlObject、Transaction、LockFeature等7个接口。要素服务地址为 http://218.22.14.114:8089/igserver/ogc/WFSServer?Version=1.1.0&Service=WFS&Request =GetFeature&TypeName =要素服务名称。要素服务名称为 Landslide:滑坡地质灾害点.txt、Riverbank:崩岸地质灾害点.txt等。

3 讨论

3.1 线下定制服务

虽然信息化技术能够提供较为便捷高效的地质资料信息服务,但对于专业要求高的离线用户仍然需要采用主动式或定单式的地质资料综合研究和二次开发服务。能够提供此类服务既可是公益性地质调查机构,也可是第三方咨询服务机构。现状是开展此类服务需要大量的基础地质资料,而第三方咨询服务机构如何从公益性地质资料提供者手中获取资料是未来地质资料信息服务产业化研究的问题之一。

3.2 地质资料多级服务

在测绘地理信息领域,已经建成的Google Maps和天地图是地质资料信息共享交换的主要参考对象。天地图按照国家级节点、省级节点和市级节点三级分布来解决社会对地理信息服务的需求。主节点是负责平台总体调度,安全监控、资源管理与服务。省级节点是组织开展跨区域、跨部门的协调服务,负责区域范围内的管理和应用。市级节点是为平台提供现实性比较强的大比例尺信息资源,并且负责本区域数据的更新和应用工作[9]。基于此,地质资料信息服务需要考虑多级服务节点分布。现阶段,全国和省级节点组织地质资料目录信息的互联互通和动态汇聚,市县级节点应突出大比例尺和专题信息资源的服务,向上级节点上传目录信息。

4 结束语

本文以合肥市为例,论述市级定位于地质资料的集中管理和分布式网络化服务,并根据调研成果介绍了市县级地质资料服务需求的主要内容。在调研结论基础上,从服务对象、服务内容、服务方式等维度说明市县地质资料信息化服务模式。主要描述的信息化地质资料服务方式有馆藏资料电子化查询、地质资料信息Web发布、地质资料共享与交换等。文中所述地质资料信息化服务模式,是从技术方法上对市县级地质资料管理与服务的有益探索,可对其他同级城市开展地质资料信息服务起到借鉴作用。

致谢 本文在成文过程中得到了合肥市国土资源局查睿、朱涛和安徽省地质资料馆张明霞高工以及安徽省地质调查院资料室郭小霄高工的热情指导。在此一并致以衷心的感谢!

参考文献

[1]郑晓光,徐向琴,王传礼.地质资料信息集成服务方法初探[J].档案与建设,2009(8):23~24.

[2]余浩科,周进生.国外公益性地质资料社会化服务评估及启示[J].中国国土资源经济,2008(6):34~36,49.

[3]姜作勤.地质工作信息化若干问题的思考[J].地质通报,2004(9):20~26.

[4]马智民,杨东来,李景朝,等.主要发达国家地学信息服务的现状与特点[J].地质通报,2007(3):109~114.

[5]王帅.地市级国土资源局地质资料社会化服务探索:以湖北省黄石市国土资源局为例[J].资源与产业,2008(4):51~53.

[6]杨丽君.上海地质资料数据中心的构建与运行体系[J].上海国土资源,2012(3):79~84.

[7]陈华文.上海城市地质工作服务经济社会发展机制与模式探索[J].上海地质,2010(3):15~21.

[8]姜作勤,马智民,杨东来,等.地质信息服务体系框架研究[J].中国地质,2007(1):177~182.

[9]赵继成.天地图建设与服务[J].地理信息世界,2014(1):10~11.

⑼ 石油地质数字孪生的特点及目标

之前的文章 《石油地质数字孪生概述》 中,我们介绍了常规数字孪生的概念、石油地质数字孪生的概念及其内涵。本文主要介绍石油地质数字孪生的特点及实现目标。

由于石油研究对象、石油业务的特殊性,石油地质数字孪生相比常规设备类数字孪生有着非常明显的差异,主要表现在以下方面:

1.1 对客观实体描述的不确定性

常规的数字孪生一般是对某个特定的设备或者可见实体进行描述,对这些实体的描述属于确定性的描述。而石油地质研究的对象,是地下地质体,是无法直接观测的,因此对地下地质体的描述永远是研究者主观认识的描述,存在极大的不确定性。随着对地下地质体的认识深入,只能不断地接近客观实体。

1.2 对客观实体描述的动态性

对地下地质体的描述是随着石油勘探开发业务的开展不断深入、细化的,因此这个“客观”的实体是不断变化的,这和常规实体的唯一性有着较大的差别。这种变化需要随着工作的深入,要不断对地下地质体的描述进行实时更新。

1.3 数字孪生建立与运用的同步性

常规的数字孪生系统一般是先建立一个数字孪生系统,然后在这个孪生系统之上建立各种应用。而石油地质数字孪生系统是边建立边应用,在建立的过程中不断应用,应用的过程中又同时建立并不停地完善系统,两者是同步的,相辅相成的。

石油勘探开发研究对象处于地下,研究工作者无法直接观测和描述,所有对地下地质体的认识都是采用间接的方式。石油地质数字孪生是一种新的技术形式,通过这种技术可以将对地下地质体的直接描述和认识变成可能,从而解决业务上的很多技术问题。

2.1 对地质对象进行更准确的描述

只要能够测量与描述,就能够改善,这是工业领域不变的真理,对石油勘探开发同样这样。无论开展哪个工作,前提是对我们的工作对象进行准确的了解,都需要对地质体进行精确的测量和描述,对地质体的各种属性、参数和动态变化情况有全面的认识,从而实现在工作中进行精准的分析和优化。

过去对地质体传统的描述方法一般是单维度描述,不同维度的描述信息缺少有效的关联,从而对地质体的展示方式上也缺少更加直观的方法。

通过石油地质数字孪生可以对地下地质体进行更加全面、形象、准确地描述。对地下地质体的描述可以从过去的简单描述,升级为多个业务维度联合描述,对地质体可以实现全三维描述,并且可以随时间变化实现四维动态描述。同时,利用数字孪生技术,可以借助于物联网和大数据技术,通过采集有限的物理传感器指标的直接数据,并借助大样本库,通过机器学习推测出一些原本无法直接测量的指标和数据。

2.2 达到更全面的分析和预测能力

石油勘探开发各项工作都是建立在对地质体的分析和预测基础之上,特别是对未来的变化趋势及指标预测更是影响工作的关键指标。通过常规的分析方法和手段很难做到比较全面的预测分析,而数字孪生可以结合物联网的数据采集、大数据的处理和人工智能的建模分析,实现对当前状态的认识和评估、对过去发生问题的总结,以及对未来趋势的预测,并给予分析的结果,模拟各种可能性,提供更全面的决策支持。

2.3 实现工作过程的建模及标准化

石油勘探开发的业务过程是由一系列相互关联、相互结合的业务组成,同时该业务过程也是对地下地质体的认识、实践、再认识的一个深化过程。石油地质数字孪生可以很好的将石油勘探开发的业务过程和地下地质体的认识过程统一起来。

在石油工业中所有的石油勘探开发工作都是依据一定的行业规范或标准实施的,所以这个业务过程是标准化的。通过石油地质数字孪生可以将石油勘探开发工作过程进行建模及标准化,实现对业务的标准化操作及管理。

2.4 实现对过去认识经验的数字化

石油勘探开发各种过程是对地下地质体不断认识的循环过程,所有的工作都是建立在前人的各种经验和各种积累基础之上的,因此对过去的工作及认识经验的总结在工作中占据非常重要的地位,采用传统方式难以对历史认识进行集成和深化。

而通过数字孪生技术可以很好地对过去的经验进行管理和应用,将原先无法保存的专家经验进行数字化,并提供保存、复制、转移和应用的能力,通过知识化的管理和应用加深对地质体的深化认识。

2.5 实现对未来趋势及各种认识的预测

通过对历史数据的管理不仅仅可以得到过去的经验,通过大数据分析处理技术还可以对未来进行很好的预测,这种预测结果对未来的工作有着巨大的指导意义。

2.6 实现勘探开发整个业务的闭环

我们对地下地质体准确的认识是为了更好地进行下一步的工作决策,整个石油工作就是在认识、实践、再认识、再实践的不断循环、不断深化的过程中开展的。数字孪生技术可以提供一个直观、客观的工作平台,一方面将认识成果沉淀起来,同时在该工作平台利用积累的认识成果进行新的认识,并指导下一步工作决策,实现整个勘探开发工作的闭环。

⑽ 基于Ontology驱动的广东省地质数据中心设计

李丹秋

(广东省国土资源档案馆)

摘要 本文结合广东省地质资料管理和应用的实际情况,在已有地质资料空间数据库和非空间数据库的基础上,引入Ontology技术以解决空间数据库语义冲突问题,扩展和深化已有地质资料查询的结果,在原有“一张图”数据中心架构的基础上重新设计了广东省地质数据中心。

关键词 Ontology 地质数据中心 构建 模式 广东省

地质资料是地质工作形成的重要基础信息资源,具有可被重复开发利用、能够长期提供服务的重要功能(赵铭,2012)。自2010年国土资源部制定《推进地质资料信息服务集群化产业化工作方案》(国土资发〔2010〕113号)以来,广东省认真落实地质资料信息服务集群化产业化工作,由广东省国土资源档案馆承担建设,目前已初步构建省级地质资料数据集群与管理服务平台和网络服务体系,对广东省地质资料信息服务集群化产业化工作起到了很好的推动作用。然而现有数据中心的基本架构体系中采用基于数据驱动的数据交互方式,此种交互方式会产生诸如语义冲突、数据挖掘程度低等问题。为解决这些问题,我们通过依托Ontology在语义集成中的优势,提出了基于Ontology驱动的广东省地质数据中心设计。

1 Ontology技术概述

1.1 基本概念

Ontology最初是一个哲学概念,是客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质,即“本体”(邓鸿志,2002)。本体(Ontology)通过建立概念体系,定义概念的属性、相互约束和关系的方式,实现领域知识的概念化共享(Guarino,1997b)。本体概念应包括四方面:保持独立性、定义的明确性、计算机可读性和具有共享性。经过近20年的发展,本体已经为知识转换、共享和数据集成等领域提供方法,被广泛用于解决数据互操作能力问题。

地质本体的构建与引入为多源地质数据集成、地质知识的转化,以及地质数据的互操作性等提供了技术基础,并在语义层上解决地质异构信息的集成和互操作,从而促进并实现地质相关知识共享、交互和推理(Ma et al.,2012)。特别是本体能够为数字基础设施提供语义匹配支持、解决分布式服务组配等问题(Gurnis et al.,2011),形成了地球科学中若干的本体应用。

1.2 在地质信息领域中本体相关应用

目前,地质本体主要用于地质图、知识集成及共享。例如,GEON(是2002年由美国自然科学基金委员会信息技术研究项目(NSF Information Technology Research(ITR)program)资助的一个科研项目)工程中的地质本体主要用于地质图中异构概念模式的协调和异构地质图的组配(Lin et al.,2008);基于SKOS建立的GTS多语言词典,可以解决在线地质图之间的多语言障碍(Ma et al.,2012);通过建立基于词表的地质图检索服务,AuScope克服了在地球科学术语中的语义和语法上的不同(Woodcock et al.,2010);Silva等人提出了应用本体实现地质影像的知识标记和解析,如地层形态和沉积结构、岩石视觉特征等(Silva et al.,2004)。此外,地质本体被用于解决地质建模中地质语义异构、解析及构建地质知识模型等问题(侯卫生等,2009)。

总体来说,本体大致有两个不同层次的应用:底层应用与顶层应用。底层应用主要包括数据集成与互操作、数据交换两个方面,即从语义上实现异构数据源重用、集成及互操作,并对输入和输出的异构数据源进行校准;顶层应用主要包括服务和知识的集成、共享及互操作等方面。顶层应用则以语义的方式集成各类服务,以获得有效工作流,实现知识的形式化、形式化知识推理及跨领域知识共享方式。

2 广东省地质数据现状分析

广东省国土资源档案馆已完成馆藏及厅矿政管理各类地质资料成果等数据资源的数据格式、数据完备程度等情况的分析整理,并根据地质资料数据集群与管理服务平台建设的要求,制定了地质资料数据集群与管理服务平台的数据库规范,做到统一数学基础、统一数据格式、统一数据分类的要求,提取各类数据的核心图层,建立各类空间数据库。初步建立起广东省国土资源“地质资料数据集群与管理服务平台”的基础核心数据体系。

目前,广东省国土资源档案馆所管理的数据库包括测绘、地质、矿产等多种空间和非空间数据库,具体见表1。

表1 广东省国土资源档案集群服务平台数据库列表

由此可见,目前省级档案馆在各类地质数据库中已积累、管理了大量地质数据,种类繁多、类型和结构也存在多样化,并且在相关业务的处理过程中,又会产生新的衍生数据。如何更好地挖掘地质知识以便更好地为地质服务已成为当务之急。

3 广东省地质数据中心设计

3.1 架构设计

现有国土“一张图”的基本架构体系中GIS空间数据引擎与基础数据库之间的数据交互是数据驱动的,由于不同数据库的多源异构的特征,这种基于数据驱动的数据交互方式会产生诸如语义冲突、数据挖掘程度低等问题。故此,我们通过依托Ontology在语义集成中的优势,构建了基于Ontology驱动的广东省地质数据中心设计模式(图1)。

图1 广东省地质数据中心设计

该数据中心包括以下几个部分:基础数据层、空间数据交互层、地质大数据处理分析层、数据管理基础平台、数字基础设施支撑体系和标准规范及汇交更新机制。数字基础设施支撑体系是整个数据中心的硬件基础,包括网络设施、服务器、存储设施等。基础数据层是指广东省国土资源档案馆所管理的各类数据。空间数据交互层主要为空间数据的交互查询、更新提供功能,它包括基于数据驱动的交互、GIS空间数据引擎、基于Ontology驱动的数据交互。地质大数据处理分析层是基于Ontology技术的一个地质知识挖掘和服务的中间层,是从结构化的地质数据库中直接提取各类地质概念,建立相应的概念间逻辑关系与语义关系,为多源地质数据语义提取和数据挖掘提供服务。数据管理基础平台为外在的数据录入、管理、分析等交互界面和处理功能,是整个数据中心的外在表现。

标准规范及汇交更新机制是指各类地质数据汇交、更新过程中所必须依据的标准和规范,是整个数据中心运转的制度保障。在各个平台的使用过程以及各部门的业务流转过程中,既需要从档案馆地质资料集群平台提取地质数据,同时会产生新的地质数据需要汇交到地质资料集群平台,并更新地质资料集群平台。在这样一个过程中,数据汇交、更新过程的标准和规范是必要的。

数据中心的底层是广东省国土资源档案馆管理的基础数据库,在数据库与空间数据引擎之间通过两种途径来实现数据交互:一是传统的基于数据驱动的数据交互,这类交互通过SQL语句或GSQL语句实现对空间和属性数据的获取、更新管理;二是通过Ontology来实现数据的查询,利用Ontology构建工具,基础数据库中的每一个数据库建立一个相应的Ontology,理顺数据库中各实体及相互之间的语义关系、以及所涉及的概念体系,从而为深度数据查询提供基础。两者通过GIS空间数据引擎共同构成了数据基础管理平台与基础数据库之间的沟通桥梁。

该技术架构的设计注重地质数据语义集成与分析,并且可以在不改变业务应用的前提下实现。其中地质本体的构建原则采用侯卫生等人(2013)提出的基于地质空间数据库的OWL本体自动构建方法,可实现一次构建,随时更新,永久保存的特性。

3.2 架构优势

基于Ontology驱动的数据交互和传统的基于数据驱动的数据交互相比具有明显的优势。基于Ontology驱动的数据交互优势主要包括两点:

一是解决语义冲突产生的问题,使查询结果更精确。基础数据库包括空间数据库、非空间数据库,它们来源广泛、结构各异、尺度不同、精度不一,对同一地质现象在不同数据库中的描述肯定不尽相同。如小比例尺空间数据库中对某区域岩性统一描述为“砂岩”,而大比例尺空间数据库中会细分为“含砾砂岩”、“含砂砾岩”、“泥质砂岩”、“砂质泥岩”、“含泥砂岩”等岩性描述。如果忽略了不同数据库间语义上的联系或冲突,单纯使用基于数据库的查询方法可能得到不准确的查询结果。而建立了Ontology之后,通过基于Ontology的查询就可以很好地规避这个问题。

二是建立了数据库之间的联系,深化查询结果。当前各个基础数据库之间是相互独立的,不同数据库之间的关联不紧密或者没有关联,在进行数据挖掘时很难挖掘出足够的信息。例如,对某区域的岩性“地质空间数据库”描述为“砂岩”,而“水文地质数据库”称为“砂质岩”,那么在基于数据库查询“砂岩”时,由于没有查到“砂质岩”的结果,这次查询就无法得到“水文地质数据库”中的信息。而Ontology建立了“砂岩”和“砂质岩”两个语义之间的联系,那么这两个数据库的数据都能被挖掘出来。

总之,依托结构化数据构建Ontolgy可以从中提取出各类概念及概念间的语义关系,可以更好地为地质知识挖掘服务。

4 小结

本文根据广东省地质数据管理现状,提出了基于Ontology驱动的广东省地质资料集群化平台的数据中心设计模式。与传统的基于数据驱动的模式相比,该数据中心设计模式可以解决空间数据查询时的语义冲突以及数据挖掘程度不够等问题,为今后拓展地质资料的集群化产业化应用领域,适应大数据的发展,以及更好地为地质数据知识挖掘和服务提供了良好的基础和数据保障。

参考文献

[1]Guarino,N..Understanding,building and using ontologies[J].International Journal of Human–Computer Studies,1997,46(2~3):293~310.

[2]Gurnis,M.,Flesch,L.,Okaya,D.,et al.EarthScope Cyber infrastructure Subcommittee(ECISC).Preliminary Strategic Plan for EarthScope Cyberinfrastructure[R].2011.

[3]Lin,K.,Bertram,L.GEON:Ontology-Enabled Map Integration.24th Annual ESRI International User Conference,[C].2008.

[4]Ma,X.,Carranza,E.J.M.,Wu,C.,et al.Ontology-aided annotation,visualization,and generalization of geological time-scale information from online geological map services[J].Computers & Geosciences,2012,40(3):107~119.

[5]Silva OP.da,Freitascmds.,Abel M.Interactive visualization of well data for supporting geological reservoir modeling.2004.

[6]Woodcock,R.,Simons,B.,Duclaux,G.,et al.AuScope’s use of standards to deliver earth resource data.Geophysical Research Abstracts 12,EGU2010-1556,EGU General Assembly,2010.

[7]邓鸿志,等.Ontology研究综述[J].北京大学学报(自然科学版),2009,38(5):730~738.

[8]侯卫生,刘修国,吴信才,等.面向三维地质建模的领域本体逻辑结构与构建方法[J].地理与地理信息科学,2009,25(1):27~31.

[9]赵铭.地质档案信息开发利用新趋势[J].档案管理.2012(5):87.

阅读全文

与地质大数据幻灯片相关的资料

热点内容
linux不支持usb文件系统怎么办 浏览:844
如何给公司抬头文件加红线 浏览:818
企业门户网站模板html 浏览:208
为什么找不到备份的文件 浏览:918
touchjs委托 浏览:450
鸿蒙系统桌面增加文件夹 浏览:351
windows2003密码策略 浏览:862
如何对宝马进行编程 浏览:802
找不到win10组策略 浏览:115
大数据对国家的影响 浏览:320
大数据蓝皮书pdf 浏览:169
速腾怎么插苹果12数据线 浏览:506
网络克隆客户端设置 浏览:858
炉石传说2016大数据 浏览:729
bios文件格式 浏览:683
看苏州APP怎么没有苏州四套 浏览:307
除了数据线笔记本与手机如何连接 浏览:575
苹果新机分几个 浏览:841
struts2resultjsp 浏览:403
七个星期五app怎么切换中文 浏览:342

友情链接