油氣地質資料數字資源服務的創新方式與保障條件
趙傳玉
(中國石油化工股份有限公司石油勘探開發研究院)
摘要 油氣地質資料數字資源服務的常規方式包括網絡目錄檢索、網絡全文瀏覽與下載兩種; 創新方式則包括數字地圖導航服務、在線繪圖與對比服務、移動化利用服務、數據挖掘與知識服務以及大數據服務5種。油氣地質資料數字資源服務的創新方式,需要具備豐富的數字化資源、完善的檔案管理信息系統、大容量的網絡帶寬以及具有大數據思維的檔案工作者4個方面的保障條件。
關鍵詞 油氣地質資料 數字資源 利用服務 數字地圖 數據挖掘 知識服務 大數據
0 引言
油氣地質資料是對石油天然氣勘探開發地質資料的簡稱,是指在石油天然氣勘探開發生產和科研過程中形成的文字、圖表、數據、聲像等形式的原始地質資料,以及成果地質資料和巖心、巖屑、光薄片等實物地質資料。《地質資料管理條例》及其實施辦法發布十余年來,油氣地質資料的數字資源建設與服務工作經歷了壹個從無到有、不斷壯大的過程。
目前已經比較成熟、正在被各油氣田勘探開發單位廣泛應用的油氣地質資料數字資源服務方式,主要包括網絡目錄檢索、網絡全文瀏覽與下載兩種方式。網絡目錄檢索是指通過網絡提供油氣地質資料的案卷級與文件級目錄信息的檢索服務,授權用戶可通過這種方式查找到館藏中的任何壹個案卷或壹份文件。網絡全文瀏覽與下載是指通過網絡提供油氣地質資料的全文瀏覽與下載服務,該項服務在目錄數據庫建設的基礎上開展,授權用戶可在線瀏覽地質資料的主要內容,也可下載至本機進壹步利用。
1 油氣地質資料數字資源服務的創新方式
隨著IT技術的不斷發展和資源建設程度的不斷推進,油氣地質資料數字資源服務方式也要不斷創新。結合工作實際及國內外的相關文獻,筆者總結了如下5種創新服務方式。
1.1 數字地圖導航服務
數字地圖導航服務,是指利用基於GIS(Geographic Information System,地理信息系統)導航,以地質資料內容對應的工作區的地理坐標為檢索點,向用戶提供某壹特定地理區域所包含的全部油氣地質資料的壹種服務方式,它是網絡目錄檢索、全文瀏覽與下載的壹種有益補充,要在地質資料檢索系統上集成GIS服務方可實現,目前比較成熟的平臺有ArcGIS平臺、Google公司提供的Google Earth服務等。
油氣田勘探開發工作,必須充分占有目標區域的全部資料,才能有的放矢深入研究。用戶使用常規的檢索方法,以題名、作者、關鍵詞等作為檢索詞,往往難以覆蓋目標區域的全部資料。地質資料館藏機構通過對資料內容涉及的空間數據進行著錄並在檢索系統中集成GIS導航服務等方式,不僅讓用戶可以直觀的掌握目標區域的地理與地形情況,還可以通過GIS導航平臺提供的點選和圈選功能,查詢該區域內的全部油氣地質資料。
筆者所在單位通過建立空間數據庫,著錄油氣地質資料內容對應的工作區的地理坐標信息,並在檢索系統中集成GIS平臺,實現了對油氣地質資料的GIS導航查詢服務。用戶登錄後,只需框選某壹特定區域,即可查詢這壹區域內中石化各油氣田勘探開發單位形成的油氣地質資料情況,極大地提高了查全率與查準率,效果反饋良好。
1.2 在線繪圖與對比服務
這是壹種全新的服務方式,主要是以館藏的各類數據體為基礎,通過管理信息系統與檢索系統,提供對這些數據體的自定義可視化以及對比服務。
以測井數據體為例,測井是指利用巖層的電化學、導電、聲學、放射性等地球物理特性,測量地球物理參數的過程。測井的方法眾多,也形成了多種類型、多種格式的測井數據體,而這些測井數據體壹般都不便直接閱讀,必須形成測井曲線圖才能方便利用。在線繪圖與對比服務,就是將館藏每壹口井的全部測井數據體,上傳至存儲服務器,並與相應的案卷級目錄信息、文件級目錄信息鏈接,用戶在瀏覽時,可根據自身需要,選擇壹口井的某壹類或某幾類測井數據體,或者多口井的某壹類測井數據體,利用管理信息系統提供的在線繪圖功能,實時繪制測井曲線圖並進行對比。該服務方式可以讓用戶自行確定測井曲線種類、選擇圖件參數、圖件顯示方式等,大大提高了利用效率和利用效果。
目前中石化油氣勘探開發源頭數據采集系統中的測井數據采集系統,采集了測井數據體後,就是通過在線繪圖、在線對比、在線統計等方式來展示采集結果的,效果非常好。這壹系統的成功實踐,為油氣地質資料數字資源的在線服務提供了壹種借鑒思路。
1.3 移動化利用服務
移動互聯網飛速發展,各種業務在移動設備上的應用越來越成熟。筆者認為,隨著手持移動設備(手機、平板電腦等)硬件配置越來越高,對復雜任務的處理能力與處理速度大幅提高;3G、4G等高速移動互聯網的進壹步普及,為油氣地質資料利用服務的移動化提供了機遇。英國地質調查局在2010年9月發布了其第壹個基於iOS系統的APP——iGeology,用戶可借助該APP在英國任意地方通過移動設備檢索1:50000地質圖及相關數據,利用效果顯著。全國地質資料館在2013年也分別發布了基於iOS和Android系統的手機客戶端,可以直接通過手機查詢地質資料並發起資料訂購。
對於油氣田勘探開發單位而言,我們可效仿上述成功經驗,開發專門的第三方應用程序(APP),通過局部推送、切片技術、鷹眼技術等手段,解決大容量電子文件在移動互聯網上的推送和在手持移動設備上的顯示等問題,經授權和認證後,可根據勘探開發科研生產壹線工作者的需要,將其急需的油氣地質資料數字資源,推送到他們的手持移動設備上,提高服務與支撐效率。
1.4 數據挖掘與知識服務
數據挖掘壹般是指從大量數據中自動搜索隱藏於其中的有著特殊關系性信息的過程。油氣地質資料管理信息系統中,既保管有豐富的電子資源,又擁有龐大用戶群的利用記錄,這兩者對計算機而言都是大量的數據,為提供數據挖掘與知識服務奠定了基礎。
數據挖掘與知識服務包含了兩個方面的含義,壹方面是指對館藏油氣地質資料中的有用數據進行挖掘。對地質現象的認識,是隨著相關資料檔案的豐富、技術的更新、方法的優化而不斷精確的。館藏油氣地質資料是在多年的勘探開發工作中不斷形成的,其包含了廣大勘探開發工作者對地質現象認識的不斷總結和提煉。可以通過統計、在線分析處理、情報檢索、機器學習、專家系統和模式識別等諸多方法,對地質資料中有關某壹特定區域、某壹特定地質現象的數據進行深入挖掘、分析,將其中的隱形知識挖掘出來轉換成顯性知識並提供服務。另壹方面是指對用戶利用數據的挖掘。用戶在管理信息系統中,檢索檔案目錄、瀏覽下載檔案電子文件時,都會形成大量的有關利用的數據,包括利用時間、利用熱點、利用興趣方向等,對這些數據進行挖掘,可針對不同用戶的興趣點,提供個性化、有針對性的服務。對用戶利用數據的挖掘,分為3個層次,壹是對全體用戶利用數據的挖掘,分析全體用戶最感興趣的利用服務內容、方式、方法等,以促進利用服務工作的改進和優化。二是對特定群體用戶(如某壹單位、某壹研究室)特定時間段利用數據的挖掘,分析他們的階段性利用興趣,可為有針對性提供主動上門服務提供方向。三是對個體用戶利用數據的挖掘,可分析該用戶的研究方向、傾向的服務方式等,從而為該用戶提供更好地數據資源利用服務。
筆者所在的單位已對用戶利用數據進行了第壹、三兩個層次的挖掘,我們通過管理信息系統統計用戶的搜索關鍵詞、瀏覽與下載興趣等,分析階段時間內全體用戶以及個體用戶利用興趣的Top 10,在用戶檢索界面進行動態顯示與實時更新,總體效果不錯。目前我們正在嘗試對用戶利用數據進行第二層次的挖掘,以便更好地提供利用服務。
1.5 大數據服務
大數據時代已經來臨,借助飛速發展的信息技術和硬件技術,我們日常生活的衣食住行都在不斷形成大數據,這已是社會***識。在目前的油氣田勘探開發各項活動中,形成的數據量非常大,也屬於大數據的範疇;各級地質資料館(室)館藏的油氣地質資料及其數字資源,其數據量更加龐大。面對如此龐大的數字資源,單純提供個體數字資源的服務將逐漸不符合油氣田勘探開發工作的實際,我們要具備大數據的思維,將館藏全部數據資源視為壹個整體,提供整體服務,通過尋找各項地質工作與油氣田勘探發現、油氣田開發產能建設之間的相關關系來提供服務。
據筆者目前掌握資料來看,大數據服務尚未在油氣地質資料部門開展,但Google、Visa等掌握了大量數據的公司進行大數據服務的案例屢見報端。中石油、中石化、中海油等公司都掌握了大量的油氣地質資料數字資源,提供大數據服務來促進油氣勘探發現與油氣田開發產能建設,勢必不會太遙遠。
2 油氣地質資料數字資源服務的保障條件
油氣地質資料相較其他參考資料,具有原始性與系統性兩大優勢。原始性是因為其是油氣田勘探開發工作的原始記錄,系統性則是因為其系統記錄了各項油氣田勘探開發活動的過程和結果。基於這些優勢,必須重點開展油氣地質資料的數字資源服務,創新服務方式。結合工作實際,筆者認為創新服務方式,要具備如下幾方面的保障條件。
2.1 基礎條件——豐富的數字化資源
豐富的數字化資源是開展數字資源服務的基礎條件。豐富的數字化資源包括兩個方面,壹是數字化的紙質地質資料,主要是指利用掃描技術、OCR技術、存儲技術等技術手段,形成館藏紙質地質資料的數字化版本;二是各種數據體,主要是指在物化探、鉆井、測井、錄井等油氣田勘探開發工作中,利用各種儀器采集和(或)形成的大量的數據體,及其解譯數據。這些數據體是對地質現象的原始記錄,是數字資源服務的主體,對其利用需求遠大於對數字化的紙質地質資料的利用需求。而這些數據體往往是各項工作的中間性成果,對其歸檔的控制力度稍弱,需要各級檔案部門采取切實可行的歸檔監管措施,確保這些數據體及其解譯成果能及時、全面地歸檔,以築牢油氣地質資料數字資源服務的基礎。
2.2 技術條件——完善的地質資料管理信息系統
開展數字資源服務,完善的地質資料管理信息系統是技術保障。無論是數字化的紙質地質資料,還是各種數據體,都是以代碼形式存儲在光盤、磁盤等光磁載體上,必須借助完善的地質資料管理信息系統,方能有效地開展利用服務。完善的地質資料管理信息系統應該具備兩方面的基本功能,壹是能作為油氣地質資料日常管理的工具,可提供從歸檔、整理到編目、著錄檢索、統計等各個基本環節的信息化管理,提高日常管理工作水平;二是能作為用戶利用服務的終端,用戶無論是進行目錄、全文檢索,還是全文瀏覽與下載,都可借助於該管理信息系統實時並動態顯示。
2.3 環境條件——大容量的網絡帶寬
從筆者所在單位的情況來看,通過網絡提供地質資料利用服務近年來發展迅猛,在部分單位的地質資料部門已成為提供利用服務工作的主要方式。油氣田勘探開發工作中形成的地質資料,大部分是技術報告以及各種技術圖件,其電子文件體積壹般都比較大,動輒在幾百兆字節(MB)甚至吉字節(GB),要將這些大體積的電子文件通過網絡提供利用,大容量的網絡帶寬必不可少。
2.4 智力條件——具有大數據思維的地質資料工作者
任何壹項工作的正常開展,都必須有壹定數量的專業技術人才為依托。筆者認為,要充分開展油氣地質資料數字資源的利用服務工作,具有大數據思維的地質資料工作者是必不可少的智力條件。壹方面,他們可從資料檔案專業的角度,按資料檔案工作的規律與特點開展油氣地質資料數字資源的利用服務工作;另壹方面,他們還可從數據的角度,開展對油氣地質資料數字資源中豐富數據的挖掘、提煉與整合,結合油氣田勘探開發業務工作,提供有針對性的內容服務;第三方面,他們還可從大數據的角度,將油氣地質資料數字資源作為壹種大數據來整體考慮,通過IT部門的配合,來發掘各類數字資源與油氣田勘探開發工作的相關關系,從而提供其他利用服務方式所無法提供的數據與知識服務。
參考文獻
[1]葛紅.數字時代檔案信息資源的開發利用[J].科技與企業,2010(6):84~85.
[2]塗子沛.大數據[M].南寧:廣西師範大學出版社,2012.
[3]Q/SH 0167-2008 石油天然氣勘探與開發油氣地質資料立卷歸檔規則[S].2008-02-25.
[4]British Geologecal Survey.British Geological Survey Annual Report 2010-11[EB/OL].2011[2013-02-25].http://www.bgs.ac.uk/downloads/start.cfm?id=2252.