專家分享:智慧油田建設最實用方案
時間:2020-08-07 11:08
來源:
作者:songxinyuan
以智能化技術為代表的新一輪油氣革命拉開了序幕,為了提高決策質量和管理水平,石油公司紛紛啟動智能油田項目。隨著智能油田建設的逐步深入,人工智能技術必將發揮更重要的作用。
按照中國石化智能油田建設規劃和定義,智能油氣田在生產管控、一體化決策、油氣藏經營等業務應用領域,實現對勘探開發全過程的全面感知、集成協同、預警預測及分析優化的四個方面的能力。
這其中,預警預測是實現以業務管控模型及專家經驗、案例庫等閉環式持續優化的預警預測能力;分析優化主要是建立開發方案- 動態管控- 調整方案的閉環式油藏管理體系,智能形成油氣藏(井)解決方案,實現資源最優化開發的目標。人工智能技術,特別是機器學習是實現這兩項能力的基礎。而構建實用、高效的“人工智能平臺”將是支撐“預警預測及分析優化”實現的基礎和保障。
人工智能平臺的理解
人工智能是一種基于數據分析的技術,這種技術基于在云計算和大數據技術,來解決行業各個生產階段中預測和分析。
隨著數字油田領域智能化的推進,運用AI技術來形成快速、高效的預測分析手段,已經成為一種潮流。相對于傳統經驗公式的長周期、區域適應較差的問題,人工智能,尤其是其中的機器學習方法可以充分利用大量數據建設的成果,快速的提取其中的關聯和規律,為油田各個業務環節帶來更加快速和準確的解決方案。

隨著當前基于Python與Spark等開發環境的推廣,機器學習(包括深度學習)技術獲得了廣泛的應用。在這種行業算法積累到一定程度,我們開始思考關于人工智能如何系統應用的問題。這些問題重點在于,如何快速的構建企業智能化方法,如何快速構建企業智能應用并部署發布的問題。也就是說,如何將人工智能技術系統的應用在行業中,實現數據獲取、處理、建模到部署發布的流程化、系統化與標準化。
這是企業邁向行業智能的必然趨勢,人工智能平臺就是解決這個問題的。
但是,人工智能平臺目前存在建設目標泛化的巨大風險。
人工智能平臺的定位是多樣化的,可以是底層的人工智能軟件開發API,可以是構建人工智能的云計算開發部署環境,可以是一種基于大數據的架構,可以是人工智能通用分析工具(就是數據挖掘),當然,最重要的是人工智能建模工具。進一步,這種建模工具上面向不同的行業逐步深入,就是某一個行業領域的數據解決方案。

自左到右,這種技術體系的不同重心,帶來了“AI平臺”建設中定位的不同,以及市場選擇的不同。
所以說,人工智能平臺的建設目標和關注內容不同,直接導致了我們會出現用戶群完全不一樣的平臺產品。
然而,更大的風險還不是層次選擇的問題,而是在面向行業平臺建設時,出現的用戶群偏差帶來的功能設計的不同。
進一步說,即便做智能建模,可能面對的用戶群也是完全不同。如果面向IT人員,那么軟件主要功能就在軟件定制化與集成,甚至是更多的功能的代碼化支撐以及軟件的部署發布;如果面向業務分析人員,那么功能設計重點就在于如何面向一個場景將特定的(特定業務、特定格式、特定異常)數據、處理和算法進行整合設計,以及其快速的形成一個智能模型方案。
你的選擇,直接決定了智能平臺建設的價值體現在那個環節。
石油勘探、開發與工程領域(上游)的人工智能需求特點
以下是針對石油勘探開發領域,也就是油氣上游領域的人工智能應用。
石油行業的研究是一個綜合石油地質、油氣運聚、油藏流體及井筒工程的復雜過程,其計算和分析過程相對成熟,其數據模型和數據處理方式也具有比較成型的算法。但是,隨著大數據和AI技術的發展,從數據中尋找規律和模式,以輔助行業的各個階段做出預測、分析和判斷是AI當前的主要需求。
因此,AI技術的應用,一方面是應用通用AI技術(影像語音文本)加持油田生產管理,另一方面是提升數據分析技術的應用,進而提升數據在行業中的深化應用。
相對來說,后者可能是一個更有長期發展潛力的應用模式。
石油行業的數據體系和人工智能應用的互聯網領域的數據來源具有很大的不同。
石油行業的數據以結構化為主。作為一種典型的工業數據體系,各油田多年來都發展出來了統一的結構化數據模型(EDM、SeaBed、EPDM、EPBP)。在數據的共享方式上,一種模式是開放數據庫訪問,另一種是通過數據服務(Json/WS)提供用戶的數據訪問。另有一些專業格式是以文件形式存在,如地震類、測井類以及油藏模擬的體網格,但是這種大文件數據內部也是具有嚴格內部,在結構上具有很強的規律性。

結構化數據為主,專業化格式為輔,多媒體數據價值更低。這是油氣上游行業中的數據特點。
對于上述各類數據的分析多年來也形成了非常系統的地震、地質、井筒工程、油藏、開采等業務應用模式,其數據分析不僅具有嚴格的數學模型(演繹),在經驗模型(歸納)上也早已進行了長期的實驗和應用,也就是說,我們傳統的數據挖掘和機器學習方法在石油行業的各個領域的應用歷史已經非常悠久了,即便是一些最新的深度學習和強化學習方法,在地球物理(地震)、井筒地球物理、油藏開發與開發生產等產生大數據量的領域也逐步開展起來。
因此,如何整合傳統的基礎方法和經驗模型方法,是智能化技術應用重點(對于數據量和數據質量有限情況下的傳統機器學習方法,更是如此)。
石油勘探開發領域AI應用存在的問題及需求
雖然目前基于Python這樣開發語言與大量的AI-API已經大大降低的人工智能技術的應用門檻,但AI技術作為一種新技術在應用上仍舊具有一定的復雜性。
大量的算法應用,以及算法的應用比較和訓練模型的評估方法,都具有一定的專業性和技術壁壘。
數據獲取:各油田本身的數據具有高度保密性,相互之間的共享困難,這是其一。
數據質量:各油田的數據建設水平參差不齊,但即便數據治理最優秀的地區,其數據質量都是存在較大問題的;
數據規范:各種數據在指標參數設定、量綱、描述與計算方法上都存在差異,這使得不同地區和設備數據具有一定差異;

數據量:油氣各個生產環節還有大量人工錄入的數據,這種數據不僅質量上存在問題,在數據量上也嚴重不足,但是當前基于物聯網采集在很多領域的快速鋪開,自動采集和人工采集結合的方式可以有效解決數據量和數據質量的問題。
傳統的AI建模平臺一般會提供基本的數據處理工具并提供大量常規處理函數,但這些函數對于油氣行業的專業化處理要求依舊有很大的差距。
首先,如各種專業格式的提取和轉換、多種尺度數據的融合等很多方面,都是通用處理函數不能解決的,因此,必須面向不同的業務主題,提供與該主題對應的大量數據處理方法。
其次,是基于行業計算的新特征計算。由于機器學習的效率高度依賴強相關特征的構建,因此在不同的業務場景中用專業方法構建“專業化的特征項”是解決分類和預測的核心技術,多年來大量專業領域論文顯示的AI技術應用重點,也是在這個方向。
大量業務領域中的專業算法設計與研發具有一定難度。尤其在AI技術處于爆發期的現今,如何找到具有適用性的算法并基于特定地區和場景形成可用的訓練模型,這是當前大量行業論文研究的焦點,應該也是人工智能最為核心的問題。
當然,在數據量和算法處理量達到一定規模后,如何集中資源統一訓練模型也是需要解決的問題。
完成的算法研究,如何落實到具體的生產場景也是一個問題。這些問題包括:
如何獲取生產地區大量的數據并高效的完成處理和融合?
如何針對地區數據訓練結果快速實現智能服務發布和智能應用構建?
油氣行業AI平臺的一些建設方法
針對AI平臺在行業中的應用,此處從三個角度提出了類似平臺的功能性要求,也就是從技術角度、行業應用角度和產品用戶體驗角度。
1、石油勘探開發領域 的AI平臺,技術性設計重點(4個)
從不同的數據來源(數據庫、數據服務、數據文件)提供數據獲取的功能,是極其重要的。
在一個統一界面中,快速實現從數據獲取、處理、融合、算法調用、訓練、發布,定制過程快速而清晰。
實現數據處理方法與模型訓練方法的可自主創建、可統一管理、可復用,尤其針對行業用戶,可實現算法分類管理的可定制。
2、石油勘探開發領域的AI平臺,行業性設計重點(3個)
具有常規國內勘探開發數據庫和數據模型的直接掛接,建立基礎的數據生態。
主題業務場景(如地震屬性巖體識別、鉆井參數優化、開采工況預測等)中,用戶能夠快速建立從數據提取、處理融合到訓練發布的智能服務。
提供針對不同專業領域的數據處理、數據融合以及特征構建的專業方法,并形成這種專業方法的管理和積累。
要有一套足夠強大的理論方法。所有數據分析與數據挖掘軟件都是基于某一個分析流程,這個分析流程的概念明確、理論清晰。
基于該流程,用戶可以最快的形成一個流程閉環,以實現快速上手、快速實現的目的。這種定制可以不考慮大量數據處理和分析的細節,但主干過程一定是簡單而快速,使得用戶可以以最清晰和簡潔的路徑直達目標。
對于專業的用戶的一些復雜數據處理、分析和算法設計, 支持用戶必要的擴展手段。同時,擴展方法的技術壁壘較低,用戶可以逐步創建和積累相關方法,通過時間來實現復雜性積累,而不是代碼規范的復雜度。
數字油田智能化建設依然任重道遠。為了更好地把握AI技術的紅利期,推進數字油田領域的智能化建設。
1994年畢業于成都理工石油地質專業,中國海洋大學“地質工程”碩士,中國地質大學(武漢)“地學信息”博士。
研究方向為石油勘探開發數據模型與數據分析、油氣專業軟件架構設計、盆地與含油氣系統模擬與分析等,曾承擔多項國家科研項目與石化集團科研項目。2015年以來出版《油氣勘探數據與應用集成》(電子科技大學出版社,一著)、《數字油田在中國數據篇》(科學出版社,合著)、《數字盆地》(科學出版社,一著)、《數字油田二十年》(科學出版社,合著)等多部學術專著。