PCA 算法優化地震屬性
時間:2015-12-02 10:30
來源:
作者:劉海軍
在儲層量化過程中,地震屬性作為衡量標準對最小計算單元內的各相鄰地震道進行分類,進而求解信息量。在基于地震屬性的儲層預測中,地震道被抽象成一組地震屬性的集合,進而利用模式識別算法建立整個區塊的含油氣模型。由此可知,地震屬性優選及優化是關乎后續兩個研究點成功與否的重要一環。地質構造在不同巖性類型、地質、區塊及不同解釋層位具有互異性,敏感地震屬性可用于反映地質構造,因此應當通過一定方法選取對當前地質構造較敏感的地震屬性。振幅、地震差異振幅、主頻、波阻抗等地震屬性是巖性油氣藏地質結構中常用的敏感地震屬性。
基于單井屬性綜合分析法,可選取均方根振幅、最大振幅、最小振幅、平均振幅、均方根振幅(能量)差異、最大振幅差異、最小振幅差異、平均振幅差異、均方根主頻率、最大主頻率、最小主頻率、平均主頻率、均方根道積分、最大道積分、最小道積分、平均道積分、波形弧長、波阻抗共18 種敏感地震屬性。由于不同地震屬性之間存在一定程度的冗余,這將導致計算維度及復雜度的增加,因此需要對優選的地震屬性進行優化。通過PCA 算法可對優選的18 種地震屬性進行優化。
地震屬性優化的必要性
通過分析合成地震數據與實際地震數據可知,地震屬性與儲層流體性質、儲層參數、儲層物性之間存在復雜的非線性關系。不同區塊和不同儲層對象具有完全不同的敏感地震屬性,即使是在同一區塊、同一儲層,預測對象不同也會導致敏感地震屬性的不同。
當前可以提取地震屬性達上百種,但是目前為止真正具有實際意義的屬性并不是很多。通常優選的地震屬性存在如下的問題:某些屬性可能反應的是干擾的變化,而與目的層位本身無關。若不對輸入的屬性進行優化,會帶來錯誤;屬性的增加意味著計算維度的增加。在模式識別過程中,維度的無限制增加往往帶來維度災難。即使不帶來維度災難,也會增加計算方面的困難,過大的數據量要占用大量的內存空間和計算時間;不同屬性之間往往存在較大耦合度,如在振幅與能量之間,包含著許多彼此相關的因素,容易導致信息的重復和浪費;就模式識別而言,當訓練樣本個數固定時,屬性過多會造成分類效果的惡化及過學習現象的發生。因此,在利用地震屬性進行儲層預測的過程中,為了避免上述問題的發生,需結合所研究區塊的地質概況選取具有代表性的敏感地震屬性,并對優選的地震屬性進行優化,通過地震屬性的優化亦可達到降低耦合度、簡化計算的目的。
基于PCA 的地震屬性優化
根據各指標間的相互關系或各指標值的變異程度來確定權重系數,能夠真實地反映事物間的現實關系,避免人為因素帶來的偏差。在研究多變量問題時,變量太多會增大計算量和增加分析問題的復雜性,研究人員希望在進行定量分析的過程中涉及的變量較少,而得到的信息量又較多,主成分分析成為解決這一問題的理想工具,可以將這種降維并選取主成分的思想應用到地震屬性優化上,在利用PCA 算法進行屬性優化時需按照如下方式進行:首先確定輸入向量維度及待選分量,確定待優化屬性;其次選取個樣本道(地震道屬性信息)作為輸入樣本,樣本個數大于等于向量維度。
樣本道的選取應盡量覆蓋所研究工區,而且盡量在同一地震相內選取,在工區地震道規模較小的情況下可以考慮選用全部地震道作為輸入。在實際應用中,通常對各指標作標準化變換,以消除原指標量綱、數量級的不同。由于PCA 是基于方差來確認貢獻率,在某衡量標準上方差越大則各樣本在該衡量標準上的離散程度越大,則此時識別樣本的效果越佳。利用PCA 算法進行屬性優化的具體過程如下:首先選取所有待求地震道的18 個優選地震屬性作為PCA 的輸入并計算相關矩陣;其次計算該相關矩陣的特征值及特征向量,并將特征值按由大到小順序排序;選取累計貢獻率(特征值之和)達到總貢獻率85% 以上的前m 個特征值對應特征向量作為優化主成分,屬性優化PCA 主成分矩陣結果。經過上述步驟后即可利用優化主成分將所有地震道地震屬性由初始維度降低到m 維。若m=5, 即利用PCA 算法將地震屬性從初始18 維空間降低到5 維空間。
通過PCA 算法達到了去除屬性相關性及降低維度的目的。由于不同地震區塊、不同層位、不同巖性對不同地震屬性敏感,因此需要針對特定區塊、特定層位、特定巖性做地震屬性敏感性分析,通過統計測井與地震屬性之間的耦合關系優選地震屬性;同時由于不同地震屬性之間往往存在一定的耦合度,通過PCA 算法可達到屬性優化的目的。