東方物探是業(yè)內耳熟能詳的專業(yè) “找油”公司,近年來,承擔國 內外的內外陸地、淺海地震勘探,及綜 合物化探采集、處理、解釋的數個重大 項目。即便如此,東方物探依然在提高 自身相關技術上下狠功夫,大量投入資 金購置計算機軟、硬件設備,以確保高 效、安全地交付工程任務。在總工程師 賴能和的眼里,如何用好這些軟硬件并 提高其性能,成為他工作的重中之重。 日前,記者采訪了賴能和先生。
他表示,在英特爾的協助下,進行必 要的合理配置軟硬件,就能實現整體 系統(tǒng)負載平衡。東方物探目前擁有5.8 萬個核,運算能力達到528萬億次/秒 (528T),存儲達8000個T。在2011年 一共引進的2498個CPU中,90%來自英 特爾。
合理配置 實現HPC平衡負載
據賴能和介紹,對于一臺高性能 計算機,要實現最大效益,不僅需要硬 件系統(tǒng),還要有配套的系統(tǒng)軟件、應用 軟件,可謂“平衡”。比如并行文件系 統(tǒng),一些操作系統(tǒng)的優(yōu)化,英特爾公司 和BGP進行了近六年的合作,主要體現 在GeoEast軟件開發(fā)上。
從應用軟件角度講,優(yōu)化則更明 顯,每一套應用軟件要采用英特爾編譯 系統(tǒng)。英特爾的專家針對GeoEast軟件 在石油行業(yè)的應用,提出了很多建議。 如時間偏移,他們進行持續(xù)跟蹤,根 據應用采用有效工具對軟件進行特征分 析,使“時間偏移”軟件性能當時就提 高5倍左右;其次是三維RNA,該模塊 非常費時,英特爾公司幫助進行優(yōu)化, 目前已經取得極大進展。
賴能和告訴記者,東方物探這幾 年投入上千萬做技術改造,目的是要提 高CPU利用率,提高存儲性能,確保數 據安全及降低能耗。
CPU的架構和網絡技術、存儲、存 儲網絡、核心應用等,都會影響CPU利 用率。因此,合理選擇CPU的主頻,可 有效提高CPU利用效率。賴能和認為, 不同的存儲架構,差別非常大,萬兆的 性能遠遠超過千兆,兩者相差5倍。不 同的存儲品牌,性能差別也很大,存儲 網絡對存儲的性能影響同樣非常大。要 優(yōu)化配置,存儲關鍵是參數。從這五個 方面提升I/O的性能,便可提升整個系 統(tǒng)存儲性能,最終達到提高CPU利用率 的目的。協調好上述五方面,才能建立 一個平衡的計算機系統(tǒng)。賴能和總工指 出,要建造一套高性能、高效率的計算 機,需要英特爾這樣擁有雄厚技術力量 做支撐和后盾的公司。
近五年來,存儲是作為目前石油 行業(yè)在IT設備里增長最快的一項,每 年增長在2500~3000T左右,而目前 價格卻都在下降。賴能和介紹說,從 性能上他們也在選擇一些高性能的存 儲。英特爾提出SSD,因為它功耗非 常低,I /O讀寫性非常好,他們現在 正在做數據庫應用的嘗試,全部采用 SSD(固態(tài)硬盤),同時高性能計算機的 內置盤也開始嘗試用SSD,以后可能會 用得比較多。
如何更好地優(yōu)選軟、硬件
CPU、APU、GPU,業(yè)內已經很熟 悉,尤其是GPU目前被炒得很熱。東方 物探目前擁有184個GPU,一個168個 GPU是整裝。當然GPU還有很多不足的 地方。賴能和建議,選擇GPU時,不注 意選密度。因為密度高,其功耗、噪音 非常大,穩(wěn)定性還有些不足。目前GPU 在工業(yè)界用得非常多,主要的服務商全 部都支持。“我們曾做過測試,軟件在 上面跑的效果不錯,全部采用英特爾至 強處理器,8萬個核,不到兩天就完成 了。”
“網絡方面選擇時也要注意,因 為大家可能會選萬兆。“賴能和坦言, 當時他們選用的是銅纜,集成困難較 多,容易出問題。”GPU是好東西,但 還很新,很多東西都需要摸索。”
目前的多路服務器, 國內非 常多, 應用非常好, 尤其像惠普、 IBM、曙光、聯想等都有2路、4路、8 路,特別是8路服務器用得比較多。賴 能和透露,東方物探目前有二三十套8 路服務器。
云計算是把很多計算機聯網或者 自動傳到計算機上,減少終端用戶的負 擔,目前受到廣泛關注。云計算被國家 列為新興產業(yè)重要發(fā)展戰(zhàn)略之一,市場 潛力比較大。賴能和總工指出,“我們 要保持清醒,尤其是從事計算機領域的 工作者,需要跟上級領導客觀反映。現 在有很多問題沒有解決。一是云計算發(fā) 展的相關法律法規(guī)沒有解決,這關系到 數據安全問題,誰來保護數據安全。二 是知識產權的相關內容。如目前石油數 據處理,世界上沒有一家公司把所有數 據處理任務都放在云平臺上,因為數據 的移動很大,很難做。三是一些核心技 術需要突破。芯片、服務器、存儲、設 備要繼續(xù)發(fā)展,云計算要客觀理解和對 待,但我們還是要跟蹤,我的觀點是要 緊密跟蹤,客觀評價。”