在當(dāng)前高性能計(jì)算系統(tǒng)和應(yīng)用中,絕大多數(shù)是x86架構(gòu)的處理器和應(yīng)用,隨著高性能計(jì)算系統(tǒng)性能的不斷提升,多核和眾核異構(gòu)系統(tǒng)在滿足高性能計(jì)算的某些特殊應(yīng)用時(shí),則表現(xiàn)出比較出色的性能。
勇于嘗試眾核技術(shù)
不久的將來,英特爾將推出32核Knights Ferry,堪稱眾核技術(shù)的一個(gè)頂端。英特爾副總裁兼數(shù)據(jù)中心事業(yè)部總經(jīng)理KirkSkaugen表示:“英特爾集成眾核(MIC)架構(gòu)將進(jìn)一步擴(kuò)大我們業(yè)已領(lǐng)先的高性能計(jì)算產(chǎn)品和解決方案的競爭優(yōu)勢。英特爾現(xiàn)有的產(chǎn)品在全球頂級的高性能計(jì)算機(jī)中應(yīng)用的比例已經(jīng)接近82%。在此方面的投資也進(jìn)一步驗(yàn)證了英特爾對于全球高性能計(jì)算領(lǐng)域不斷增強(qiáng)的承諾。”
中國石油東方地球物理公司研究院處理中心總工程師賴能和先生告訴記者,“我們非常關(guān)心眾核技術(shù)話題,將來MIC將采用另外一種編程語言,即英特爾的Ct,它和目前的編程究竟有多大差別,我們也很關(guān)心。”他還強(qiáng)調(diào):現(xiàn)在GPU推動(dòng)起來有點(diǎn)難度,就是因?yàn)楹苌儆猩虡I(yè)化軟件支持這項(xiàng)技術(shù),這是很致命的。“CPU和GPU各自要用自編的一種語言來重新編寫軟件,一套軟件系統(tǒng)要很多年的時(shí)間去重新移植,這樣很多公司也存在風(fēng)險(xiǎn),我們與幾家外國公司商量過,了解他們下一步怎么做,目前正在測試,我們會(huì)一直關(guān)注眾核技術(shù)及研究應(yīng)用,并且一直在做測試,目前還在測試階段。”
努力提高CPU效率
據(jù)用戶的測試,當(dāng)超過120個(gè)CPU核以上時(shí),CPU利用率開始降低。針對這一現(xiàn)象,賴能和分析說,現(xiàn)在實(shí)際的CPU利用率一直以來不是特別高,這方面我們也非常關(guān)注。
近幾年來,東方物探公司投入了一千多萬元,用來提高CPU的利用率。一是針對它的CPU I/O(輸入/輸出)方面存在的存儲瓶頸問題。二是與I/O有關(guān)系,在文件系統(tǒng)上,一般是NFS(網(wǎng)絡(luò)文件)系統(tǒng),現(xiàn)在采用的是定性的系統(tǒng),性能提高了很多。三是在網(wǎng)絡(luò)上,太多的節(jié)點(diǎn)出現(xiàn)后,超過120以后性能無法提升。這其中有很多因素,一方面是I/O,另一方面是MPI(消息傳遞編程模型),MPI本身如果多了以后效率就會(huì)降低。
東方物探公司在提高CPU利用率方面做了系統(tǒng)改造。賴能和說:“比如在接口方面的存儲,有單口、雙口、2個(gè)G、4個(gè)G,針對不同應(yīng)用,我們會(huì)選擇合適的接口,影響很大。從連接、使用的方面上,在縱橫面系統(tǒng)的過程中做的比較合適,我們做了很多場次,取得了比較理想的成效。目前CPU達(dá)到了比較好的平衡。” 賴能和告訴記者:他們花錢換來的是高性能的I/O,高性能的I/O換來之后CPU明顯提高,這不是對所有應(yīng)用都適用,在使用上有一個(gè)原則——常規(guī)處理、創(chuàng)新處理、并行處理。因?yàn)镮/O不是太多,一次性讀多了就不愿意再讀了,100個(gè)節(jié)點(diǎn)中每個(gè)節(jié)點(diǎn)上的數(shù)據(jù)都要懂一點(diǎn),自己內(nèi)存盤和CPU內(nèi)存之間交換,不通過網(wǎng)絡(luò),常規(guī)數(shù)據(jù)在100個(gè)節(jié)點(diǎn),很多人去讀,整個(gè)節(jié)點(diǎn)是并行的,數(shù)據(jù)很快,從而實(shí)現(xiàn)常規(guī)處理效果的提高。