(2011年05月18日,中國北京)中國石油西南油氣田公司勘探開發(fā)研究院始建于1953年,是我國石油天然氣勘探開發(fā)行業(yè)中建院較早,集石油天然氣地質(zhì)勘探、油氣田開發(fā)、地質(zhì)開發(fā)試驗和計算機(jī)應(yīng)用等為一體的綜合性應(yīng)用科學(xué)研究機(jī)構(gòu),其主要任務(wù)是圍繞川渝油氣工業(yè)發(fā)展目標(biāo),開展各級重點(diǎn)科技項目攻關(guān),資源評價,編制勘探開發(fā)規(guī)劃、油氣田開發(fā)方案,為開拓油氣勘探新領(lǐng)域,擴(kuò)大后備資源和科學(xué)、合理、高效開發(fā)油氣田提供重要科學(xué)依據(jù)。
亟需輕量級、高效的監(jiān)控管理系統(tǒng)
油氣勘探與開發(fā)要面對著多種多樣的復(fù)雜多變的地質(zhì)情況,特別是在我國,油氣田大多埋藏于幾百甚至幾千米的地層深處,而且地質(zhì)狀況復(fù)雜,準(zhǔn)確尋找油氣田位置非常困難,油氣勘探與開發(fā)呈現(xiàn)高風(fēng)險、高投資和見效慢的特點(diǎn)。為了提高勘探的精度,縮短勘探時間,高性能計算技術(shù)被引入到石油勘探業(yè)務(wù)中,成為石油勘探業(yè)務(wù)提高效率的利器。
中國石油西南油氣田公司勘探開發(fā)研究院一直走在用高性能計算技術(shù)助力油氣勘探與開發(fā)的前列。從1977年為承擔(dān)引進(jìn)的用于測井資料處理解釋的85機(jī)的管理需求組建第七研究室開始,經(jīng)過30余年的發(fā)展,中國石油西南油氣田公司勘探開發(fā)研究院計算機(jī)中心已經(jīng)擁有大中型計算機(jī)服務(wù)器、PC集群、專業(yè)計算機(jī)工作站等設(shè)備組成的計算機(jī)群,形成了包括地震數(shù)據(jù)處理和解釋、測井?dāng)?shù)據(jù)處理和解釋、油氣藏數(shù)值模擬、油氣藏生產(chǎn)分析、三維地質(zhì)建模等處理和解釋能力,成為西南油氣田公司最大的計算機(jī)技術(shù)應(yīng)用中心,為川渝老氣田穩(wěn)產(chǎn),并加快增儲上產(chǎn)步伐,著力推進(jìn)技術(shù)創(chuàng)新尋找新的勘探目標(biāo),提供了強(qiáng)有力的計算機(jī)應(yīng)用服務(wù)。
由于油氣勘探計算機(jī)應(yīng)用環(huán)境管理的復(fù)雜性,中國石油西南油氣田公司勘探開發(fā)研究院一直在尋求一個簡潔的、輕量級的、全面的、高度集成的計算中心監(jiān)控管理解決方案,該解決方案要能對計算中心所有主要軟件的應(yīng)用情況、硬件設(shè)備狀況,包括:許可證、數(shù)據(jù)庫、服務(wù)器、交換機(jī)、存儲、UPS、機(jī)房環(huán)境等實現(xiàn)全面的監(jiān)控;能夠針對所有被監(jiān)控的設(shè)備提供功能全面的異常報警功能,能快速發(fā)現(xiàn)和定位問題;其本身的系統(tǒng)要求開銷極低,對監(jiān)控對象的干擾幾乎可以忽略不計,同時其監(jiān)控信息收集的功能又必須高效、強(qiáng)大,在保證監(jiān)控信息足夠詳細(xì)的情況下,其數(shù)據(jù)收集延遲最小可到秒級,從而達(dá)到極高的時效性和實用性。例如針對機(jī)器監(jiān)控,中國石油西南油氣田公司勘探開發(fā)研究院定義了30多項監(jiān)控指標(biāo),包括:CPU利用率、內(nèi)存利用率、IO、網(wǎng)絡(luò)流量、網(wǎng)卡狀態(tài)、CPU溫度、CPU風(fēng)扇、當(dāng)前進(jìn)程、活動用戶、本地磁盤、NFS磁盤、BIOS狀態(tài)等,這些信息在特定情況下,必須數(shù)秒內(nèi)更新,以保證對機(jī)器監(jiān)控的精細(xì)程度,滿足性能分析和調(diào)優(yōu)的要求。
Platform Cloud Insight —— 一體化、集成的IT信息管理軟件
在考察了業(yè)界主要的高性能計算解決方案提供商之后,西南油氣田公司勘探開發(fā)研究院選擇了全球領(lǐng)先的集群、網(wǎng)格、云中間件和云管理平臺提供商Platform公司的Platform Cloud Insight解決方案。Platform Cloud Insight將資產(chǎn)管理、資源監(jiān)控、統(tǒng)計分析和常用的系統(tǒng)管理功能有機(jī)地整合在一起,利用Platform Cloud Insight,系統(tǒng)管理員可以一站式地完成大多數(shù)日常的系統(tǒng)管理工作,極大地簡化系統(tǒng)管理工作的復(fù)雜性、減少工作量。
Platform Cloud Insight提供了以下功能:
Platform Cloud Insight 通過包括Platform專利的EGO資源管理協(xié)議以及SNMP、IPMI、Telnet、SSH、JDBC、SYSLOG、Flexlm/Flexnet等多種協(xié)議和方法,提供了對計算中心幾乎所有軟、硬件設(shè)備的監(jiān)控功能,包括:機(jī)器、交換機(jī)、存儲系統(tǒng)、UPS、數(shù)據(jù)庫、軟件許可證、機(jī)房環(huán)境;并提供針對這些設(shè)備詳細(xì)的、全方位的信息收集和必要的遠(yuǎn)程管理功能。
基于角色的權(quán)限管理和訪問控制。
Platform Cloud Insight 支持細(xì)粒度的系統(tǒng)管理權(quán)限劃分和角色定義,可以輕易定制多種角色,以不同的權(quán)限訪問系統(tǒng)。例如:可以定義網(wǎng)絡(luò)管理員、存儲管理員、數(shù)據(jù)庫管理員等多種角色,相應(yīng)地只分配合適的權(quán)限,避免管理員權(quán)限過大和不必要的誤操作。
強(qiáng)大的報警功能。
Platform Cloud Insight 提供了強(qiáng)大的事件配置和報警功能,幾乎所有的監(jiān)控指標(biāo)都可以定義為報警事件。并且,Platform Cloud Insight 可以在全局層面和指定設(shè)備層面配置報警事件,實現(xiàn)從宏觀到精細(xì)的事件報警。
高擴(kuò)展性、超輕量級和高效率。
針對計算中心數(shù)量占絕對多數(shù)的服務(wù)器設(shè)備,Platform Cloud Insight 通過底層使用Platform專利的EGO資源管理技術(shù),實現(xiàn)了高擴(kuò)展性、超輕量級和高效率。Platform EGO已經(jīng)在多家客戶生產(chǎn)環(huán)境中實現(xiàn)了5000個機(jī)器以上的統(tǒng)一資源管理和監(jiān)控,并且在這種情況下,即使監(jiān)控數(shù)據(jù)更新的延遲設(shè)為數(shù)秒,產(chǎn)品本身對被監(jiān)控機(jī)器的系統(tǒng)開銷(CPU、內(nèi)存、網(wǎng)絡(luò)等)極低、幾乎可以忽略不計。
從“黑箱”變?yōu)?ldquo;白箱”
通過實施Platform Cloud Insight解決方案,中國石油西南油氣田公司勘探開發(fā)研究院將資產(chǎn)管理、資源監(jiān)控、統(tǒng)計分析和常用的系統(tǒng)管理功能有機(jī)地整合在一起,通過瀏覽器就可以輕松、方便地監(jiān)控管理計算中心幾乎所有軟、硬件設(shè)備,計算中心的運(yùn)行情況,通過網(wǎng)絡(luò)拓?fù)鋱D和物理拓?fù)鋱D結(jié)合,大大提高了計算中心設(shè)備可視化程度,通過Cloud Insight性能統(tǒng)計分析功能,找出各種設(shè)備的運(yùn)行規(guī)律,從而制定有效的報警策略,實現(xiàn)異常的快速發(fā)現(xiàn)和報警,大大減少了計算中心設(shè)備故障率和故障時間,提高了計算中心的服務(wù)水平,在提高系統(tǒng)管理員對故障的響應(yīng)時間的同時,減少了系統(tǒng)管理員的工作強(qiáng)度。
統(tǒng)一的勘探開發(fā)數(shù)據(jù)庫監(jiān)控管理。
針對中國石油西南油氣田公司勘探開發(fā)研究院的多套勘探開發(fā)應(yīng)用數(shù)據(jù)庫,Platform Cloud Insight 提供了統(tǒng)一的監(jiān)控界面,可以快速、詳盡地監(jiān)控 Oracle 9i,10g 等不同版本數(shù)據(jù)庫,包括數(shù)據(jù)庫服務(wù)器的狀態(tài)(CPU,內(nèi)存,IO,CPU溫度、風(fēng)扇等)和數(shù)據(jù)庫本身的狀態(tài)(包括進(jìn)程狀態(tài)、內(nèi)存使用、用戶、表空間、文件、Session、后臺作業(yè)等)。很多監(jiān)控信息,即使是熟練的DBA,也很難快速、直觀地獲得。通過Platform Cloud Insight,中國石油西南油氣田公司勘探開發(fā)研究院顯著提高對多套勘探開發(fā)數(shù)據(jù)庫的監(jiān)控效率和詳細(xì)程度,大大降低了數(shù)據(jù)庫監(jiān)控管理的技術(shù)門檻。
詳細(xì)、高度關(guān)聯(lián)的存儲系統(tǒng)監(jiān)控管理。
Platform Cloud Insight 對存儲系統(tǒng)監(jiān)控管理不僅是針對存儲本身,而是將磁盤陣列、交換機(jī)(光纖交換機(jī)、以太網(wǎng)交換機(jī)等)、存儲服務(wù)器、文件系統(tǒng)有機(jī)整合在一起,提供一個詳細(xì)且高度關(guān)聯(lián)的監(jiān)控界面,幫助存儲系統(tǒng)在各個方面的性能調(diào)優(yōu)。例如:針對中國石油西南油氣田公司勘探開發(fā)研究院高性能計算系統(tǒng)的存儲監(jiān)控,Platform Cloud Insight 同時提供了存儲服務(wù)器狀態(tài)、并行文件系統(tǒng)狀態(tài)、光纖交換機(jī)流量和端口狀態(tài),存儲磁盤LUN的讀寫狀態(tài)監(jiān)控。系統(tǒng)管理員可以通過Cloud Insight 檢查并行文件系統(tǒng)中多臺存儲服務(wù)器的負(fù)載和讀寫是否均衡,從而針對文件系統(tǒng)進(jìn)行調(diào)優(yōu);存儲上每個LUN的讀寫是否均衡,從而調(diào)整存儲配置,達(dá)到最大的條帶化讀寫效率;光纖交換機(jī)流量是否飽和和端口狀態(tài),從而確定多路徑軟件是否工作正常。
中國石油西南油氣田公司勘探開發(fā)研究院計算中心應(yīng)用研究室主任王軍介紹說:“選擇Platform Cloud Insight是從我們管理業(yè)務(wù)本身和適用性上考慮的,在實測中,軟件本身的系統(tǒng)開銷(CPU、內(nèi)存、網(wǎng)絡(luò)流量)不到0.5%。Platform Cloud Insight可以充分滿足我們對監(jiān)控軟件的要求。”