- 相關推薦
在生活、工作和學習中,難免會面對無法預料的突發事件,為了可以第一時間作出應急響應,總歸要預先編制應急預案。應急預案的格式和要求是什么樣的呢?以下是小編幫大家整理的機房應急預案,歡迎大家分享。
機房應急預案1
第一條 機房突發事件包括網絡設備或服務器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。 針對突發事件的預防措施如下: 建立安全、可靠、穩定運行的機房環境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統;加強防火、防盜意識。
第二條 機房漏水應急預案如下:
一、發生機房漏水時,第一目擊者應立即通知機房管理人員。
二、若空調系統出現滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時聯系設備供應方處理,必要情況下可臨時用電扇對服務器進行降溫。
三、若為墻體或窗戶滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時安排通知工程人員及時清除積水,維修墻體或窗戶,消除滲漏水隱患。
第三條 機房火災應急預案如下:
一、完善機房環境,確保機房放置滅火器;禁止攜帶易燃易爆物品進入機房。
二、機房管理人員應熟悉機房內部消防安全操作和規則,了解消防設備操作原理,掌握消防應急處理步驟、措施和要領,懂得滅火的'方法,會撲救初起火源。
三、一旦發生火災,迅速切斷機房電源,避免災情的擴散,并迅速和保安部聯系必要時立即報火警。
第四條 機房停電應急預案如下:
一、接到停電通知后,應及時通過辦公系統、電話等發布相關信息,部署應對具體措施,要求在停電前停止業務、保存數據。
二、機房管理人員每日檢查UPS電源的狀態,確保在突發停電時,UPS電源能自動供應服務器正常工作15分鐘以上,保證員工工作的數據及時保存。
第五條 通信網絡故障應急預案如下:
一、發生通信線路中斷、流量異常等故障后,發現狀況的員工或部門領導應及時通知網絡管理員。 二、網絡管理員了解情況后,迅速組織檢測故障區域,并作相關故障處理,逐步恢復故障區與服務器的網絡聯接,恢復通信網絡,保證正常運轉。
第六條 服務器故障應急預案如下:
一、機房管理人員每日檢查機房內各服務器狀態。
二、定期備份數據服務器數據。并將備份資料拷貝到移動設備。服務器出現嚴重硬件故障時啟用備用服務器以保障正常運轉。
機房應急預案2
為了應對各種突發和緊急事件,特制訂以下方案。
一、突發和緊急事件指自然因素或其它原因引起(或可能引起)基站財產安全或較多基站中斷的所有事件。
二、啟動基站維護(緊急)組織實施方案的范圍:梅雨季節地勢低洼基站的防汛;雷電高峰期基站的動力搶修或搶險;大雪(暴雪)基站房屋及鐵塔的維護及應急搶修工作;臺風、地震前中后基站及鐵塔的維護;傳輸或MSC(BSC)故障造成基站大面積故障,故障恢復后基站網絡的測試。
三、啟動基站維護(緊急)組織實施方案的條件:天氣和各種地質災害預報或由此可造成(或正在造成)基站的財產安全和網絡穩定運行,網管統計發現大面積網絡故障時必須立即啟動基站維護(緊急)組織實施方案。
四、對于由自然因素可能引起的基站及分布系統站點的財產安全和網絡穩定運行,得知地質或天氣預報后,立即組織各代維項目部區和相關工程施工單位對所在地的站點進行預防性巡檢,對于各種隱患要求各項目部現場及時上報給我公司災害預防和處理應急領導小組和各地移動公司應急領導小組。
五、我公司應急領導小組成員和各代維項目部所有維護人員在重大災害預防和搶險過程中的的'移動電話必須24小時開機,必須無條件服從公司應急領導小組和代維項目經理統一安排,若某項目出現人員不足的情況下,公司臨時從總部或異地抽調人員和車輛參加搶險;凡當地移動公司所轄站點不是我公司維的護站點出現重大險情后,我公司抗災任務又不重時,各項目部要主動向移動請纓。
六、公司在每一次抗災救險活動結束后
公司應急領導小組應對本次活動的成功經驗和教訓進行總結,對表現優秀的團隊或個人進行表彰,表現較差的團隊或個人進行處罰
七、重大災害預防和搶險的人員組織機構:
領導小組由總經理,副總經理,各部門經理及地區經理組成,總經理為總指揮,各代維項目部也應成立相應成立相應的抗災救險領導小組。
八、抗災救險人員安排:
公司總部和各代維項目部應包括以下小組
1、通信保障組:在發生險情時提供移動通信應急保障,負責實施應急通信的詳細方案、應急中所需的備品、備件、測試儀表、工具、技術資料的保管及預防性維護保障工作。
2、物資調撥組:負責所有應急物資日常保管、定期檢查、更新以及應急時的調撥和運送。
3、搶險救災組:負責應急時的搶修和救災方案的實施
九、值班制度
1、各代維項目部在啟動抗災救險預案后應實行24小時值班制度,設立固定值班地點和24小時值班熱線。
2、全體應急人員保持24小時開機。
3、在接到上級關于進入應急狀態的通知后,即由領導小組成員組成指揮中心。
十、體保障措施細則:
1、根據每年的雨情在進入梅雨季節后將基站及分布系統代維的工作重點轉為重點機房、基站等重點防汛場所的巡視,故障處理。在遇到突發或緊急時間期間,加強對重點基站、低洼基站及傳輸機房的巡視,確保環境監控系統工作正常。重點基站及傳輸機房一周一次,低洼基站二周一次。臺風期間每天對拉線塔進行巡檢,并填寫基站巡檢表。
2、重點保障地點預置好防汛搶險物資。并給各維護小組配備部分隨車搶險物資。如編織袋、鐵鍬、雨衣、雨靴、防火泥、防火包、手電等。對抽水泵,移動油機進行保養,確保其工作正常。對應急燈、應急手機定期充電。
3、出現連續暴雨或臺風情況時,維護人員每天對重點站點及所有拉線塔進行巡視,填寫基站巡檢表。發現緊急情況立即通知我公司地區經理和移動代維管理人員,由代維管理人員上報移動部門領導,并趕赴現場確認,視情況確定是否安排專人(人員由綜合部安排)進行24小時值守。
4、網管值班人員對環境監控設備出現的告警密切觀察并記錄,若確有異常情況發生,立即通知我代維人員趕赴現場檢查。并追蹤代維人員的處理情況和反饋結果,若發現代維人員未及時處理,我網管值班人員應立即向我公司和移動公司匯報。
5、進入汛期后由各項目部負責每天了解所在區域的水位情況,并通知網管值班人員,由網管值班人員通知我代維人員及移動代維管理人員,根據水位情況合理調度巡視隊伍與車輛。
6、收到臺風警報后,各項部項目經理立即組織代維人員對全區拉線塔進行巡檢,發現異常發現緊急情況立即通知移動代維管理人員和我公司應急領導小組,視情況確定應急措施。
7、收到大雪或暴雪預報,組織維護人員對所轄基站中拉線塔基站、彩鋼瓦基站進行重點巡檢,當得到網管或其他人員通知所轄基站中有拉線塔基站、彩鋼瓦基站出現故障或非正常情況,立即派搶修人員奔赴現場,并逐級上報。
機房應急預案3
第一條:機房意外停電后,首先確定停電的范圍以及受影響的設備范圍。
第二條:確認停電的范圍為本公司或本機房,應立即聯系工機科電話匯報。估算電力可能恢復的時間,并通知直接上級。
第三條:如果確認停電的時間在1個小時內,可以在UPS正常供電的時間內,等到電力恢復。如果不能確認在2個小時內恢復供電,需及時到達現場。做好各設備的電源停電準備。在UPS供電達1.5個小時后,嚴格按操作手冊停掉存儲和各應用服務器的電源,最后停核心交換機和路由期。等待電力恢復,電力恢復供電后轉第七條執行。如果確認停電的范圍僅在于本機房電源故障,立即匯報給機房電源維護負責人。
第四條:機房維護負責人將掉電的電源柜總空開和分空開的狀態處于下電狀態。并向直接領導匯報,馬上聯系相關廠家,如有可能請廠家立即到現場支持。第五條:將掉電的所有的`設備電源狀態處于下電狀態,以防止電源柜加電對設備的沖擊。
第六條:等各廠家和相關的人員到齊后,商議設備恢復時因注意的事項,并形成相關文檔。
第七條:電力室恢復供電后,先不要急于給電源柜加電,等待10—20分鐘后,再開始給電源柜加電,以防止供電不穩或再次掉電。
第八條:供電正常后,確定設備處于下電狀態后,打開電力柜的總控開。第九條:根據設備加電順序,啟動分項空開。第十條:設備加電順序,網絡交換類設備正常后再給磁盤陣列柜加電,存儲狀態檢查正常后,啟動主機(以上各設備務必按操作手冊的啟動順序上電)。第十一條:設備啟動正常后,開始啟動數據庫。第十二條:數據庫啟動正常后,開始啟動中間件服務器。第十三條:中間件服務器正常后,啟動應用程序。
第十四條:機房設備進行全面點檢,確認所有設備運行和服務正常。
機房應急預案4
沙溝中學實施營養午餐突發斷水斷電等意外事故處理應急預案水、電是實施營養午餐改善計劃學校食堂正常供餐必備的最基本的條件,是食品安全工作的重要組成部分,也是保障師生正常生活的重要基礎。斷水斷電等意外事故在學校時有發生,為進一步加強學校食堂水、電等設施的管理,保障學校斷水斷電等意外事故發生時能正常為學生提供圖紙等的營養午餐,維護學校正常的教育教學秩序,特制定本預案
一、組織機構
(一)成立學校突發斷水斷電等意外事故應急成立領導小組。
組長:王鵬程
副組長:馬紅治
馬志銳
組員:馬強
呂宗仁
王繼祖
陸巖
馬萬喜
各班主任
指揮部的工作職責是:
(1)啟動學校斷水斷電等意外事故處理應急預案。
(2)領導、組織、協調事故應急處理工作。
(3)負責事故處理事項的決策。
(4)負責上報與事故相關的重要信息。
(5)審批學校應急處理工作報告。
二、常規管理
(一)、學校組織相關人員定期和吧不定期深入學校對學校可能斷水斷電等意外事件的隱患,即使做查漏補缺,做到早發現、早報告、早治理,不能因為人為因素斷水斷電而停止正常營養午餐。
(二)、學校要與當地政府、水保站、農電站等相關部門保持聯系,協調學校的用水和用電工作。
(三)、用水緊張或缺水學校,要想辦法做好學校用水的儲蓄工作,并邀請相關部門對學校用水質量檢測,確保水質量好,無安全隱患。
(四)、做好學校食堂用電設施的改造工程,指定專人經常對學校食堂用電設施進行檢修,維護。
(五)、對卻因客觀原因二造成的`斷水斷電等意外事故時應立即啟動該預案。
三、建立報告機制
1、對學校發生臨時斷水斷電等意外事故是學校不能對學生實施午餐時,學校從業人員向管理人員報告,管理人員向校長報告,校長協調有關人員檢查檢修,對于用電設施必須有專業人員進行檢修,確保短時間內供水供電。
2、對學校發生長時斷水斷電等意外事故時,學校從業人員向管理人員報告,有管理人員檢查檢修,同時上報縣意外事故應急處理協調領導小組。
四、事件處理
1、各級領導小組負責人接到報告后,及時組織相關人員趕赴學校開展事故處理工作
2、學校應及時對學生做好解釋說明工作,同時采取科學合理的辦法通過各種途徑解決學生營養午餐
3、學校迅速與家長取得聯系,通過告示等形式給家長做好解釋工作,去的家長的諒解,保證廣大師生及家長在事故發生和過程中的知情權,嚴防事態擴大給學校教育工作造成不良影響。
4、協調各方面力量做好學校穩定工作,保障學校正常的教育教學秩序
5、學校要及早購置手搖鼓風機等應急設備,在學校斷電時能立即啟用。
6、主動和有關部門聯系,及時購買等價等值、衛生、營養、可口的熟食品,如牛奶、面包等,及時為學生供應午餐。
7、斷水斷電事故處理結束,要認真總結分析事故發生原因,提出改進意見,完成處置總結報告,報送縣營養辦。
五、責任追究
對斷水斷電突發公共事件的應急處置工作中實行領導責任制和責任追究。對有突出表現的個人予以鼓勵和表彰;對負有直接責任個人依據有關法規和規定給予行政處分;;對處理不當,貽誤時機,造成惡劣影響的直接責任人,要嚴肅追究責任。
六、本預案由學校突發斷水斷電等意外事故一見處理工作領導小組負責解釋。
機房應急預案5
機房消防應急預案
為使信息機房發生火災事故時,當班人員能鎮靜有序地處置事件,特制訂本預案,請各成員認真學習,熟悉應急處置程序,提高全員的應急能力,一旦發生突發事件,盡最大努力保證員工人身安全和減少損失。
起火原因一般有明火管理不慎;電氣設備管理、使用不當;縱火等原因。
預案一:當聞到燒焦氣味時
當班人員發現信息機房內有冒煙現象或聞到燒焦氣味時,可能是某處陰燃處于起火階段或電源超負荷發熱引起,容易引發火災,當班人員要立即查明原因和地點,針對不同情況,采取迅速將火源撲滅或關閉電源總開關、隔離火源附近易燃物、關閉窗等措施,消除起火隱患,防止引了火災。事后立即向安保部門報告,并做好現場保護工作和防止起火點復燃,不得隨意離開現場和將事故隱瞞不報。預案二:當班時發現起火或冒出濃煙
由于起火源隱蔽或其他突發原因未能及時發現和消除起火隱患,釀成明火和冒出濃煙,燃燒面積不大,就是火災的初起階段,當班人員發現起火或冒出濃煙時,切忌驚惶失措,要沉著、果斷,會同其他當班人員分工協作,迅速查明原因組織撲救,當火執已無法控制時處置辦法:
一是指定專人立即拔打“119”火警電話報警和向上級保衛部門報告,并向本部門和周圍的人及群眾喊叫報警;二是組織本單位、部門在場的人員有序地投入撲救工作,充分利用消防栓、滅火器、水桶等器材滅火,不能消極等待消防隊到來,而錯過滅火良機,力求將火撲滅或控制火勢蔓延,不能只顧個人安危而逃離火場
三是大聲呼喊請求鄰近單位及群眾的支援。
四是在組織滅火同時,要立即組織人員疏散和轉移物品中,特別昌易燃、易爆物品和易受到火舌威脅的'現金、重要憑證要及時轉移到安全地點,并派人員守護,確保安全。
五是滅火后要注意保護現場,維護好秩序,以利于消防部門調查分析火災原因。注意事項:
報警人員報警時要向消防部門講清楚起火地點、單位、起火的種類和火勢大小,報警后即到街道或十字路口迎接、引導消防車輛的到來;撲救人員在消防人員到來后,要立即向消防指揮人員講清火場內存放有何種物資和貴重物品,火場內是否有爆炸、劇毒物品,并協助消防部門維護好現場秩序。自行撲救火災時要留心觀察火勢和環境,防止被火圍困、煙氣中毒、墜物砸傷等,在確保自身安全的情況下撲救火災。
機房應急預案6
一、為認真貫徹落實《國務院關于特大安全事故行政責任追究的規定》,積極提高我公司重點要害部位特大安全事故應急處理能力,努力減少各類特大安全事故所造成的損失,消除火災事故的隱患,保障公司財產和員工的生命安全,特制定本預案。
二、本預案針對我公司通信機房的火災而制定。
移動通信機房滅火流程如下:
(一)值班人員發現機房火情(包括監控中心人員)要立即到現場查看。
(二)如果是個別電路盤著火,應拔出著火的電路盤,用1211或二氧化碳滅火器將火撲滅。
(三)某機柜幾塊電路盤及電纜著火,應立即拔出著火的電路盤,用1211或二氧化碳滅火器噴射滅火劑將火撲滅。
(四)如果機房的機架機柜著火,值班人員無力自滅自救時,監控中心應切斷機架機柜電源或樓層電源,關閉空調,嚴禁開窗,及時向公司安全生產管理領導小組報告。
(五)公司安全生產管理領導小組指揮機關義務消防隊隊員進行滅火,組織值班人員立即撤離現場,封閉門窗,按下區域自動滅火按鈕滅火,同時撥打119報警,大聲呼救,報告公司主管領導或安保值班室,監控室廣播火警。
(六)在消防隊到達后,應積極配合,簡明扼要說明著
火位置,火勢情況和已采取的補救措施。
(七)用1211或二氧化碳滅火器噴射滅火劑能把火撲滅的,應配合消防隊保護現場和消除隱患,防止再次著火。
(八)用1211或二氧化碳滅火器不能把火撲滅時,為防止煙熏引起人員中毒,應組織人員有序疏散,使用相應的滅火器材滅火,盡快將火撲滅。
(九)應保護好現場,按照事故調查處理辦法執行。
(十)火災報警電話: 119
三、本預案應注意的特別事項
1、當發生火災情況,進行處理并保證人身安全的同時, 根據設備的重要性進行相應的搶救措施,保證重要設備,特別是直通電話,以及與冀北、華北相應數據的'上傳,保證通道暢通。
2、搶救完主要設備,在進行次要的設備搶修,待事故處理完畢后,進行相應的實驗,保證設備的運行性,并進行設備的可行性分析。
機房應急預案7
高性能計算技術及應用水平已成為顯示綜合國力的一種標志。高性能計算機持續不間斷地為用戶提供高性能計算服務,而運維應急預案是主機運行中處理突發事件的依據和方法,是主機系統穩定運行的保障。本文簡要介紹上海超級計算中心主機運維應急預案,供同行參考。
1.主機和運維管理制度簡介
超級計算機是功能最強、運算速度最快、存儲容量最大的一類計算機。目前只有少數國家掌握研發技術,系統造價非常昂貴,多用于國家高科技領域和尖端技術研究,是國家科技發展水平和綜合國力的重要標志。上海超級計算中心作為上海信息港主體工程之一,國家和上海市政府投資先后引進神威-I超級計算機、神威-64P集群計算機、曙光4000A超級計算機系統并投入商業化運行。
上海超級計算中心自20xx年正式開通至今,這些高性能計算機系統已安全、穩定運行七年多時間,上機用戶取得了豐碩的科研成果和社會效益。在這七年中,為保障這些高性能計算機系統安全、穩定、不間斷地運行,技術支持部在中心引進第一臺高性能計算機--神威-I超級計算機系統的同時,建立了機房應急預案、運行記錄、設備運行參數等基礎運維制度,在二期引進曙光4000A超級計算機系統過程中,不斷完善原有運維制度,并針對該主機系統特點編寫了大量操作方法和應急預案。
中心自20xx年獲得ISO27001(BS7799)信息安全認證以來,技術支持部根據其要求規范了文檔體系建設,形成了機房管理制度、應急預案、操作方法、運行情況記錄的四大類運維文檔。
正是這些運維管理制度的不斷完善和有效執行,才確保了資產價值高、服務對象廣、社會影響大的中心主機系統安全、穩定運行,保障重點項目、用戶服務的連續性。
2.應急預案重要性
上海超級計算中心機房運維管理文檔劃分為機房管理制度、應急預案、操作方法、運行記錄共四大類(如圖1所示)。
圖1應急預案分類
應急預案在應急系統中起著關鍵作用,它明確了在突發緊急情況發生之前、發生過程中以及剛剛結束之后,誰負責做什么、何時做,以及相應的策略和資源準備等。它是針對可能發生的重大事故,按照其影響和后果嚴重程度,在應急準備、響應、操作各個方面預先做出的詳細安排,是開展及時、有序和有效事故應急工作的行動指南。因此,應急預案在這四類運維管理文檔中處于最為重要的地位。
3.應急預案分類
應急預案按重要性和事件種類,可以劃分為消防預案、斷電預案、空調預案、其他預案共4種,預案各文檔之間彼此獨立又互為關聯,具有非常強的可操作性。制定預案的指導原則是盡一切可能,最大限度地確保向用戶提供的服務不中斷。在緊急事件發生的情況下,保證核心設備連續運行,避免存儲數據丟失。在事件處置完成后,能快速恢復高性能計算服務。
3.1消防預案
消防預案是主機房最重要的應急預案。該類預案根據《上海超級計算中心滅火和應急疏散預案》的原則并結合主機房主機設備和消防設備的運行特性而制定。主要由《主機房消防應急預案》和《主機房氣體噴淋消防系統啟動撤離及處置應急預案》2個文檔組成。
消防應急預案:該預案著重規范了火警事件發生后,所有主機維護人員如何根據所屬區域和現場情況,判斷和選擇正確的處理方法,同時配合中心物業人員處置,降低事件帶來的影響。
對于設備發生煙霧,主機維護人員協同物業人員尋找煙霧點予以切斷相關區域電源;當設備發生可以控制火情,協同物業人員滅火;當主機房發生火災而無法控制,應采取施救方法等措施。
氣體噴淋預案:該預案描述主機房氣體噴淋系統啟動的響應和確認并具體規定了撤離機房路線、善后處置。
這兩個預案中,消防應急預案作為消防預案的主體,涉及到如何處理與消防有關情況的各個方面。氣體噴淋預案是主機房發生重大火災時應對的最終滅火手段和人員撤離引導方法。
3.2斷電預案
斷電預案的重要性僅次于消防預案。該類預案根據中心供配電系統實際情況和各種斷電影響范圍下對主機運行的.最小保障要求而制定的。主要由《主機房斷電應急預案》、《曙光4000A超級計算機系統緊急關機操作方法》、《曙光4000A超級計算機系統雙路斷電關機操作方法》等多個文檔組成主機房斷電應急預案:該預案用于斷電情況下,主機維護人員如何與中心物業部門聯系控制主機房供電情況,并且負責對主機系統運行受斷電影響程度做出正確判斷。指導維護人員按影響程度,分別選用預案中對應的操作方法。本預案在所有斷電預案中起指導思想作用。緊急關機操作方法:該預案制定了主機系統在緊急情況下,最快速度關機的操作步驟。主要用于發生煙霧、明火或消防、斷電預案需在數分鐘內關機斷電的事件。
雙路斷電關機操作方法:該緊急操作預案主要用于在外界雙路供電全部中斷情況下的操作。
該預案的關機原則是:根據實際電力供應考慮操作步驟,寧慢勿快,在時間允許的情況下,最大程度保證存儲節點、SAN和SCSI存儲設備、工程用戶的計算節點的運行,盡可能減少關閉范圍,以確保能在恢復供電的情況下,主機盡快恢復正常運行狀態,減少影響范圍。
3.3空調預案
超級計算機系統在運行中消耗大量電能,在
提供高性能的計算能力同時產生大量的熱量,必須采用專用空調系統,以保持主機系統適當的溫、濕度、空氣潔凈度等運行環境需求。因此,專用空調系統與主機系統密切相關,空調預案是主機房必備的應急預案。
制定該預案的原因在于,斷電情況下,空調與主機系統存在互相牽制的現狀。主機和空調系統均為外界雙路供電,主機系統配有UPS不間斷電源系統,而空調系統無UPS支持。在雙路停電情況下,主機系統可獲得UPS電池組支持運行若干分鐘,空調系統無UPS支持只能停機。由于在無空調冷卻情況下,主機系統會在短時間內積聚大量熱量導致超過運行警戒溫度,主機系統在有可供電余量的情況下,仍將被迫關機。因此,確保空調中斷情況下的主機運行環境是該預案的制定原則。
預案根據各臺主機配備的空調系統特點制定,由《曙光機房空調系統故障應急預案》和《神威機房空調系統應急預案》2個文檔組成,這里僅介紹曙光機房空調系統應急預案。
該預案的第一步:考慮增強主機系統散熱效果,采用打開主機機柜前后門,和機房周邊木門,在通風道上布置有UPS支持的應急風扇,形成空氣對流,帶走熱空氣,從而增強主機系統散熱效果,降低升溫速度。
該預案的第二步:在采取上述措施并持續升溫到一定溫度之上的情況下,考慮緊急關閉部分或全部計算節點,減少熱量生成,確保主機系統的核心存儲和網絡系統不受影響,確保空調系統修復后,主機系統能快速恢復運行。
3.4其他預案
除了固定的三類預案之外,技術支持部還根據主機系統實際運行中出現的各種意外情況,隨時制定具有針對性的預案。
如《大樓頂棚坍塌應急操作方法》的制定,就
是由于20xx年1月連續發生雨雪等災害性天氣,中心大樓頂棚大量積雪且難融化,物業預計存在情況繼續惡化,有發生頂棚坍塌事故的可能,一旦發生將影響一樓主機運行。
針對該突發的隱患,中心技術支持部制定應急操作方法,對維護巡查頻度范圍、漏水可能發生位置、如何處理受漏水影響的主機設備等操作步驟進行嚴格界定。即使在最后,中心大樓頂棚經受住災害性天氣的考驗,該預案并未發揮作用,這正體現了應急預案的備而不用的特點。而且通過各種意外
情況的迅速分析、應對和實踐操練,不斷鍛煉主機維護隊伍,使之走向成熟。
4.在實際案例中,應急預案的作用
在主機系統年復一年的運行中,我們希望這些設備正常穩定運行,應急預案永遠不會被使用,然而在實際運行中,總免不了因突發事件執行應急預案。
而每次突發事件是檢驗應急預案制定是否科學、有效的最好證明。
4.1雙路斷電,UPS正常運行案例
20xx年8月某天,因打雷導致供電一路跳閘自動換至另一路供電,曙光機房2臺空調掉電。
主機維護人員立即按應急預案操作,電話通知物業人員恢復空調運行,恢復過程中所有空調相繼出現高溫報警,機柜液晶屏平均溫度35度,開啟全部曙光機柜前后門,打開神威-曙光玻璃門并調集應急電扇,于12:45恢復正常。
12:50再次出現雙路供電中斷,曙光空調因無
UPS支撐全部斷電,啟動斷電應急預案,開啟
5、6號木門,開啟神威機房全部空調,布置電扇,將冷氣導入曙光機房,熱量從6號木門的外部通道排出,選擇性殺除部分作業,至13:05供電恢復,曙光空調開始工作,13:20環境恢復正常。全機在此過程中,正常運行未停機,只損失了部分不重要的作業。
4.2單路斷電,UPS失效案例
20xx年8月某天,因低壓配電柜開關至UPS房間X-JM柜電纜發生相對地短路,造成UPS機組逆變器自身保護動作,關閉UPS機組,導致曙光主機系統失電。
全機掉電后,主機維護人員迅速按應急預案
手工關閉所有電源開關。10:30恢復供電,溫濕度恢復正常后,全機加電,恢復過程中修復
storage00
1、00
5、010三個盤陣的9個用戶文件系統,修復15個節點加電故障,除cnode00
9、anode029電源
環境模塊故障,于當日15:10全機系統恢復正常。
由于處置及時,主機受影響范圍很小,在恢復供電后數小時即成功開啟全系統。
5.隨時保持應急預案的適用性
主機長年累月的運行,故障和問題的發生,往往是必然的,也是客觀、無法回避的。因此,要求在維護工作中,預先考慮到可能的問題和故障,制定完善的應急預案。應急預案不可能包含所有的故障和問題,但應根據維護經驗,盡可能地設想各種危機情況下的處置措施。做到預想到各種可能的問題。
而在形成應急預案后,更重要的是持續地在
運行中加以完善、測試和演練,盡可能模擬實際情況,做到即使只有1名維護人員在場,也能在真正發生危機時,以最短時間獨立處置故障。
以目前中心的主機運維工作為例,三年內,僅斷電預案就已根據實際運行情況的變化,制定并更新了5~6個版本,針對夏季突發斷電也有專用預案。這樣的措施,直接保障了20xx年8月突發斷電事件中的主機連續運行。而20xx年8月的突發斷電事件中,由于預案在之前剛根據實際情況進行過演練和修改,主機維護人員僅用半小時就完成所有應急操作動作,整機僅有個別設備故障,確保了主機設備未因突發斷電而發生大范圍損壞現象,恢復供電后直接完成開機。
實踐證明,完善而適用的應急預案能保障向用戶提供穩定的高性能計算服務。
6.結束語
完備而適用的應急預案能有效降低主機系統因意外事件發生帶來的運行風險,對可能發生的意外來說,是一種事前防范措施。但對整個主機系統產品而言,是一種事后防范措施。如果主機系統生產廠商能把這些防范措施納入整個系統設計過程中,使操作方法更加簡便、更趨于人性化,這將幫助主機維護人員更為妥善處理意外事件,用戶得到更為穩定的高性能計算服務。我們相信未來國產的高性能計算機能做到這一點,期待著這一天早日到來。
(為幫助了解,特在附錄中節選部分雙路斷電關機預案內容)
附錄:《曙光4000A超級計算機系統雙路斷電關機操作方法》(省略具體操作步驟)
曙光4000A超級計算機系統雙路斷電關機操作方法
注意:
1、本方法專用于主機房發生雙路同時斷電緊急操作使用。(包括單線斷電切換失敗)。
2、本方法作為《曙光-4000A超級計算機系統緊急關機操作方法》(SSCS(TS)-XXXX-XXXX-XXXX)的附件。
1.斷電確認及操作:
主機房內一旦發現斷電,并接物業明確通知為雙路斷電,首先執行如下操作(即確保節點溫度):
1.1打開機房門便于散熱,..
1.2機房通道上布置應急風扇加強冷熱空氣對流,夏季:應急風扇布置..;冬季:應急風扇布置..,使曙光
機房的溫度盡量降低。
1.3打開所有機柜前、后門。
1.4密切注意機房節點平均溫度(專指各機柜液晶面板所示之環境溫度值)。
2.緊急關機條件確認:
在完成上述操作后,密切觀察主機房環境。一旦有如下任何一個條件滿足:
2.1自斷電發生起,已達到XX分鐘仍未恢復供電;
2.2采取上述緊急通風措施,節點溫度持續上升,超過XX℃;
可認定為緊急斷電事件,即刻按下列緊急關機操作方法進行操作。
3.緊急關機操作步驟:
注意事項:
3.1..
3.2關機操作的全過程中,注意隨時保持和物業的通訊聯系。除根據情況隨時聯絡外,應嚴格保證每XX分鐘與物
業聯系一次,詢問UPS可支撐時間及恢復供電可能。(分機、手機、對講機等)
3.3應理解關機原則為:根據實際電力供應考慮操作步驟,寧慢勿快,在時間允許的情況下,最大程度保證X排節
點、存儲節點、SAN和SCSI存儲設備的運行,盡可能減少關閉范圍,以確保恢復。
第一級操作:(首先執行)關閉主機系統外圍設備..
第二級操作:(完成上述操作后,當再次發現UPS電池低于XX分鐘或節點平均溫度超過XX℃,任一條件滿足,執行如下操作)
關閉非重要用戶計算節點(ABC組)..
第三級操作:(完成上述操作后,當再次發現UPS電池低于XX分鐘或節點平均溫度超過XX℃,任一條件滿足,執行如下操作)
關閉所有用戶計算節點(D組)..
第四級操作:(完成上述操作后,當再次發現UPS電池低于XX分鐘或節點平均溫度超過XX℃,任一條件滿足,執行如下操作)
關閉SAN存儲設備和LSF數據庫服務器..
第五級操作:(完成上述操作后,當再次發現UPS電池低于XX分鐘或節點平均溫度超過XX℃,任一條件滿足,完成關機操作)
關閉SCSI磁盤陣列和所有存儲節點..
特別關注:
1.如時間非常緊急,UPS電池低于XX分鐘:
直接執行關機腳本:..
此腳本可分別將計算節點、接入節點、存儲節點進行關閉。
2.如時間極其緊急,UPS電池低于XX分鐘,可按《曙光-4000A超級計算機系統緊急關機操作方法》(SSCS(TS)-XXXX-XXXX-XXXX),直接拉閘操作。
(上述二個方法僅用于突發情況,非極其必要情況下嚴禁使用,應使用前列方法操作)
3.如遇主機失電(如關機操作不及已掉電或突發自動掉電)應關閉所涉范圍所有設備電閘開關。..
機房應急預案8
由于機房內部用電設備多,供電線路復雜,電器設備連續運轉,導致線路設備發熱量大,甚至出現線路設備提前老化,極易發生供電線路和電氣設備起火現象,任何人員一旦發現火情,要沉著冷靜視火情情況進行操作:
1:“先斷電,后滅火”是撲滅電氣火災的基本原則,在切斷電源時要根據現場火勢、著火設備進行判斷,考慮重要負荷、消防電源的影響以及配電系統回路的分布,防止火災未救,人員先被電擊或灼傷。如果發現機柜內設備出現內部打火、冒煙但沒有明火出現時,要立即拔掉該設備的電源插頭,并把該設備拿離機柜,防止危害其他設備;發現局部輕微著火不危機其他設備的情況下,要立即斷開該設備電源,并組織人員利用就近消防器材進行滅火,防止火勢蔓延擴大,并向領導報告;發現設備火勢大危機整個機柜但不危機人員生命還能控制時,立即對應機柜編號,斷開整個機柜電源,并組織人員使用氣體滅火器進行撲火,發現UPS電池組著火時先斷開電池組箱體上的控制開關,必要時再斷開電源室控制UPS的總斷路器,用氣體滅火器滅火,如果火勢大不能控制應立即向負責人匯報、撥打119報警,根據情況切斷機房總電源再進行組織滅火。
2:組織實施:在消防車來之前,先盡力使用現有消防設備將火勢控制在最小范圍。 消防車來之后,值班人員配合消防專業人員撲救或作好輔助工作。 迅速組織人員逃生,原則是“先救人,后救物”, 及時安全地疏散人員和財產轉移。火勢大時可用滅火器邊噴邊撤退,確保人員安全。
3:注意事項:發現火災撥打火警電話119報警時要講清詳細地址、起火部位、著火物質、火勢大小、報警人姓名電話、并派人到路口迎候消防車。火災事故首要的一條是保護人員安全,撲救要在確保人員不受傷害的'前提下進行。 發現火災時應掌握的原則是邊救火,邊報警。人員在逃生時應掌握正確的逃離方法。救火時不要冒然開窗,以免空氣對流,加速火勢蔓延。
4:滅火器材:電氣火災隱患存在具有一定的隱蔽性,它的發生來得快具有突發性,促成火災發生的原因受多因素影響而且各因素之間具有關聯性,火災形成后的分解物中有毒氣,容易蔓延,即使斷電也可能有殘留電壓存在,所以撲滅電氣火災應用氣體滅火器,“二氧化碳”滅火器主要適用于撲滅貴重設備、檔案資料、電氣設備和其他一般物質的初期火災。不導電,電壓超過600v時,應切斷電源;“1211”滅火器是一種具有高效、低毒、腐蝕性小、滅火后不留痕跡、不導電、使用安全、儲存期長的新型優良滅火劑,特別適用于撲滅油類、電氣設備、精密儀器及一般有機溶劑的火災;
值班人員應經常開展事故預想、安全活動討論、學習消防知識、模擬消防演練等多種形式的活動,增強對火災事故處理方法的認識,在火災事故發生時能做到頭腦清晰、有條不紊,提高火災事故處理的效率。同時還要對已發生的火災事故的原因進行認真分析,調查處理,做到四不放過:
(1)事故原因不查清不放過;
(2)事故責任者得不到處理不放過;
(3)整改措施不落實不放過;
(4)教訓不吸取不放過,預防火災事故再次發生。
機房應急預案9
第一條 機房突發事件包括網絡設備或服務器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。 針對突發事件的預防措施如下: 建立安全、可靠、穩定運行的機房環境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統;加強防火、防盜意識。
第二條 機房漏水應急預案如下:
1、發生機房漏水時,第一目擊者應立即通知機房管理人員。
2、若空調系統出現滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時聯系設備供應方處理,必要情況下可臨時用電扇對服務器進行降溫。
3、若為墻體或窗戶滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時安排通知工程人員及時清除積水,維修墻體或窗戶,消除滲漏水隱患。
第三條 機房火災應急預案如下:
1、完善機房環境,確保機房放置滅火器;禁止攜帶易燃易爆物品進入機房。
2、機房管理人員應熟悉機房內部消防安全操作和規則,了解消防設備操作原理,掌握消防應急處理步驟、措施和要領,懂得滅火的方法,會撲救初起火源。
3、一旦發生火災,迅速切斷機房電源,避免災情的擴散,并迅速和保安部聯系必要時立即報火警。
第四條 機房停電應急預案如下:
1、接到停電通知后,應及時通過辦公系統、電話等發布相關信息,部署應對具體措施,要求在停電前停止業務、保存數據。
2、機房管理人員每日檢查UPS電源的狀態,確保在突發停電時,UPS電源能自動供應服務器正常工作15分鐘以上,保證員工工作的.數據及時保存。
第五條 通信網絡故障應急預案如下:
1、發生通信線路中斷、流量異常等故障后,發現狀況的員工或部門領導應及時通知網絡管理員。 2、網絡管理員了解情況后,迅速組織檢測故障區域,并作相關故障處理,逐步恢復故障區與服務器的網絡聯接,恢復通信網絡,保證正常運轉。
第六條 服務器故障應急預案如下:
1、機房管理人員每日檢查機房內各服務器狀態。
2、定期備份數據服務器數據。并將備份資料拷貝到移動設備。服務器出現嚴重硬件故障時啟用備用服務器以保障正常運轉。
機房應急預案10
信息中心機房是就業中心開展各項工作的重要保障,也是重點消防部位。為了應對消防事故的發生,特制定以下應急預案:
一、機房消防安全堅持“標本兼治、綜合治理,防消結合、預防為主”的`基本原則,堅持嚴防死守,確保萬無一失。
二、加強單位職工的安全教育,全面提高應對火災的能力和心理素質,把損失和危害減少到最低程度。
三、加強領導,健全機構,成立機房消防安全責任小組。 組 長:
副組長:
責任人:當班人員、信息中心工作人員
四、正確處置消防事件:
1、發現火情后,迅速切斷電源,利用就近滅火器滅火;如不能及時控制、撲滅火災,立即啟動應急預案,以最快的方式向上級報告,并視火情立即撥打119報警;
2、接到火警后,組長、副組長及工作人員應在最短時間內迅速趕赴現場進行撲救;
3、及時搶救重要設備,并引導人員疏散自救。
4、一旦有人受傷應及時實施搶救,并及時撥打120請求救護支援;協助醫護人員對受傷人員進行緊急救護等;
5、火警解除后,及時保護現場,看護設備,防止次生事故發生,并及時向上級匯報火情和損失,配合相關人員進行事故調查。
五、注意事項
1、避免人身傷害,撲救要在確保人員不受傷害的前提下進行。
2、火災第一發現人應查明原因,如是電源引起,應立即切斷電源。
3、逃生時應盡量采取保護措施,如用濕毛巾捂住口鼻,用濕衣服包裏身體。同時啟用消防應急通道,嚴禁擁擠、阻塞和跳樓、跳窗等事件發生。
4、堅持預防為主,堅持安全值班巡查制度,嚴守機房消防安全管理制度,保持通信工具暢通,發現隱患及時上報處理。
6、認真分析事故原因,總結經驗教訓,虛心接受有關部門的檢查、指導、批評和教育。
機房應急預案11
機房消防安全工作極為重要,一旦發生火災,將直接影響大廈內設備正常運行,并對人身安全和經濟財產造成巨大的損失。為防范消防安全事故發生,保證消防安全事故發生時能夠快速、高效、合理有序地處置,特制定本預案。
一、電氣火災的主要因素
1、電氣線路短路、過載、接地電阻過大等引發火災。
2、由于機房內設備長時間不間斷運行或設備故障引發火災。
3、靜電產生火災。
4、雷電等強電入侵引發火災。
二、處置程序
1、發現火情后,迅速切斷電源,利用就近滅火器進行滅火,并按照特級事故通報機制進行通報,向領導匯報火災具體情況。
2、迅速組織相關人員攜帶消防器具趕赴現場滅火,并聽從現場指揮人員指揮。
3、如火情較為嚴重,應立即與大廈消防中控取得聯系,并與之協商處理辦法措施,必要時需要專業消防滅火的,迅速請示領導撥打119。
三、注意事項
1、一旦機房發生火災,應遵循以下原則:首先保證人員安全;其次保證關鍵設備安全;再保證一般設備安全;救火過程中應邊救火,邊報警。
2、火災發生時,第一發現人查明起火原因,如因電源引起,應首先切斷電源。
四、預防措施
1、對機房內電氣設備定期檢查。發現存在問題的'設備及時維修,消除安全隱患。
2、每天定時對機房重要電氣設備和電子設備的溫度進行了監控,能夠及時地發現并消除隱患。
3、應組織相關人員進行消防安全教育,學習消防知識,學會正確使用各種滅火器,有計劃的進行相關的消防演習。
機房應急預案12
計算機機房作為所有業務、應用系統的核心,一旦計算機機房發生突發事件,將對單位的數據等造成嚴重損失。為此,特制訂機房突發事件應急預案。
一、機房突發事件定義
機房突發事件是指由特殊原因引發威脅機房安全并且不能通過日常維護手段解決的事件。比如,火災、漏電、斷電等非人為或者人為的事件,重大突發事件發生后,應立即組織現場救護或臨時處置,控制事態發展,最大限度地減少損失和影響。
二、機構和職責
機房突發事件應急小組單位領導:
機房突發事件應急小組部門領導:
機房突發事件應急小組成員:
各責任人職責:
應急小組單位領導:負責單位層面及范圍內的決策與領導。
應急小組部門領導:負責部門層面及范圍內的決策與領導并組織實施突發事件預案。
應急小組成員:按崗位職責分工,聽從指揮,服從安排全力以赴解決突發事件。
三、突發事件報警
應區分原因在第一時間報警。
自然災害(火災),撥打火警電話:119人為事件(非法盜取、攻擊等)撥打匪警電話:110人員傷亡,撥打急救電話:120其他時間(斷電等),撥打值班電話:
四、突發事件處理
突發事件發生后,應立即啟動應急預案。
1、失火、漏水:
視事件的緊急程度,應急小組成員要在領導的指揮下,有組織、有順序的備份數據、關閉服務器的電源;組織人力轉移設備。如果自動設備未能正常啟動,應在組長安排下首先切斷機房的水、電路,組織人力采用滅火器等滅火設備人工滅火,同時要在第一時間報警。
2、斷電:
在城電斷電的情況下,機房的備用電力將發揮作用,電力供應最長可持續4小時。由于機房空調沒有備用電力,如確認是供電局斷電,應立即聯系發電機發電;如果不是供電局斷電,而是由于辦公樓電力線路故障引起的斷電,應立即通知電工查找原因,盡快排出故障。如果無法盡快恢復供電,在電力延續期間,應盡快結束未執行完畢的任務,如無法完成需及時備份數據,同時應關閉所有非必須服務器,盡量不讓機房溫度過高,保證網絡設備的正常運行,以便保障集中在單位的.應用系統能正常使用。
五、恢復生產
突發事件結束后,有關人員應首先對現場進行清理,匯總損失情況并上報各級領導。緊急召開專項會議分析損失情況,制定數據恢復計劃。設備損失的要及時更換設備,保證恢復計劃的順利進行。
恢復生產后,系統管理員應對各系統進行自查,上報書面報告,并由部門領導匯總后上報單位領導。
機房管理員在恢復生產后要及時檢查各項維持系統,如UPS、滅火器、漏水、漏電探測器等是否正常運行,應及時更換受損的元器件,補充滅火器的填充物。
機房應急預案13
第一條 機房突發事件
包括網絡設備或服務器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。 針對突發事件的預防措施如下:
建立安全、可靠、穩定運行的.機房環境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統;加強防火、防盜意識。
第二條 機房漏水應急預案如下:
1、發生機房漏水時,第一目擊者應立即通知機房管理人員。
2、若空調系統出現滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時聯系設備供應方處理,必要情況下可臨時用電扇對服務器進行降溫。
3、若為墻體或窗戶滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時安排通知工程人員及時清除積水,維修墻體或窗戶,消除滲漏水隱患。
機房應急預案14
1.總則
1.1編制目的
為高效有序地做好機房火災事故的應急處置工作,避免或最大程度地減輕火災事故造成的損失,保障員工生命和企業財產安全,維護社會穩定。
1.2編制依據
《中華人民共和國安全生產法》《江蘇省消防條例》
1.3適用范圍
適用于機房火災事故的現場應急處置和應急救援工作。
2.事件特征
2.1事件類型及危險性分析
2.1.1電氣線路短路、過載、接觸電阻過大,靜電,雷擊等強電侵入,機房內電腦、空調等用電設備長時間通電過熱、設備故障等原因均可能引起計算機房的火災事故。
2.1.2機房火災事故會造成計算機設備損壞、系統故障網絡中斷或癱瘓,影響網絡的安全運行。
2.1.3火災產生的有毒煙霧污染機房的空氣,造成人員中毒、窒息等人身傷亡事故。
3.應急組織及職責
3.1火災應急指揮部
應急指揮部總指揮:
機房火災應急搶險指揮:
成員:
3.2指揮部人員的職責
3.2.1指揮的職責:全面指揮突發事件應急救援工作。
3.2.2高低壓專業職責:組織、協調本部門人員參加應急處置和救援工作,對發生險情機房切斷電源。
3.2.3智能化專業職責:監控相關區域事故情況。
3.2.4空調專業職責:發現異常情況,及時切斷空調、通風系統,做好運行方式的調整和故障設備的隔離。
4.應急處置
4.1現場應急處置程序
4.1.1最早發現火情者應立即向值班長和機房負責人匯報,機房負責人到現場指揮滅火,同時報告公司領導,啟動本預案。
4.1.2機房負責人根據事故狀態及危害程度做出相應的應急決定,指揮疏散現場無關人員,各應急救援隊立即開展救援。
4.1.3事故擴大時,撥打119報警電話請求市消防隊支援。報警內容:單位名稱、地址、著火物質、火勢大小、著火范圍。把自己的電話號碼和姓名告訴對方,以便聯系。同時還要注意聽清對方提出的問題,以便正確回答。打完電話后,要立即到交叉路口等候消防車的到來,以便引導消防車迅速趕到火災現場。4.2現場應急處置措施
4.2.1機房負責人組織人員迅速查明著火原因。4.2.2發生火災事故后,運行值班人員在人身安全不受危害的情況下要堅守本職崗位,確保設備運行。
4.2.3火災初起階段,值班人員要利用區域內常規滅火器(干粉或氣體滅火器)進行撲救。控制初起火災,防止火勢蔓延。根據火勢情況立即啟動氣體自動滅火裝置。
4.2.4被困火場逃生時,應用濕毛巾捂住口鼻,背向煙火方向迅速離開。逃生通道被切斷、短時間內無人救援時,應關緊迎火門窗,用濕毛巾、濕布堵塞門縫,用水淋透房門,防止煙火侵入。
4.2.5火災發生時要采取有效措施撲滅身上的火焰,使傷員迅速脫離開致傷現場。當衣服著火時,應采用各種方法盡快地滅火,如水浸、水淋、就地臥倒翻滾等,千萬不可直立奔跑或站立呼喊,以免助長燃燒,引起或加重呼吸道燒傷。滅火后傷員應立即將衣服脫去,如衣服和皮膚粘在一起,可在救護人員的幫助下把未粘的部分剪去,并對創面進行包扎。
4.2.6在火場,對于燒傷創面一般可不做特殊處理,盡量不要弄破水泡,不能涂龍膽紫一類有色的外用藥,以免影響燒傷面深度的判斷。為防止創面繼續污染,避免加重感染和加深創面,對創面應立即用三角巾、大紗布塊、清潔的衣眼和被單等,給予簡單而確實的包扎。手足被燒傷時,應將各個指、趾分開包扎,以防粘連。
4.2.7消防隊到達火場時,應立即與消防隊負責人取得聯系并交待失火設備現狀和運行設備狀況,然后協助消防隊滅火,并提供技術支援。
4.2.8復情況,事故應急處理全部結束,才能恢復生產秩序。
4.2.9火災事故報告流程
4.3.1出現火情后,值班人員除采取有效措施撲滅初期火情外應立即想機房負責人匯報;
4.3.2火勢無法控制時由機房負責人決定報火警請求轄區消防隊救援。并在在火災事故發生后1小時內向所云匯報突發事件信息。速報內容主要包括事故發生的時間、地點、人員傷亡、設備損壞情況、可能的引發因素和發展趨勢等。
4.3.3聯系方式
消防隊:119醫務急救:120
4.4注意事項
4.4.1應急處置時注意防止中毒、窒息、觸電、燙傷。
4.4.2危險區設好警戒線,并掛好標示牌。無操作權限的人員不得亂動現場設備。
4.4.3佩戴個人防護器具時注意檢查防護用品合格,且在有效檢驗期內;正確佩戴使用正壓式呼吸器、隔熱服、隔熱手套、絕緣靴等安全防護用具。
4.4.4現場自救和互救時不熟悉現場情況和滅火方法的人員不得盲目進入危險區域,救人前先確認自己的能力和現場情況是否能夠滿足對他人施救的`需要。
4.4.5應急救援結束后要全面檢查,確認現場無火災隱患和建筑物坍塌的隱患。
4.4.6加強自身防護,避免救火導致人身傷害。
4.5附則
4.5.1機房應急人員的聯系方式。
機房火災的應急預案2
第一條機房內禁止明火禁止吸煙,機房內的所有設備需要定期維護并做巡檢記錄、根據機房實際情況進行清掃工作。
第二條機房網絡設備維護由網絡管理員進行,如發現機器故障應及時排除故障,在遇到硬件三包范圍內的故障時,應及時聯系供應公司上門或將機器送供應公司維修;
第三條酒店員工必須嚴格遵守有關機房、設備及系統運行管理規定,不得在機房內從事與系統管理、運行維護、系統安裝和調試等無關的工作;
第四條做好防火、防雨、防濕、防盜工作,注意用電安全;機房內的環境要每周檢查溫度、濕度、電力系統、是否滿足機房相關的標準要求。
第五條機房內的交換機和服務器系酒店運營的關鍵設備,任何人不得自行配置或更改其系統參數。
第六條要做好機房的安全工作,對服務器的各種帳戶、密碼嚴格保密。
第七條應及時做好數據的備份工作,保證在系統發生故障時,數據能夠快速、安全的恢復。所有備份數據不得更改,并要求做到本地和異地分別備份保存。
第八條為了確保本酒店網絡正常運行,每日對機房內的設備進行巡視,主要著重于服務器及網絡設備運行正常與否。
1、對機房里的溫度進行調節,如室內溫度過高,調節空調對機房進行有效的通風。
2、查看交換機與防火墻及接入設備的工作狀態,如發生異常,對其進行及時有效的維護。
3、監測網絡運行狀況。
第九條除本酒店網絡管理員外,公司其他人員因工作需要進入機房的,需網絡管理員陪同下進入機房。
第十條嚴禁帶外單位人員或無關人員進入機房,確因工作需要,如:系統故障診斷和處理,設備維修維護、系統或設備安裝等進入機房,必須由網絡管理員陪同進入,配合項目的實施。
第十一條進入機房的設備應在進入機房前拆除外包裝,以保證機房環境的清潔和安
第十二條嚴禁攜帶易燃、易爆、易腐蝕等危險性物品進入機房。
第十三條機房內提供的UPS電源只允許為主機、服務器、網絡及存儲等核心設備供電,嚴禁安插其他設備,增加UPS電源供電負荷。
第十四條嚴禁擅自切斷供電系統,確因工作需要斷電時,首先應做好相應準備工作,經部門領導批準,然后給所有部門發放斷電或斷網通知,最后方可實施。
第十五條機房內安裝用電設備或有用電需求的項目時,必須經過專業人員或設備提供商的安裝工程師進行現場勘查,經確認在滿足或符合要求后工程才能實施。
(一)值班人員發現機房火情(包括監控中心人員)要立即到現場查看。
(二)如果是個別電路盤著火,應拔出著火的電路盤,用1211或二氧化碳滅火器將火撲滅。
(三)某機柜幾塊電路盤及電纜著火,應立即拔出著火的電路盤,用1211或二氧化碳滅火器噴射滅火劑將火撲滅。
(四)如果機房的機架機柜著火,值班人員無力自滅自救時,監控中心應切斷機架機柜電源或樓層電源,關閉空調,嚴禁開窗,及時向公司安全生產管理領導小組報告。
(五)公司安全生產管理領導小組指揮機關義務消防隊隊員進行滅火,組織值班人員立即撤離現場,封閉門窗,按下區域自動滅火按鈕滅火,同時撥打119報警,大聲呼救,報告公司主管領導或安保值班室,監控室廣播火警。
(六)在消防隊到達后,應積極配合,簡明扼要說明著火位置,火勢情況和已采取的補救措施。
(七)用1211或二氧化碳滅火器噴射滅火劑能把火撲滅的,應配合消防隊保護現場和消除隱患,防止再次著火。
(八)用1211或二氧化碳滅火器不能把火撲滅時,為防止煙熏引起人員中毒,應組織人員有序疏散,使用相應的滅火器材滅火,盡快將火撲滅。
(九)應保護好現場,按照事故調查處理辦法執行。
(十)火災報警電話:119
本預案應注意的特別事項:
1、當發生火災情況,進行處理并保證人身安全的同時,根據設備的重要性進行相應的搶救措施,保證重要設備,特別是直通電話,以及與冀北、華北相應數據的上傳,保證通道暢通。
2、搶救完主要設備,在進行次要的設備搶修,待事故處理完畢后,進行相應的實驗,保證設備的運行性,并進行設備的可行性分析。
機房應急預案15
第一章 總則
第一條 為規范我所網絡中心機房設備管理,提高處理機房突發事件的能力,形成科學、有效、反應迅速的應急工作機制,確保重要計算機信息系統的實體安全、運行安全和數據安全,最大限度地減少突發事件造成的危害,根據《中華人民共和國計算機信息系統安全保護條例》、《信息化建設員工遵循守則》及《企業信息安全管理制度》等相關管理規定等,制定《網絡中心機房應急預案及管理辦法》(以下簡稱管理辦法)。
第二條 本文件適用于有計劃性、有預防性地管理我所的網絡中心機房以及發生和可能發生的與機房有關的突發事件。
第三條 信管部負責編制、修訂網絡中心機房管理辦法及所轄范圍內突發機房事件應急預案。
周期性或即時性地向局域網用戶發布系統安全警示;對異常流量來源進行監控,并妥善處理各種異常情況。及時組織專業技術人員對所轄范圍內機房突發事件進行應急處置;負責調查和處理機房突發事件,及時上報并按照相關規定作好善后工作。
第二章 中心機房管理辦法
第四條 機房內的所有設備需要定期保養,應指定人員做維護、清潔工作,做到兩天一收拾,一周一打掃;嚴禁將各種食物、飲用品帶入機房,在機房內禁止吸煙。
第五條 計算機設備維修工作由專門人員進行,管理人員應把設備的檢修情況記錄在相應的設備卡上,以便統一歸檔管理。如發現機房設備故障應及時向上級領導報告,并負責計算機及外設的日常維護與排除故障,在遇到設備保修范圍內的故障時,應及時催促供應單位上門或將機器送修;
第六條 系統管理人員必須嚴格遵守有關機房、設備及系統運行管理規定,不得在機房內從事與系統管理、運行維護、系統安裝和調測等無關的工作;
第七條 如其他人員需使用機房內設備應向機房負責人提交申請,經主管人員審核簽字后,將書面申請提交信管部存檔后方可借用機房內的設備;
第八條 做好防火、防雨、防濕、防盜工作,注意用電安全;機房內的環境要每周檢查溫度、濕度、電力系統、是否滿足機房相關的標準要求;
第九條 系統管理人員應定時對機房供電系統及其他運行中的系統、設備進行巡視和檢查,建立檔案,做好系統日志。要對發生的故障以及排除故障情況做好詳細記錄;機房管理人員每日檢查UPS電源的狀態,確保在突發停電時,UPS電源能自動供應機房設備正常工作半個小時,保證機房設備的數據及時保存。
第十條 要統一管理機房內的設備,計算機及其相關設備的驅動程序、保修卡等隨機文件與資料要保存完整。要明確專人負責計算機文檔、信息化等資料的保管,要做到資料齊全,存放安全;
第十一條 機房內的交換機和服務器系辦公自動化的關鍵設備,任何人不得自行配置或更改系統參數;
第十二條 要做好機房的安全工作,對服務器的各種帳戶、密碼嚴格保密。對網絡運行理,設備維修維護、系統或設備安裝等進入機房,必須由機房管理人員陪同進入,做好登記,并配合項目的實施。
第十七條 進入機房的設備應在進入機房前拆除外包裝,以保證機房環境的清潔和安全。
第十八條 嚴禁攜帶易燃、易爆、易腐蝕等危險性物品進入機房。
第三章 機房用電管理規定
第十九條 機房內提供的UPS電源只允許為主機、服務器、網絡及存儲等核心設備供電,嚴禁安插其他設備,增加UPS電源供電負荷。
第二十條 嚴禁擅自切斷供電系統,確因工作需要斷電時,首先應做好相應準備工作,經部門領導批準,然后給所有部門發放斷電通知,最后方可實施。
第二十一條 機房內安裝用電設備或有用電需求的項目時,必須經過專業人員或設備提供商的安裝工程師進行現場勘查,經確認在滿足或符合要求后工程才能實施。
第四章 機房施工管理規定
第二十二條 任何進入機房的施工,施工單位必須指明施工管理人員。
第二十三條 施工人員進入機房,必須遵守機房有關管理規定,不得攜帶與施工無關的物品進入機房,并自覺接受保安人員或機房管理人員的管理、監督和檢查。
第二十四條 施工人員未經許可不得進入非指定工作區域,施工前須布置適當的防護設施;施工人員在現場嚴禁吸煙,不得在機房的任何地方坐臥,飲食,或從事與施工無關的事情。
第二十五條 施工人員在施工過程中不得擅自動用機房設施和設備,如因施工管理不善造成機房設施、財產及其他一切經濟損失,施工單位必須承擔責任并負責賠償。
第五章 機房安全管理規定
第二十六條 進入機房的人員必須遵守《機房出入管理規定》以及有關規章制度。
第二十七條 機房內的設備、工具及相關資料應存放在指定地點,未經許可不得私自帶出機房。
第二十八條 機房內嚴禁吸煙,嚴禁存放易燃、易爆、易腐蝕等危險性物品,嚴禁動用明火;禁止在電器設備上放置紙張等其它雜物;不得存放與系統運行維護和管理無關的設備、物品和資料。
第二十九條 機房管理人員或保安巡檢員應熟悉機房環境以及安全通道的位置,應懂得防火知識,滅火常識,熟悉機房消防設施的使用方法,具有及時發現火災隱患的能力。
第三十條 未經批準,不得擅自對網路拓撲結構、連接方式進行修改或拆接,如需作拆接或修改,需經信管部經理同意后方可進行,并把修改情況記錄在案,未經允許,機房管理人員、保安人員不得動用機房內的計算機網絡設備,線路等。
第六章 中心機房突發事件應急預案
第三十一條 機房突發事件包括網絡設備或服務器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。 針對突發事件的預防措施如下:
1、建立安全、可靠、穩定運行的機房環境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統;加強所有人員防火、防盜等基本技能培訓。
2、服務器采用可靠、穩定的硬件設備,落實數據備份機制,安裝有效的防病毒軟件,及時更新升級掃描引擎;加強對局域網內所有用戶和信息系統管理員的安全技術培訓。
第三十二條 機房漏水應急預案如下:
1、發生機房漏水時,第一目擊者應立即通知機房管理人員。
2、若空調系統出現滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時聯系設備供應方處理,同時啟動備用空調,必要情況下可臨時用電扇對服務器進行降溫。
3、若為墻體或窗戶滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時安排通知辦公室,及時清除積水,維修墻體或窗戶,消除滲漏水隱患。
第三十三條 機房火災應急預案如下:
1、完善機房環境,確保機房FM200自動滅火系統工作正常,設置為滅火系統為自動狀態。
禁止攜帶易燃易爆物品進入機房。
2、機房管理人員應熟悉機房內部消防系統安全操作和規則,了解機房內FM200滅火消防設備操作原理,掌握消防應急處理步驟、措施和要領,懂得滅火的方法,會撲救初起火災,并定期組織滅火演習。
3、一旦發生火情,要迅速切斷電源(電源已和消防系統聯動),利用機房專用滅火系統滅火,使用氣體滅火系統,要保證機房內所有人員全部撤離現場,方可放氣滅火(緊急情況采用手動啟動,見氣體滅火系統操作手冊);如機房氣體滅火系統失效,在保證人員安全的情況下要立即使用備用手持式滅火器手動滅火,同時以最快的方式向主管領導匯報,盡快增加援助人員協力救火,并迅速撥打物業管理和119火警電話。
4、等待消防車到來期間,應組織物業保安或工作人員在保證安全的前提下滅火,應急領導小組應在第一時間內集中所有可用滅火器,抓住時機,盡可能的把火撲滅。
5、配合消防部門調查事故原因,對造成的損失和起火原因做好記錄,以便進行災后總結。
第三十四條 雷擊事故應急預案如下:
1、遇雷暴天氣,機房管理人員在下班后應及時關閉所有服務器,切斷電源,暫停內部計算機網絡工作。
2、雷暴天氣結束后,機房管理人員應及時開通服務器,恢復內部計算機網絡工作,對設備和數據進行檢查。出現故障的,事發部門應將故障情況及時報告信管部。
3、因雷擊造成損失的,機房管理人員應會同相關部門進行核實、報損,并在調查工作結束后一日內書面報告領導。
第三十五條 設備防盜被盜或人為損害應急預案如下:
1、機房管理人員每日查看、清點設備并鎖好機房大門。
2、機房管理人員每日檢查錄像監控服務器狀態,確保監控畫面正常,并檢查每日錄像正常性、完整性。
3、發生設備被盜或人為損害設備情況時,使用者或管理者應立即報告信管部負責人,同時保護好現場。
4、信管部接報后,通知保安及公安部門,一同核實審定現場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。
5、事發單位和當事人應積極配合公安部門進行調查,并將有關情況向信管部匯報。
第三十六條 機房停電應急預案如下:
接到停電通知后,信管部應及時通過辦公系統 、電話等發布相關信息,部署應對具體措施,要求涉及到的工作人員在停電前停止業務、保存數據。
1、確認電力可能恢復的時間,立即通知中心機房電源維護負責人和中心機房各設備的負責人到達現場,做好各機房停電準備。
如果確認機房停電的`時間為短時間停電,立即可以恢復供電的情況(如15分鐘以內,根據UPS電池使用周期和壽命,電池后備時間將會減少,應根據現場實際情況,留出機房設備正常關機時間),可以在UPS正常供電的時間內,應密切觀察UPS帶負載時間,等到電力恢復,期間如UPS剩余時間低于50%(應滿足機房設備正常關機時間),機房負責人應立即嚴格按操作手冊停掉機房內的所有設備(包括各應用服務器、存儲、核心交換機和路由期等設備的電源,以及機房輔助設備的電源,最后關閉UPS(見UPS操作手冊),等待電力恢復,電力恢復供電后轉第七條執行。
如果不能確認恢復供電時間,立即匯報給機房電源維護負責人和中心機房各設備的負責任到達現場。做好各設備的電源停電準備,嚴格按操作手冊停掉機房內的所有設備(包括各應用服務器、存儲、核心交換機和路由期等設備的電源,以及機房輔助設備的電源,最后關閉UPS(見UPS操作手冊),等待電力恢復,電力恢復供電后轉第4條執行。
2、機房維護負責人將停電的電源柜總空開和分空開的狀態處于斷開狀態,關閉順序應為,先關閉回路小開關,再關閉總開關(UPS關閉后,應先關閉UPS輸出回路開關,再關閉UPS輸出總開關,接著關閉UPS輸入開關)并向主管領導匯報。
3、將掉電的所有的設備電源狀態處于下電狀態,以防止電源柜加電對設備的沖擊。
4、電力室恢復供電后,先不要急于給電源柜加電,等待10-20分鐘后,再開始給電源柜加電,以防止供電不穩或再次掉電。
5、供電正常后,確定設備處于下電狀態后,打開電力柜的總控開,開啟UPS的市電輸入開關,開啟UPS(見UPS操作)。
6、根據設備加電順序,啟動分路空開。
7、設備加電順序,網絡設備正常后再給服務器、存儲等設備加電開機。(以上各設備務必按操作手冊的啟動順序上電)。
8、設備啟動正常后,開始啟動數據庫。
9、數據庫啟動正常后,開始啟動中間件服務器。
10、中間件服務器正常后,啟動應用程序。
第三十七條 通信網絡故障應急預案如下:
1、發生通信線路中斷、流量異常等故障后,員工應及時通知信管部人員。
2、信管部在接到報告后,迅速組織相關技術人員檢測故障區域,并作相關故障處理,必要時通知通信網絡運營商查清原因;逐步恢復故障區與服務器的網絡聯接,恢復通信網絡,保證正常運轉。
3、應急處理結束后,信管部應在一日之內提交故障分析報告,以便備案。
第三十八條 服務器故障應急預案如下:
1、機房管理人員每日檢查機房設備工作狀態,確保系統運行的完善。
2、機房管理人員定期備份數據和資料,并將備份資料刻錄成光盤或拷貝到移動硬盤。
第三十九條 發生機房突發事件后,信管部應采取有效措施開展先期處置,恢復信息網絡正常狀態。應急處置工作結束后,信管部對事件發生原因、性質、影響、后果、責任及應急處置能力、恢復重建等問題進行全面調查評估,根據應急處置中暴露出的管理、協調和技術問題,改進和完善預案,實施針對性演練,總結經驗教訓,整改存在隱患,組織恢復正常工作秩序。
第七章 附則
第四十條 信管部會結合信息網絡快速發展和經濟社會發展狀況,配合相關法律法規的制定、修改和完善,適時修訂管理辦法。
第四十一條 本文件由信息管理部制定并負責解釋。
第四十二條 本文件經批準后發布實施。
20xx年05月10日
上海市xx信管部
【機房應急預案】相關文章:
機房應急預案02-10
機房火災應急預案08-04
機房消防應急預案12-25
機房應急預案[匯編15篇]02-10
應急預案07-03
應急預案06-13
救援應急預案10-22
應急預案演練09-01
停電的應急預案09-10