服務器常見故(gù)障及解決方(fāng)法(fǎ)簡(jiǎn)析(xī)
一、造成服(fú)務器無法啟動的主要原因 :
市(shì)電或電(diàn)源線(xiàn)故(gù)障(斷電或接觸(chù)不良)
電源或電源(yuán)模組故障
內存(cún)故障(一般伴有報警聲(shēng))
CPU故障(一般也會有報(bào)警聲)
主(zhǔ)板(bǎn)故障
其它插卡造成(chéng)中斷衝(chōng)突
二(èr)、服務(wù)器無法啟動 ?
檢查(chá)電(diàn)源線和各種I/O接(jiē)線是否連接正常。
檢查連接電源線後主板是否加電。
將服務器(qì)設為最小配置(隻(zhī)接單(dān)顆cpu,最少的內(nèi)存,隻連接顯示器和(hé)鍵盤(pán))直(zhí)接短接主板開關跳(tiào)線,看(kàn)看是否(fǒu)能夠啟動。
檢查電源,將所有的電(diàn)源接口拔下,將電源的主板供電口(kǒu)的綠線和(hé)黑線短接,看看電源是否(fǒu)啟動。
如果判斷電源正(zhèng)常(cháng),則需要用(yòng)替換法來排(pái)除故障,替換法是在最小化(huà)配置下先由最容易替換(huàn)的配件開始替換(內存、cpu、主板)(本文轉(zhuǎn)自河南數據恢複網www.hnsjhf.cn )
三(sān)、係統頻繁重啟 ?
造成係統頻繁重啟的原因:
電源故障(替換法判(pàn)斷解決)
內(nèi)存故障(可從Bioses錯誤報告(gào)中(zhōng)查出)
網(wǎng)絡端口數據流量過大(工(gōng)作壓力過大)
軟件故障(更新或重裝操作係統解決)
四、服務器死機(jī)故障(zhàng)判斷處理(lǐ):
服務器死機故障(zhàng)比較難以判斷,一般(bān)分(fèn)為軟件和(hé)硬件(jiàn)兩個方麵:
軟件故障
硬件故障(zhàng)
軟件故(gù)障(zhàng)
首(shǒu)先(xiān)檢查操作係統的係統日誌,可以通過係統日誌來判斷部分造成死機的(de)原(yuán)因。
電腦病毒(dú)的原因。
係統軟件的bug或漏洞造成的(de)死機(jī),這種(zhǒng)故障需要在判斷硬件無故障後(hòu)做(zuò)出,而且需要軟(ruǎn)件(jiàn)提(tí)供商提供(gòng)幫助(zhù)。
軟件使用不當或係統(tǒng)工作壓力過大,可以請(qǐng)客戶適當降低(dī)服務器的(de)工作壓力來看看(kàn)是否能夠(gòu)解決
硬件故障
硬件衝突
電源故障或電源供電不足,可以通過對比計(jì)算服務器(qì)電源(yuán)所(suǒ)有(yǒu)的負載功率的值來(lái)作出判斷。
硬盤故障(zhàng)(通過掃描硬盤表麵(miàn)來檢查是否有壞(huài)道(dào))
內存故障(可以通過主板Bioses中的錯誤報(bào)告和操(cāo)作係統(tǒng)的報錯信(xìn)息來判斷)
主板(bǎn)故障(zhàng)(使用替換法(fǎ)來判斷)
CPU故障(使(shǐ)用替換法(fǎ))
板卡故障(一般是SCSI/RAID卡或其他(tā)pci設備也有可(kě)能(néng)造成係(xì)統死機,可用(yòng)替換法判(pàn)斷處(chù)理)
注意(yì):係統死機(jī)故障需要在處理完後需(xū)要在一段時間內(nèi)進行一定壓力(lì)的(de)拷機測試來盡一步檢查故障是否徹底解決。
五、安裝操作係統(tǒng)時提(tí)示找不到硬盤?
故障原(yuán)因:
無物理硬盤(pán)設備
硬盤線(xiàn)纜(lǎn)連接問題
沒有安裝硬盤控(kòng)製器(qì)驅(qū)動或驅動(dòng)不相(xiàng)符(fú)
六、如何獲(huò)得驅(qū)動程(chéng)序?
使用隨機光盤製作相應驅(qū)動
七、為什麽用正確(què)的驅(qū)動仍然無法加載硬盤控製(zhì)器驅動?
查(chá)看是否啟用了(le)hostraid功能。
八、新購(gòu)買的一塊硬盤,安裝到機器(qì)上之(zhī)後,機器自(zì)檢無法(fǎ)通過(guò)?
將新的(de)硬盤取下,機器是否可以自檢通過;
檢查新(xīn)增加的硬盤(pán)的ID號是否與原(yuán)來(lái)的硬盤的ID號相(xiàng)同,如果硬盤的(de)ID號相同的話,自檢將(jiāng)無法通過。
九(jiǔ)、如何(hé)格式化SCSI硬(yìng)盤?
有操(cāo)作(zuò)係統的(de)情況:使用磁盤管(guǎn)理工(gōng)具格式化;
無(wú)操作係統的(de)情(qíng)況:在SCSI管理(lǐ)控製界麵格(gé)式化;
以ADAPTEC Raid卡為(wéi)例(lì):開(kāi)機-出現CTRL+A 信息時(shí),按CTRL+A進(jìn) 入(rù)-選中通(tōng)道(dào)A
-選中SCSI UTILITY-將檢測到硬盤-選中(zhōng)要檢(jiǎn)測的硬盤
-選中FORMAT可(kě)對(duì)硬盤進行全麵格式(shì)化
選中VERIFY可對硬盤進行檢測,檢(jiǎn)查是否有壞道
注意:在格式化硬盤時(shí)不能中斷(duàn)或停電,不然會損壞磁盤
十(shí)、在Aisino 係列中有RAID卡機器(qì),當其中一個硬盤不能正常工(gōng)作RAID報警,但係統能正常運行,怎麽辦?
用一個新硬盤(pán),確保容量大於或等(děng)於不能正常工(gōng)作的硬(yìng)盤,最好(hǎo)用相同型號(hào)的硬盤(pán)替換即可(kě)。
RAID卡相關常見故障
第一類: RAID卡本身有問題
經常表(biǎo)現(xiàn)為RAID信息(xī)丟失,硬盤經常掉線,不能做REBUILD,開機(jī)自檢時檢測不到硬(yìng)盤或時(shí)間(jiān)長。
典型故障A:
作完RAID1,安裝操作係(xì)統(tǒng),一切正常,但第二次重(chóng)啟係統時,發出報警聲,經檢查發現(xiàn)一(yī)塊硬盤掉(diào)線,REBUILD後(hòu),又恢(huī)複正(zhèng)常,但重啟後又掉(diào)線。懷疑為硬盤故障,校(xiào)驗(yàn)硬盤後均無問題。最後更換RAID卡(kǎ),故障解決。
典型故障B:
機器(qì)經常死機,且有時候啟動(dòng)速度非常慢(màn)。觀察係統日誌,發現(xiàn)在係統啟動時有這樣一個錯誤提示:設備/devices/scsi/port0 在傳輸等待的(de)時間(jiān)內沒有響應。更換(huàn)RAID卡後,恢複正(zhèng)常。
第二類: 硬盤本(běn)身問題(tí)
表現為硬盤掉線,在RAID陣列中的狀態為DEAD,或者在作(zuò)REBUILD時,作(zuò)到某一(yī)進度就不能繼續
典(diǎn)型(xíng)故障:
硬(yìng)盤掉線(xiàn)後,做REBUILD時,作到20%時出(chū)現錯誤提示無(wú)法繼續進行。在確認掉線硬(yìng)盤(pán),硬盤盒及SCSI電(diàn)纜都能正(zhèng)常工(gōng)作(zuò)後,對在線硬盤進行(háng)校驗,發現有壞道,修複硬盤(pán),重做REBUILD,恢複(fù)正(zhèng)常。
第三類: 硬盤盒(hé)或模組的接觸問(wèn)題
此類問題經常(cháng)表(biǎo)現為RAID卡根本檢測不到硬盤(pán),此類問題比較簡單,但在處理硬盤盒相關機器時,需要注意一些(xiē)問題。
典型故障:
RIAD卡中檢測不到(dào)硬盤(pán),把SCSI電纜接到主板的(de)ULTRA160接口上,故障依舊,拔出(chū)硬(yìng)盤盒(不包(bāo)括硬盤(pán)盒後麵的托架)更換,故障依(yī)舊,更(gèng)換硬盤,還是不行。最(zuì)後卸下硬盤盒(hé)後麵(miàn)的托架(非熱插拔部分(fèn)),發現後托架上80PIN接口上的一根針彎曲,校直彎針,恢(huī)複正常。
十一、在服務(wù)器上使用的SCSI硬盤,為什(shí)麽硬盤的(de)ID號(hào)不能設置為7?
SCSI控製器中,默認(rèn)將ID=7設置為硬盤控製(zhì)器占,所以硬(yìng)盤的ID號不能設置為7
十二(èr)、為什麽開(kāi)機自檢無法(fǎ)通(tōng)過?
解(jiě)決方法:
機器切(qiē)斷電(diàn)源,將機箱打開(kāi),用(yòng)“COMS CLEAR”跳線(xiàn)的跳線帽將“COMS CLEAR”跳線的(de)另外兩個針短接(跳(tiào)線參(cān)看主板說(shuō)明書)
機器加(jiā)電,自檢(jiǎn),等機器自檢(jiǎn)完閉(bì),報CMOS已被清除,然後將機器電源關掉(diào),把(bǎ)跳線(xiàn)複原即可(kě)
機器重新開機
十三、物理內存插槽報(bào)錯
解決方法:
開機-按F2進入“SETUP”-“ADVANCED”--“MEMORY CONFIGURATION” 回車-“CLEAR DIMM ERRORS” 直接(jiē)回車
十四、為(wéi)什麽處理器報錯(cuò)或自檢(jiǎn)過(guò)程(chéng)中隻找到一個處理器?
解(jiě)決方法:
開機--〉按(àn)F2鍵,進入"SETUP"
1、依次"MAIN" --〉"PROCESSOR" --〉"CLEAR PROCESSOR ERRORS [ ]" :將此選項值(zhí)設置為"YES" ;
2、依次"ADVANCED " --〉"RESET CONFIGURATION DATA [ ] ":將此選(xuǎn)項的值設置為" YES" ;
3、依次"SERVER " --〉"PROCESSOR RESET [ ] ":將此(cǐ)選項的值設置(zhì)為" YES" ;
4、依次"SERVER " --〉"SYSTEM MANAGEMENT ":回車 --〉 "CLEAR EVENTLOG [ ] " :將此選項 的值設置為(wéi)" YES"
5、按F10,保存退(tuì)出(chū)
關鍵詞:服務器
閱讀本文後您有什麽感想? 已有 人給(gěi)出(chū)評價!
- 1
- 1
- 1
- 1
- 1
- 1