A. 如何查找 linux 死機原因
某個程序內存泄露,造成內存不足,但是正在運行另一個耗CPU與內存的程序時,找出內存泄露程序,然後kill掉。
B. 如何查找Linux死機原因
大致可以分為軟體和硬體兩類。
1.可能是系統中存在某些應用程序干擾了系統的正常內運行容,尤其是某些獲得root許可權的程序,因此為了手機的系統安全,請不要隨意使用root許可權。
2.可能是因為軟體不兼容當前的系統版本,這點和電腦很相似,比如有些程序,在windows XP下可以正常使用,但在win7中就不能使用。這種情況需要等待該軟體的升級。
3.可能是個人在使用過程中,誤刪了系統文件,可以通過重新安裝當前完整版系統解決。
4.極少的機器可能是因為硬體出現問題,如果手機反復出現該情況,可以前往你附近的維修點檢測一下。
C. LINUX系統無故死機,系統日誌報錯如下,各位幫忙看看是因為什麼
您好,很高興為您解答。
L Linux 死機有很多種情況,最常見的是系統負載過高導致的。
由於系統負載過高導致的卡死,一定是解決的越快越好!此時必須 記住的是,不能再試圖依賴任何圖形界面的東西,如 Gnome 的系統監視器,這只會繼續加重這種卡死的局面。Linux 最初就是不需要圖形界面的,因為有一個很強大的文字界面。按 Ctrl-Alt-F1(F1-F6 一般來說都可以),然後等一會兒,就會切換到 tty,也就是所謂的文字界面。這個時候需要用用戶名密碼登入。注意,可能鍵盤輸入的速度比較慢,不過應該還是可以忍受的。下面在提示符後面輸入 top 回車,這時會看到一張動態的表,上面列出了耗用資源最多的進程。觀察它刷新一兩次,按q退出,然後輸入 kill ,其中的 PID 你可以在 top 裡面看到。這個時候應該會快了不少,如果你發現沒有成功結束掉,就再輸入 kill -KILL ,這次基本上就沒問題了。
除了上面這種情況外,一些底層軟體的 bug 也可能導致一些奇怪的死機問題。在鍵盤上可以找到一個叫做「Sys Rq」的鍵,在台機的鍵盤上通常與 Prt Sc 共鍵,在筆記本可能在其他位置,如 Delete。以台機為例,要使用這種方法需要按住 Alt-Print(Sys Rq),然後依次按下 reisub 這幾個鍵,按完 b 系統就會重啟。
下面解釋一下這個方法:其實 Sys Rq 是一種叫做系統請求的東西,按住 Alt-Print 的時候就相當於按住了 Sys Rq 鍵,這個時候輸入的一切都會直接由 Linux 內核來處理,它可以進行許多低級操作。這個時候 reisub 中的每一個字母都是一個獨立操作,他們分別表示: unRaw將鍵盤控制從X Server那裡搶回來 tErminate 給所有進程發送 SIGTERM 信號,讓他們自己解決善後kIll 給所有進程發送 SIGKILL 信號,強制他們馬上關閉 Sync將所有數據同步至磁碟 Unmount將所有分區掛載為只讀模式 reBoot重啟 這6個字母的順序是不可以記錯的。
如若滿意,請點擊右側【採納答案】,如若還有問題,請點擊【追問】
希望我的回答對您有所幫助,望採納!
~ O(∩_∩)O~
D. linux提示內核死機不同步
linux提示內核死機不同步,我們不要慌,linux不像Windows,可以利用強大的文字界面操作,按Ctrl-Alt-F1,就會切換到TTY文字界面。再就需要用戶名密碼登入。需要注意的是鍵盤輸入的速度可能會比較慢。下面在提示符後面輸入top回車,這時會看到一張動態的表,上面列出了耗用資源最多的進程。觀察它刷新一兩次,按q退出,然後輸入kill ,其中的 PID 你可以在 top 裡面看到。這個時候應該會快了不少,如果你發現沒有成功結束掉,就再輸入 kill -KILL ,這次基本上就沒問題了。
除了上面 這種情況外,一些底層軟體的 bug 也可能導致一些奇怪的死機問題。以前有個用戶就因為莫名其妙的死機強制重啟把 ext4 的分區給傷了。最後是sysreccd修復了,貌似是分區表部分損壞,死機時鍵鼠均無反應。一般來說,系統負載高導致的死機,最可怕鍵盤的就是鍵鼠都沒反應了。
這時我們可以利用reisub,這個方法可以在各種情況下安全地重啟計算機。在鍵盤上找到一個叫做「Sys Rq」的鍵,在台機的鍵盤上通常與 Prt Sc 共鍵,在筆記本可能在其他位置,如 Delete以台機為例,要使用這種方法需要按住 Alt-Print(Sys Rq),然後依次按下 reisub 這幾個鍵,按完b系統就會重啟。
其實Sys Rq是一種叫做系統請求的東西,按住 Alt-Print 的時候就相當於按住了 Sys Rq 鍵,這個時候輸入的一切都會直接由 Linux 內核來處理,它可以進行許多低級操作。
這個時候reisub中的每一個字母都是一個獨立操作,他們分別表示:unRaw 將鍵盤控制從 X Server 那裡搶回tErminate 給所有進程發送 SIGTERM 信號,讓他們自己解決善後kIll 給所有進程發送 SIGKILL 信號,強制他們馬上關閉Sync 將所有數據同步至磁碟Unmount將所有分區掛載為只讀模式reBoot重啟。
E. linux伺服器死機了怎麼辦
伺服器死機的原因很多。如果確保在硬體沒問題的情況下。
可以先從/var/log下的日誌查起專..通過iostat 或者 vmstat sar 等命令來檢查屬機器的整體性能狀態。
我不知道你是否做了相關的監控措施,比如通過某些監控軟體對伺服器進行監控。
通過監控數據分析伺服器的整體狀況。
也可以協調應用部門查看應用方面的日誌是否有異常。這個還得按照具體情況分析。
關於更多Linux的學習,請查閱書籍《linux就該這么學》。
F. 如何查找Linux死機原因
因為 Linux 廣泛用於生產環境,所以每一次宕機都會引起相當大的損失。它 Uptime 達到上百天也許你習以為常,但是只要 Down 十幾秒,就會立即急的滿頭大汗。真的很難以想像證交所宕機會怎麼樣,也許全國股民會鬧翻天。所以我們需要一些小技巧來查找死機的原因,從而避免死機或者內核崩潰。(話說 windows 天天藍屏也沒感覺呀 :-o 難道已經麻木了 :oops: ) 請注意:以下方法可能不適用於 Server,因為桌面環境和 Server 還是有很大區別的。 X Crash 事實上 Linux 內核很少出錯,平常我們所遇到的「死機」都是 X 無響應造成的錯覺。那 X 沒響應了應該怎麼處理呢? 通常套路是 Ctrl + Alt +F7 (F8) 切換到某個 tty,然後用 root 登陸,執行 top 查看吃資源最多的程序,然後使用 pkill/kill/killall 等命令殺死該程序。或使用組合鍵 Ctrl + Alt + Backspace重啟 X (黑日白月註:這個快捷鍵組合在最新的 Ubuntu 和 Fedora 中關閉)。 如果偶遇切換 tty 失敗或者沒響應,鋒孝可以試著使用 SSH 登陸此電腦,然後再殺死程序。也許只是 X 不響應,而內核和 SSH daemon 仍然工作,故此可以實施此法。 arch 配置 SSH daemon 萬一X 不給力,各種方法試了無效,又沒有辦法通過 SSH 登陸到此 pc,那怎麼辦呢?別著急,我們還有萬能的 「reisub」 大法。不過在啟用前先要激活內核 sysrq 功能 (via) 。系統啟動時執行:echo 「1」 > /proc/sys/Kernel/sysrq 或者修改 /etc/sysctl.conf 文件,設置 Kernel.sysrq = 1。系統異常時依次按下 Alt+sysrq+{reisub} ,然後系統會自動重啟。(有關 sysrq 請看:Linux 死機了怎麼辦?) 不建議長按 Power 按鍵強制關機,有可能損壞硬體或者丟失數據,甚至導致磁碟壞道! X 崩潰而內核完好 常見的症狀有:程序無響應,花屏,滑鼠移動指針無動作,鍵盤輸入沒有識別等。但後台的音樂可以正常播放,或者鍵盤 Caps Lock/Num Lock/Scroll Lock 按鍵按後對應 LED 可以正常亮滅。遇到此種情況可以使用上述方法重啟 X 或者電腦即可悄基橘恢復正常。 Application Crash 這個比較常見,但是也是相當難解決的。因為 Linux 上的應用軟體大部分都是開源的,所以可能沒有超高的穩定性。也許由於庫的缺少或者版本錯誤,或啟團者代碼的 Bug,都有可能導致程序出現異常。 一般遇到這種問題,建議檢查配置文件是否正確,對配置文件的錯誤修改可能導致程序的運行失敗。如果您確信配置文件沒有錯誤但是程序仍然異常,可以嘗試把配置文件刪除(注意備份!),然後再次打開軟體嘗試。
G. linux兩個驅動同時初始化死機
這種情況可能是由於兩個驅動程序之間存在沖突或尺汪競爭條件導致的。當兩個驅動游襲程序同時初始化時,它們可能會嘗試訪問相同的硬體資源或內存區域,從而導致死機或系統崩潰。
要解決這個問題,可以嘗試以下幾種方法:
1. 禁用其中一個驅動程序。可以通過編輯系統配置文件或使用命令行參數來禁用其中一個驅動程序。
2. 更新驅動程序。如果兩個驅動程序都是必需的,可以嘗試更新它們的版本或使用更穩定的版本。
3. 調整硬體資源分配。如果兩個驅動程序都需要訪問相同的硬體資源,可以嘗試調整它們的資源分配方式,以避免沖突。
4. 檢查系統日誌。在系統死機後,可以查看系統日誌以獲取更多信息,以確定導致死機的原因,並採取相神困兄應的措施來解決問題。
需要注意的是,調試和解決這種問題需要一定的技術知識和經驗。如果您不確定如何處理這種情況,建議尋求專業的技術支持。
H. linux啟動startinghpssd:死機
如果問題能夠再現,那麼問題已經解決 80% 了。對於操作系統核心而言,如果有問題的再現方法,那麼可以說是已經解決 99% 了。經常遇到的問題是系統可以正常運行一段時間,然後死機。如果不好再現問題,那麼只有根據死機現場遺留的東西來進行分析了。
如果系統沒有死干凈,比如磁碟中斷和文件系統是好的,那麼也許能有日誌信息保留在文件中,不過這樣的好運氣我是從來沒有遇到過的。如果鍵盤中斷還能響應 (按下Num Lock,可以看見鍵盤小燈亮滅),那麼運氣就算是足夠好了,這時可以祭出 sysrq 大法,同時按下 Alt-Sysrq-T 獲得進程系統堆棧信息,按下 Alt-Sysrq-M 獲得內存分配信息,按下 Alt-Sysrq-W 獲得當前寄存器信息。
linux/Documentation/sysrq.txt。另外,最好關閉終端的自動 blank 功能,這樣系統死的時候至少能從屏幕上看到一些信息。設置方法是:
# echo 1 > /proc/sys/kernel/sysrq
# setterm -blank
這兩個設置最好加到系統啟動腳本中 (比如 /etc/rc.d/rc.local),保證每次啟動都能得到運行。
如果很不幸,鍵盤也死悄悄了,(更為不幸的是,這種情況很常見),那麼也不是只有等死一個辦法,這時可以用串口終端 (serial console)將系統信息發送
到另一台系統上,這樣可以通過對這些信息分析來定位問題。設置方法如下:
准備工作
1. 一台被監視的伺服器,一台進行監視工作的PC。
2. 一根串口直連線。
配置
1. 在伺服器上,加入一個新的 grub 項目,增加核心參數 "console=ttyS0 console=tty1",如:
kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root=LABEL=/1 console=ttyS0
console=tty1
2. 在伺服器上,修改 /etc/sysconfig/syslog,加入 klogd 選項 "-c 7",保證更多內核游沒衫信息得到輸出。如:
KLOGD_OPTIONS="-x -c 7"
3. 重新啟動伺服器
4. 用串口直連線連接兩台機器,測試:
1) 在PC上運行 "cat /dev/ttyS0",在伺服器上運行 "echo hi > /dev/ttyS0",看在 PC 上是否有 "hi" 輸出。
2) 在PC上運行 "cat /dev/ttyS0",在伺服器上運行 "echo w > /proc/sysrq-trigger",看 PC 上是否有相應內核信息輸出。
3) 在PC上運行 "cat /dev/ttyS0",在伺服器上運行 "modprobe loop",看 PC 上是否有相應內核信息輸出。
5. 如果測試通過,那麼在 PC 上運行:cat /dev/ttyS0 | tee /tmp/result
另外,也可以用神腔 Windows 超級終端獲得串口信息。
that』s it.
此外,一些核心支持 LKCD, netmp 等調試功能,也可以一試。
剩下的,就只有靠經驗和運氣了,一般造成 Linux 系統死機的原因有:
系統硬體問題 (SCSI 卡,主板,RAID 卡,網卡,硬碟...)
外圍察咐硬體問題 (終端切換器,網路...)
軟體問題
驅動 bug (去找更新的驅動試試)
核心系統 bug (去 LKML 上看看,或換個核心試試)
系統設置
I. linux系統無故死機,找不到原因,應該從哪著手考慮啊
造成死機的原因有好多啊 軟體 硬體都能造成死機
在linux系統上找原因的話我不是很了解 但是硬體 內存 CPU散熱 電源 都可以造成死機
建議 如果是多內存 全部拆掉 只留一根 測試看看還能不能死機 這個比較方便快捷
如果散熱沒問題的話 CPU方面可以排除
J. linux內存佔用卡死分析
一、硬體問題
可以考慮分析以下幾點:
1、不要超頻CPU,如果已經超頻的先回復到原來的頻率
雖然平時運行沒有問題,但可能在高負載的使用中就會出現不可預料的故障了。特別是linux系統在某些應用上,是可以把硬體的性能發揮到極限的,但這樣的硬體運行Windows可能是沒有問題的。
2、確認電源供電充足
必須確保在高負載的狀態下,電源可以滿足負載。
3、使用memtest86檢查內存狀態
4、恢復BIOS到默認狀態
對於伺服器,可以使用自帶的監測工具進行測試,也是一個不錯的排錯方法。
二、軟體問題
如果已經基本排除硬體問題,那我們就必須考慮從軟體上去獲得死機狀態的系統信息了。
1、運氣足夠好的話,系統死機不一定是完全死掉(此時鍵盤可能還能響應),那我們就可以使用Sysrq大法。
前提是我們必須先打開sysrq功能:
#echo "1" > /proc/sys/kernel/sysrq
#setterm -blank
這樣,當系統出現問題的時候,我們可以使用:
引用
Alt+Sysrq-T 獲得進程系統堆棧信息
Alt+Sysrq-M 獲得內存分配信息
Alt+Sysrq-W 獲得當前寄存器信息
更多的熱鍵可以參考系統上的/usr/src/linux/Documentaion/sysrq.txt
其中,setterm -blank可以關閉字元下定時黑屏保護,方便記錄屏幕信息。
2、為了讓屏幕顯示更多的內核調試信息,可以修改控制台的顯示模式為80x25,在/boot/grub/menu.lst中對應的kernel一行最後,增加vga=0x305,如:
引用
kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root=/LABEL=/1 vga=0x305
3、萬一鍵盤也不幸死掉了,那我們只能採用串口方式,把系統信息發送到另一台系統上,方法:
修改/boot/grub/menu.lst文件,在kernel一行最後增加核心參數"console=ttyS0 console=tty1",如:
引用
kernel /boot/grub/vmlinuz-2.4.21-9.30AXsmp ro root=/LABEL=/1 console=ttyS0 console=tty1
然後,修改/etc/sysconfig/syslog,加入klogd選項"-c 7",如:
引用
KLOGD_OPTIONS="-x -c 7"
重啟伺服器;進行測試:
1)使用串口直連線連接客戶機和伺服器,在客戶機上運行:
cat /dev/ttyS0
伺服器上運行:
echo hi > /dev/ttyS0
如果客戶機有"hi"輸出即可。
2)伺服器上運行:
echo w > /proc/sysrq-trigger
看看客戶機上是否有相應的內核信息輸出
3)伺服器上運行:
modprobe loop
看看客戶機上是否有相應的內核信息輸出
如果測試都通過的話,那麼在客戶機上運行:
cat /dev/ttyS0 | tee /tmp/result
當死機出現的時候,我們就可以從客戶機上看到需要的內核信息了(查看/tmp/result)。
三、總結
一般造成Linux系統死機的原因有:
系統硬體問題(SCSI卡,主板,RAID卡,HBA卡,網卡,硬碟等)
外圍硬體問題(網路等)
軟體問題(系統、應用軟體)
驅動bug(找新的驅動)
核心系統bug(到LKML看看,或更換核心再試)
系統設置(恢復到預設狀態,關閉防火牆等)