smartctl 輸出詳解

樣例:

 

FLAG是標記,標準數值(VALUE)應當小於或等於關鍵值(THRESH)。WHEN_FAILED 代表錯誤信息,上面顯示的WHEN_FAILED縱行是空行,說明硬盤沒有故障。如果WHEN_FAILED顯示數字,表明硬盤磁道可能有比較大的壞道。

  • read error rate 錯誤讀取率:記錄讀取數據錯誤次數(累計),非0值表示硬盤已經或者可能即將發生壞道;

  • throughput performance 磁盤吞吐量:平均吞吐性能(一般在進行了人工 Offline S.M.A.R.T. 測試以後纔會有值。);

  • spinup time 主軸電機到達要求轉速時間(毫秒/秒);

  • start/stop count 電機啓動/停止次數(可以當作開機/關機次數,或者休眠後恢復,均增加一次計數。全新的硬盤應該小於10);

  • reallocated sectors count 重分配扇區計數:硬盤生產過程中,有一部分扇區是保留的。當一些普通扇區讀/寫/驗證錯誤,則重新映射到保留扇區,掛起該異常扇區,並增加計數。隨着計數增加,io性能驟降。如果數值不爲0,就需要密切關注硬盤健康狀況;如果持續攀升,則硬盤已經損壞;如果重分配扇區數超過保留扇區數,將不可修復

  • seek error rate 尋道錯誤率:磁頭定位錯誤一次,則技術增加一次。如果持續攀升,則可能是機械部分即將發生故障;

  • seek timer performance 尋道時間:尋道所需要的時間,越短則讀取數據越快,但是如果時間增加,則可能機械部分即將發生故障;

  • power-on time 累計通電時間:指硬盤通電時間累計值。(單位:天/時/分/秒。休眠/掛起不計入?新購入的硬盤應小於100hrs);

  • spinup retry count 電機啓動失敗計數:電機啓動到指定轉速失敗的累計數值。如果失敗,則可能是動力系統產生故障;

  • power cycle count 電源開關計數:每次加電增加一次計數,新硬盤應小於10次;

  • g-sensor error rate 墜落計數:異常加速度(例如墜落,拋擲)計數——磁頭會立即回到landing zone,並增加一次計數;

  • power-off retract count 異常斷電次數:磁頭在斷電前沒有完全回到landing zone的次數,每次異常斷電則增加一次計數;

  • load/unload cycle count 磁頭歸位次數:指工作時,磁頭每次迴歸landing zone的次數。(ps:流言說某個linux系統——不點名,在使用電池時候,會不斷強制磁頭歸爲,而磁頭歸位次數最大值約爲600k次,所以認爲linux會損壞硬盤,實際上不是這樣的);

  • temperature 溫度:沒嘛好說的,硬盤溫度而已,理論上比工作環境高不了幾度。(sudo hddtemp /dev/sda)

  • reallocetion event count 重映射扇區操作次數:上邊的重映射扇區還記得吧?這個就是操作次數,成功的,失敗的都計數。成功好說,也許硬盤有救,失敗了,也許硬盤就要報廢了;

  • current pending sector count 待映射扇區數:出現異常的扇區數量,待被映射的扇區數量。 如果該異常扇區之後成功讀寫,則計數會減小,扇區也不會重新映射。讀錯誤不會重新映射,只有寫錯誤纔會重新映射;

  • uncorrectable sector count 不可修復扇區數:所有讀/寫錯誤計數,非0就證明有壞道,硬盤報廢;

 

SSD固態硬盤多出的Attributes 信息解釋:

其中我們比較關注的有以下四點:

1、Media_Wearout_Indicator:    使用耗費,100爲沒有任何耗費; 表示SSD上NAND的擦寫次數的程度,初始值爲100,隨着擦寫次數的增加,開始線性遞減,遞減速度按照擦寫次數從0到最大的比例。一旦這個值降低到 1,就不再降了,同時表示SSD上面已經有NAND的擦寫次數到達了最大次數。這個時候建議需要備份數據,以及更換SSD。

上面的機器爲099,按照100滴血算,目前只耗了1滴血

2、Reallocated_Sector_Ct: 出廠後產生的壞塊個數, 初始值爲100,如果有壞塊,從1開始增加,每4個壞塊增加1

這裏offer的機器還沒有任何壞塊

3、Host_Writes_32MiB: 已寫32MiB, 每寫入65536個扇區raw value增加1。這個扇區還是個數量單位,512字節

比如:這塊盤就是 1284966 * 65536 * 512 = 40155.1875 GB

注意到每個機器都有一塊盤寫的比較少,這塊盤就是hotspare盤。

每臺機器我們有7塊ssd盤。其中6塊盤做的raid 5,第7塊盤做的hotspare。

4、Available_Reservd_Space: SSD上剩餘的保留空間, 初始值爲100,表示100%,閥值爲10,遞減到10表示保留空間已經不能再減少

....................................別的地方看到的copy過來慢慢看

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章