חברת הגיבוי ברשת Backblaze חקרה נתוני ניטור SMART של 40,000 כוננים קשיחים ומציגה חמישה נתונים שעשויים לסייע לכם לגלות, בטרם עת, מתי הכונן שלכם יכשל
מעטים מאוד עוקבים אחרי נתונים מערכת הניטור SMART אשר מובנים ברוב כונני האחסון אשר קיימים בשוק כיום, בעיקר משום שנתונים אלו הם בדרך כלל לא ברורים, לא ידידותיים למשתמש וגם נוטים להיות לא אמינים במיוחד לכאורה (בחלק מהמקרים תתקבל אזהרת שווא בנוגע לבריאותו הלקויה של כונן, ובמקרים אחרים המערכת לא תתריע לפני כשלון פתאומי).
עתה, נתונים שמציגה חברת Backblaze (המציעה פתרונות גיבוי ברשת בהתבסס על כוננים שמכוונים בדרך כלל לשוק הביתי), אשר נאספו מכ-40,000 כוננים קשיחים שונים ומגוונים ונותחו לעומק, מתיימרים לזקק מספר קטן של מדדים בעלי סיכוי טוב יחסית לחזות מוות בטרם עת של כוננים.
לפי הממצאים של Backblaze, חמשת הפרמטרים בעלי הקורלציה הגבוהה ביותר לכשל כוננים הם SMART 5, SMART 187, SMART 188, SMART 197 ו-SMART198. בקצרה – סקטורים מגנטיים בכונן שאינם ניתנים לתיקון, סקטורים שהוזזו ממקומם ופעולות שהופסקו לאחר תום זמן מוקצב מהווים, כך נראה, את הסימנים הבולטים ביותר לכך שכונן אחסון איננו בריא ועשוי להיכשל בטווח הזמן המיידי. אם חמשת הנתונים הנ"ל מדווחים כאפס בכונן שלכם ישנו סיכוי טוב שהכונן בטוח, אך אם מספר מהפרמטרים הללו מציגים מספרים שאינם אפס – כנראה שמוטב לכם לבצע גיבוי למידע החשוב ואולי אף להתחיל לחשוב על תחליף.
לא כל הפרמטרים הרלוונטיים מוצגים בנתוני ה-SMART של כל יצרניות הכוננים
ראוי לציין כי את הנתונים של Backblaze צריך לבחון בשילוב עם קמצוץ של ספקנות – לפני כחודשיים הציגה החברה נתונים לפיהם כוננים מבית חברת סיגייט (Seagate) כושלים ונהרסים בסבירות גדולה הרבה יותר מאלו של המתחרות, זאת על אף שהמידע עליו התבססו ההצהרות לא בדיוק איפשר השוואה מידתית ובלתי תלויה שתספק תוצאות עבור "העולם האמיתי". לא ברור האם היה זה מקרה פשוט של סטטיסטיקה שאינה משקפת את המציאות או שמא אולי הייתה יד מכוונת כלשהי בעניין, אך בכל אופן – הנתונים שבכתבה זו הם נתונים מעניינים שכדאי לעקוב אחריהם, אך בהחלט לא מדובר כאן על עובדות אוניברסליות ואמת מוחלטת.
על מנת לעקוב ולבחון את נתוני ה-SMART של הכוננים שלכם בצורה נוחה ונגישה ניתן להשתמש בתוכנות חינמיות כגון DiskCheckUp או HD Tune. נאחל לכולנו שלא נזדקק לבדוק את התיאוריות של Backblaze בנוגע למותם של כוננים על בשרנו.
חארטה.
לא ממש ישים וניתן לאלף פרשנויות,
כמו התשדיר של קופ"ח כללית על קריאת סימפטומים ברשת.
לא חרטא. אבל אצלי הכול פשוט יותר. אני בודק את נתון 5 בלבד
0 – הדיסק תקין
עד 10-20 – הדיסק לקראת סוף החיים שלו. ניתן לסרוק איפה הם ולחלק מחיצות כך שהמקום הבעייתי לא יהיה בתחום של מחיצה, ואז הדיסק מספיק טוב למחשב "לא חשוב" (מחשב שמשמש לגלישה באינטרנט, לא מוחזק עליו מידע כלשהוא ולא תהיה לאף אחד בעיה אם הדיסק מת סופית תוך יום, חודש או חצי שנה)
מעל זה – כנראה שהוא ימות סופית תוך זמן קצר
ניתן לסרוק איפה הם ולחלק מחיצות כך שהמקום הבעייתי לא יהיה בתחום של מחיצה, ואז הדיסק מספיק טוב למחשב "לא חשוב"איך?
תסבירו בבקשה איפה אני מוצא את הנתונים ב HDTUNE PRO ואיך הם נקראים
ממה שיצ לי לראות (בעיקר אם דיסקים של 40..160) דיסק שיש לו מספיק bad blocks לפעמים נתקע כשהוא מגיע אליהם. תריץ תוכנת סריקת bad blocks רגילה כמו badblocks, וכשההתקדמות שלה פתאום איטית והדיסק עושה רעשים, זה המקום הבעייתי
אם אתה לא רוצה להיות לייד המחשב – תכתוב סקריפט שמחלק את הדיסק למחיצות (נניח 10-20 מחיצות לוגיות) אם כלי כמו sfdisk, סורק כל אחת וכותב time stamps ללוג. אם יש מחיצה שלקח זמן חריג לסרוק אותה שם נמצא המקום הבעייתי (גם אם הסריקה עצמה לא מצאה כלום)
אם לא ניתן למצוא איפה ה bad blocks (הדיסק עובד "תקין" בכל השטח שלו), תחלק אותו למחיצות איך שבא לך
הנתונים האלה נקראים SMART
ועדיין, בלי לחזור על כל מה שנכתב, כל החלוקות לא פותרות את הבעיה העיקרית , שהיא,
התרבות של הבאד סקטורס במקרה הטוב או קריסה כללית של הקשיח מאלף ואחד סיבות.
אז יכולים להיות סופר זהירים – שלא לצורך, או סופר אדישים – גם לא מומלץ,
אבל חוץ מהפתרון של גיבוי על סוגיו, שום דבר לא ממש וודאי כשמדובר בדיסקים מכניים.
שכן, קשיח אחד עם כמה בעיות יכול לפעול עשור וקשיח אחר "ללא רבב" ידפק ללא התראה
כל שהיא. אישית, הייתי בשני הסרטים.
אני לא מבין למה זה טוב – ידע כל אחד שדיסק קשיח יכול להתאבד כל רגע נתון – יעשה גיבוי סדיר ואז הכל בסדר.
עלייה מתמדת במספר הreallocated sectors, זה כנראה אומר שיש בעיה גלובלית כלשהי בדיסק. זה אומר שגם אם הדיסק לא ייכשל טוטאלית (משהו שיכול לקרות פתאומית לכל דיסק בלי קשר לנתוני הSMART), עדיין ההתסברות לתקלה מקומית שתגרום להרס קבצים היא גבוהה מהרגיל, והפתרון הוא, כמו שאמר הבינארי – לא לאחסן עליו מידע קריטי, ובאופן כללי להיות מוכן להחליפו בהתראה קצרה.
לא מדויק ולא אמין, אבל השיטה הזאת בכל מקרה בסך הכול מיועדת לאפשר לנצל עוד קצת דיסק קשיח לא אמין. לא הולך, לא צריך, תחליף את הדיסק
הדיסק אכן מטפל ב bad blocks "בשקט" ולא מראה אותם למערכת ההפעלה. אם זאת ככל שהבעיה הולכת ומחמירה, זמן התגובה של הדיסק נהיה איטי בכל פעם שהוא מגיע לאזור הבעייתי – לפעמים מכיוון שיש שם blocks הוא עדיין לא ביצע עליהם reallocation אבל כן מתקשה לקרוא אותם. בסריקת bad blocks על דיסק בעייתי ניתן לראות שהוא מגיע למקום מסויים והבדיקה פתאום נתקעת ומתחילה להתקדם באיטיות, ובסוף לא מוצאת שגיאות. אבל המקום שבו הבדיקה נתקעה הוא בדיוק המקום שבו יש את הבעיה
נו, בסוף מגיעים למסקנה שכתבתי בתגובה הראשונה ( עם כל הצניעות ).
חייבים להיזהר ולהיות על המשמר, ושוב ושוב – לעשות גיבוי,
אבל קשה לסמוך על נתוני הקשיח המוצגים ע"י תוכנות למיניהן,
הן לחיוב והן לשלילה.
לעיתים, אוזן קשובה לרעשים חריגים טובה פי כמה מאיבחונים למיניהן
ולפעמים לא. וזאת כל הבעיה.
כתבת שם שמדובר בחארטה. זהו שלא. הנתון הזה (וספציפית 5) קשור ישירות למצב של הדיסק הקשיח, ויכול להראות על בעיה לפניי שיש רעשים או איבוד מידע ממשי. רצוי שתבדוק מידי פעם ב SMART ולא רק תקשיב לרעשים
וגיבוי – חשוב בלי קשר, גם בדיסק חדש לחלוטין
מה גם, שגם רעשים הם חארטה. הדיסק הכי ישן שלי שעדיין בשימוש (איפשהו מ2001-2002) תקופה מסוימת היה משמיע חריקות מוזרות כל כמה זמן. מעולם לא היה בו אף bad sector.
הreallocated sector count זה כנראה מאפיין הSMART היחיד שבאמת שווה משהו ושיש להתייחס אליו. רוב הBIOSים יתריאו כשהוא יורד מתחת לסף המוגדר.
אתם נתפלים לסמנטיקה.
התכוונתי, וגם אתם בטח יודעים, שמה שטוב לסטטיסטיקות
יהיה טיבען וטיבן אשר יהיה, לא בהכרח עוזר לנו, הצרכנים הביתיים.
אז כן, 5 נותן התראה כל שהיא, אבל גם לכם ברור שזו אחת מיני רבות שישנן,
כלומר גם עם 5 יהיה מושלם, זה לא מבטיח שהקשיח במצב מושלם.
וזה מחזיר אותנו לדבר היחידי שגם אם לא מושלם וחסין לחלוטין, הוא הרע במיעוטו –
וזה הגיבוי כמובן.
כל השאר – תקראו לזה חארטה, רולטה רוסית או כל דבר שבא לכם,
לא ממש משנה.לצערי.
איך באמת בודקים בHDTUNE PRO את הנתונים הנ"ל? בסריקה ארוכה ERROR SCAN?
אתה מדבר על נתוני הSMART? אז לא. הם פשוט מופיעים להם בלשונית health כמדומני.
זה רלוונטי גם ל-SSD ?