קצת אתגר למבינים בEXCHANGE - טכנולוגיית מידע - IT - HWzone פורומים
עבור לתוכן
  • צור חשבון

קצת אתגר למבינים בEXCHANGE


taurus007

Recommended Posts

יש ערך שנקרא Outstanding RPC Requests

הערך הזה אמור להיות 0 כל הזמן - אני עובד בסביבת DAG והערך הזה עולה כל 2-3 דקות ל-1 בצורה קבועה ולפעמים עולה גם למשך 5 דקות לערך

עכשיו אני לא מצליח לזהות תקלה תאכלס חוץ מידי פעם שהאאוטלוק קופא לסירוגין לחלק מהמשתמשים למשך 10 שניות וזה לא קשור לרגעי העומס - זה קורה בלי קשר לעומס הזה .

מישהו יודע את משמעות הערך הזה מבחינת המערכת , אני לא מצליח למצוא את התאכלס שקשור בערך הזה או להצביע על איפה להסתכל כדי למצוא למה כל 2-3 דקות הערך עולה ל1 ולמה כל חצי שעה הערך על 1-3 עד 5 דקות

אשמח לINPUT נוסף אם מישהו מכיר את הערך הזה .

קישור לתוכן
שתף באתרים אחרים

ידוע שזה RPC הערך הזה קשור לRPC , אבל חשוב לי שהמערכת תעבוד טוב ולפעמים יכול להיות מצב שמשתמשים אומרים "אה זה תמיד ככה" ומבטלים ואז בעצם אין לי מושג אם המערכת טובה - להוציא הקפיאות שיש מידי פעם- אז אני רוצה לשים את האצבע למה הערך הזה יוצא מגבולות הנורמה , והערך הזה בגדול לפי מה שקראתי לא אמור לעבור את ה1 .

אז אני נותן לו בין 1-3 כי אני עובד על סביבת DAG של 400 משתמשים - אבל יכול להיות שהחלוקה של הRPC לא עוברת נכון בין השרתי DAG לכן חשוב לי לזהות מה הקשר לערך כדי שלא סתם נקצה משאבים למרות שתאכלס מדובר על הגדרה לא נכונה .

קישור לתוכן
שתף באתרים אחרים

אתה יודע מה DAG אומר?! DAG זה כולה הכביכול קלאסטר של שרתי הMAILBOX שלך, יכול להיות שבמקרה שלך על כל שרת יושבים על הROLE. אבל להגיד שהEXCHANGE שלך נמצא בסביבת DAG זה כמו להגיד "השמיים כחולים". זה ברור שקיים לך DAG, גם שרת MBX בודד יכול להחשב כDAG פשוט אין לו MBX NODE נוספים). אתה צריך לתת פירוט יותר גבוהה על הסביבה שלך...

קישור לתוכן
שתף באתרים אחרים

יש DAG לשרתי הMBX - שני שרתים .

ושני שרתי CAS שעובדים עם NLB

הRPC הזה שציינתי זה משהו בין השרתי CAS או בין הCAS לMBX לפי הבנתי ואם יש שם איטיות אז הערך הוא מעל 1 , אז עומס בין השרתים אין

אז איך אני יכול להצביע על חלוקת RPC באמצעות הNLB בדיוק ?

ההשערה שלי שהשרתים לא מתקשרים בצורה טובה באמצעות הRPC אבל לא מצליח נכון לרגע זה לבדוק את זה , אני אפילו לא יודע אם הRPC מחולק על ידי NLB וROUND ROBIN או שזה מגיע לשרת אחד .

קישור לתוכן
שתף באתרים אחרים

מה הסתבכת עם עצמך? זה בסדר שערכים עולים, השאלה הנשאלת זה אם הם יורדים חזרה...

תריץ תקאונטר לאורך כמה ימים, תראה אם הקפיצות שלך קורות בפרקי זמן קבועים, למשל בבוקר, כשכולם מגיעים לעבודה ובודקים מיילים, או ב5 רגע לפני שכולם הולכים... בכל מקרה מבחינה מהותית אין לכמות בקשות RPC שום רלוונטיות אם הערך יורד (בהנחה שהשרתים שלך מספיק חזקים לעמוד בעומס).

קישור לתוכן
שתף באתרים אחרים

הסתבכתי עם עצמי כי אני רוצה מערכת שעובדת בסטנדרט הראוי , בלי עין הרע יש סטורג' איכותי שמחזיק את השרתים כל הסוויצ'ים במהירות טובה

אם המערכת לא מתפקדת ברמה שהיא צריכה לתפקד צריך לסדר את זה .

אם אני משתמש עכשיו בהרבה יותר משאבים בגלל שקונפיגורציה לא טובה , אז האחוז תועלת מול עלות שלי לא טובה .

הקמתי שרת ניטור עם הערכים של הברירת מחדל , רוצה להבין אותם על מנת שהמערכת תהיה כמו שצריך .

והערך הזה עולה ל1-3 כל שתי דקות למשך כל היום - אין חוקיות , מבחינת הערך לא אמור לעבור את ה1 וזה בסביבות מורכבות על פי מאמרים שקראתי

לכן העליתי את הפוסט כאתגר - כי לדעת שיש ערכים ולדעת נורמות זה נחמד , אבל אם מבינים אותם ואת כל התהליך שלהם ומה משפיע עליהם תדע להוציא מהמערכת שלך הרבה יותר % יעילות במינימום עלות .

ההבדל בין לדעת את התקינות של הערכים לבין להבין לאיפה קשורה התקלה, זה אותו הבדל שנותן לך ניסיון להתמודד עם דברים מסובכים יותר בעתיד.

כמו הערך הזה יש עוד 10 ערכים כאלה שאני מתמודד איתם אבל שם אני מצליח לשים את האצבע ולדעת לאיפה זה קשור כמו owa average respnse time

לעומת זאת הערך הספציפי הרשום בפוסט זה עדיין לא הצלחתי לשים את האצבע לאיפה זה קשור .

קישור לתוכן
שתף באתרים אחרים

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

×
  • צור חדש...