עבור לתוכן

בעיית ריסטארטים אקראיים

Featured Replies

פורסם

שלום,

בעבודה אך גם במנוחה המחשב מאתחל כל פעם בנק' זמן אחרת

החלפתי ספק, ניתקתי פלופי, חיבורי USB, מאוורר מארז

לא ניתקתי: כונן אופטי וקשיח וכמובן מאוורר מעבד

ניסיתי עם לינוקס לייב כדי לנטרל את הקשיח והמחשב לא אתחל אבל המערכת קפאה לי מס' פעמים (לאחר כל פעם שטענתי מחדש את המערכת)בזמן אחר.

האם יכול להיות שהבעיה בזכרון (הוצאתי אותו ושמתי אותו בסלוט השני).

פורסם

חושד בזיכרון? תריץ MEMTEST (מדריך בסטיקי).

בטל את הריסט האוטומטי בעת קריסה, כדי לבדוק אם מוצגים מסכים כחולים (חיפוש).

פורסם
  • מחבר

לא יודע אם יש את זה בסטיקי אבל

אם יש לך דיסק לייב של לינוקס, בבוט יש אפשרות ל MEMTEST

לי כרגע זה רץ מדיסק של לינוקס KUBUNTU 8.04.1 בגרסה1.7.

לא זוכר אם בכל לייב זה קיים אבל לפי זכרוני כן.

פורסם

"אם יש לך"?? אתה מדבר אל עצמך בגוף שלישי? אתה עוזר לעצמך?

תבדוק את הבעיה בממטסט נו! :)

פורסם
  • מחבר

לאאאאאאאאאא................... :) :) :)

אני מתכוון אם יש למישהו כזה דיסק הוא יכול להשתמש בו במקום להוריד, לצרוב וכו'

לענייננו..

הזכרון בסדר

הרצתי בדיקת מינידאמפ וזה מה שקיבלתי, קצת ארוך אבל אולי מישהו מבין

Probably caused by : Unknown_Image ( ANALYSIS_INCONCLUSIVE )

Followup: MachineOwner

---------

kd> !analyze -v

*******************************************************************************

* *

* Bugcheck Analysis *

* *

*******************************************************************************

MACHINE_CHECK_EXCEPTION (9c)

A fatal Machine Check Exception has occurred.

KeBugCheckEx parameters;

x86 Processors

If the processor has ONLY MCE feature available (For example Intel

Pentium), the parameters are:

1 - Low 32 bits of P5_MC_TYPE MSR

2 - Address of MCA_EXCEPTION structure

3 - High 32 bits of P5_MC_ADDR MSR

4 - Low 32 bits of P5_MC_ADDR MSR

If the processor also has MCA feature available (For example Intel

Pentium Pro), the parameters are:

1 - Bank number

2 - Address of MCA_EXCEPTION structure

3 - High 32 bits of MCi_STATUS MSR for the MCA bank that had the error

4 - Low 32 bits of MCi_STATUS MSR for the MCA bank that had the error

IA64 Processors

1 - Bugcheck Type

1 - MCA_ASSERT

2 - MCA_GET_STATEINFO

SAL returned an error for SAL_GET_STATEINFO while processing MCA.

3 - MCA_CLEAR_STATEINFO

SAL returned an error for SAL_CLEAR_STATEINFO while processing MCA.

4 - MCA_FATAL

FW reported a fatal MCA.

5 - MCA_NONFATAL

SAL reported a recoverable MCA and we don't support currently

support recovery or SAL generated an MCA and then couldn't

produce an error record.

0xB - INIT_ASSERT

0xC - INIT_GET_STATEINFO

SAL returned an error for SAL_GET_STATEINFO while processing INIT event.

0xD - INIT_CLEAR_STATEINFO

SAL returned an error for SAL_CLEAR_STATEINFO while processing INIT event.

0xE - INIT_FATAL

Not used.

2 - Address of log

3 - Size of log

4 - Error code in the case of x_GET_STATEINFO or x_CLEAR_STATEINFO

AMD64 Processors

1 - Bank number

2 - Address of MCA_EXCEPTION structure

3 - High 32 bits of MCi_STATUS MSR for the MCA bank that had the error

4 - Low 32 bits of MCi_STATUS MSR for the MCA bank that had the error

Arguments:

Arg1: 00000004

Arg2: 80546df0

Arg3: b2000010

Arg4: 00010c0f

Debugging Details:

------------------

NOTE: This is a hardware error. This error was reported by the CPU

via Interrupt 18. This analysis will provide more information about

the specific error. Please contact the manufacturer for additional

information about this error and troubleshooting assistance.

This error is documented in the following publication:

- Bios and Kernel Developers Guid for AMD Athlon® 64 and AMD Opteron® Processors

Bit Mask:

MA Model Specific MCA

O ID Other Information Error Code Error Code

VV SDP ___________|____________ _______|_______ _______|______

AEUECRC| | | |

LRCNVVC| | | |

^^^^^^^| | | |

6 5 4 3 2 1

3210987654321098765432109876543210987654321098765432109876543210

----------------------------------------------------------------

1011001000000000000000000001000000000000000000010000110000001111

VAL - MCi_STATUS register is valid

Indicates that the information contained within the IA32_MCi_STATUS

register is valid. When this flag is set, the processor follows the

rules given for the OVER flag in the IA32_MCi_STATUS register when

overwriting previously valid entries. The processor sets the VAL

flag and software is responsible for clearing it.

UC - Error Uncorrected

Indicates that the processor did not or was not able to correct the

error condition. When clear, this flag indicates that the processor

was able to correct the error condition.

EN - Error Enabled

Indicates that the error was enabled by the associated EEj bit of the

IA32_MCi_CTL register.

PCC - Processor Context Corrupt

Indicates that the state of the processor might have been corrupted

by the error condition detected and that reliable restarting of the

processor may not be possible.

BUSCONNERR - Bus and Interconnect Error BUS{LL}_{PP}_{RRRR}_{II}_{T}_err

These errors match the format 0000 1PPT RRRR IILL

Concatenated Error Code:

--------------------------

_VAL_UC_EN_PCC_BUSCONNERR_F

This error code can be reported back to the manufacturer.

They may be able to provide additional information based upon

this error. All questions regarding STOP 0x9C should be

directed to the hardware manufacturer.

BUGCHECK_STR: 0x9C_AuthenticAMD

CUSTOMER_CRASH_COUNT: 4

DEFAULT_BUCKET_ID: COMMON_SYSTEM_FAULT

PROCESS_NAME: csrss.exe

LAST_CONTROL_TRANSFER: from 806d58db to 804f8cb5

STACK_TEXT:

80546dc8 806d58db 0000009c 00000004 80546df0 nt!KeBugCheckEx+0x1b

80546ef4 806d0c2e 80042000 00000000 00000000 hal!HalpMcaExceptionHandler+0xdd

80546ef4 00000000 80042000 00000000 00000000 hal!HalpMcaExceptionHandlerWrapper+0x46

STACK_COMMAND: kb

SYMBOL_NAME: ANALYSIS_INCONCLUSIVE

FOLLOWUP_NAME: MachineOwner

MODULE_NAME: Unknown_Module

IMAGE_NAME: Unknown_Image

DEBUG_FLR_IMAGE_TIMESTAMP: 0

FAILURE_BUCKET_ID: 0x9C_AuthenticAMD_ANALYSIS_INCONCLUSIVE

BUCKET_ID: 0x9C_AuthenticAMD_ANALYSIS_INCONCLUSIVE

Followup: MachineOwner

פורסם

אני מציע שתחכה שזה יקרה שוב ותתן עוד Minidump שכן כמו שכתוב הוא אינו יודע להצביע בידיוק מה גרם לבעיה.

ולגבי הזכרונות.. בדקת לפחות חצי שעה עם Memtest והם יצאו בסדר? בלי שום שגיאה?

פורסם
  • מחבר

אפילו שעתיים

יותר מזה, שמתי זיכרון שלי ולא עזר.

אם תשימו לב כתוב שהמעבד שלח את הודעת השגיאה ייתכן שהוא הבעיה?

אם אני חושב על זה, המחשב הזה היה אצלי על אותה התקלה ואז גיליתי ש KSP לאחר שהחליפו את הספק שנדפק (החבר האדיוט שלי הזיז את הספק ל 115 ודפק אותו) שכחו לחבר את המאוורר של המעבד וככה החזירו אותו לחברי.

פורסם

מה הטמפ' של המעבד?(מאמץ+מנוחה [כמו כן - תציין אם הוא נמצא/היה ב-OC] )

התקנת רכיב חדש במחשב לאחרונה?(כרטיס טלויזיה, מתאמי USB וכד')

באיזה מערך זכרונות אתה עובד כרגע?(שני סטיקים/סטיק אחד)

*תציין בבקשה את המפרט המלא של המחשב.

**

מעבדי Pentium וכן Pentium Pro מספקים מנגנון לגילוי ולדיווח שגיאות הקשורות לחומרה, כגון שגיאות זוגיות בזיכרון ושגיאות מטמון. כדי לאותת על שגיאת זיכרון, המעבד מאותת גילוי של שגיאת בדיקת המחשב על-ידי יצירת חריג של בדיקת המחשב‏ (פסיקה 18). מערכת Windows XP מדווחת כי אירעה השגיאה ומציגה פרמטרים בהם באפשרותך להשתמש כדי לפענח את החריג. פנה לספק החומרה או ליצרן המעבד כדי לקבל פרטים על התכונה Machine Check Architecture, או עיין במדריך Intel Pentium Pro Family Developer's Manual - Volume 3: Operating System Writer's Manual

http://support.microsoft.com/?kbid=329284&sd=RMVP

פורסם
  • מחבר

לוח: K8NF4G-SATA2 של ASROCK

מעבד: SEMPRON בסוקט 754 בביוס טמפ. נורמלית של 37 מעלות.

זיכרון: 512 של TWINMOS DDR 400 סטיק 1

קשיח: 80GB SATA2 של SAMSUNG.

אופטי: NEC

לשאלותיך:

שום חלק לא היה ב OC

סטיק זיכרון 1

לא הותקן שום דבר חדש

מדגיש שוב:

אם אני חושב על זה, המחשב הזה היה אצלי על אותה התקלה ואז גיליתי ש KSP לאחר שהחליפו את הספק שנדפק (החבר האדיוט שלי הזיז את הספק ל 115 ודפק אותו) שכחו לחבר את המאוורר של המעבד וככה החזירו אותו לחברי.

לדעתי הסיכוי גדול שהמעבד נדפק מהתחממות

Milk-Inc:

החלפתי ספק+

שמתי זיכרון תקין ממחשב שלי שעובד ללא בעיה בסלוט השני של הלוח שלא היה בשימוש מעולם+

שמתי קשיח משלי ב IDE וניתקתי את שלו מה SATA+

ניתקתי מאורר מארז+

ניתקתי פלופי+

ניתקתי חיבורי USB מהמארז

ועדיין מאתחל.

בנוסף לזה אח"כ העלתי לינוקס לייב גם KUBUNTU ואח"כ גם MANDRIVA (ככה יש לי מערכת שעובדת רק מהזיכרון) ושניהם קפאו.

כך שלמעשה למעט הכונן האופטי נראה לי שזה הלוח או המעבד

האם לדעתך דרך החשיבה שלי נכונה (שיטת האלימינציה) - ניטרול רכיבים?

אם כן זה נראה לי כמו שעקב התחממות המעבד (ראה לעיל) הוא נדפק או דפק משהו בלוח

מה דעתכם??

פורסם

כמובן שזו דרך חשיבה נכונה, בשיטה הזו אפשר למקד את הבעיה(בדיוק כמו שעשית)

כמה זמן המעבד עבד ככה ללא מאוורר?

לדעתי - אם יש במארז סירקולציה טובה של אוויר, אז אין שום סיבה שיגרם נזק למעבד בטווח הקצר(+לא נעשה OC, אז זה גם מפחית מהסיכויים שיקרה נזה עקב טמפ' גבוהות מהרגיל)

בכל אופן - מכיוון ששללת כבר כמעט כל רכיב אפשרי באיתור התקלה, הייתי ממליץ לממש את האחריות(אם היא עדיין קיימת) של המעבד.

פורסם
  • מחבר

כן,

נראה שזה הכיוון אם כי עדיין יתכן שזה דווקא הלוח

מחר נרים טלפון ל KSP ונראה הלאה

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

דיונים חדשים