כל הקשקשנים בקומקום יכולים להירגע עם "הליבות המודבקות" של AMD - מעבדים, לוחות-אם וזכרונות - HWzone פורומים
עבור לתוכן
  • צור חשבון

כל הקשקשנים בקומקום יכולים להירגע עם "הליבות המודבקות" של AMD


Doron_Rajwan

Recommended Posts

כצפוי, יש משמעות מעטה בלבד, אם בכלל, להבדל אם המעבדים יושבים על אותו die או על שניים שונים.

Anandtech:

AMD's native quad- needs about 76ns to exchange (L1) cache information. That's not bad, but it's not fantastic either as the shared L2 cache approach of the Xeons allows the dual cores to exchange information via the L2 in about 26-30ns. Once you need to get information from 0 to 3, the dual die CPU of Intel still doesn't need much more time (77ns) than the quad- Opteron (76ns). The complex L1-L2-L3 hierarchy might negate the advantages of being a "native" quad-core somewhat, but we have to study this a bit further as it is quite a complex matter.

:kopfpatsch::s07::kopfpatsch::s07:

אתם מבינים את זה?

ל-, ללא הדבקות, לוקח 76ns להעביר שורה מליבה אחת לשניה. לאינטל, שיצאה שנה קודם, לוקח 77ns. זה ההבדל כרגע. מחר זה ישתנה.

מי שלא הבין עד עכשיו: ההבדל בין תכנון 2C ובניית MCP לבין Native 4C הוא בסה"כ החלטה פנימית, של שיקולי , ייצור, time to market, וכו', ויש להם השפעה מעטה על הלקוח.

באופן כללי, לקוח חכם צריך להחליט לפי ביצועים, מחיר, הספק (TDP) וחיי בטרייה, ולא לפי אם מודבק או לא מודבק, או אם זה 90nm או 45nm.

דורון

קישור לתוכן
שתף באתרים אחרים

אתם מבינים את זה?

ל-, ללא הדבקות, לוקח 76ns להעביר שורה מליבה אחת לשניה. לאינטל, שיצאה שנה קודם, לוקח 77ns. זה ההבדל כרגע. מחר זה ישתנה.

מי שלא הבין עד עכשיו: ההבדל בין תכנון 2C ובניית MCP לבין Native 4C הוא בסה"כ החלטה פנימית, של שיקולי פיתוח, ייצור, time to market, וכו', ויש להם השפעה מעטה על הלקוח.

באופן כללי, לקוח חכם צריך להחליט לפי ביצועים, מחיר, הספק (TDP) וחיי בטרייה, ולא לפי אם מודבק או לא מודבק, או אם זה 90nm או 45nm.

דורון

אתה באמת מסתמך על אתר שמבצע בנצ'מרק למעבד חדש על קומפיילר של אינטל?

רק לרענן לך את הידע, המעבד PHENOM יעבוד על הייפר-טרנספורט 3, עם זכרונות בתדר של 1066MHZ והצ'יפסט החדש RD790.

ומעבר לזה, שאלת את עצמך מה קורה במעבדי שצריך לטעון מידע חדש מהזכרון הראשי?

קישור לתוכן
שתף באתרים אחרים

זה לא קשקשנים זה רק אורי, כן בהתחשב שלכל ליבה יש קאש משלה, היה ברור שטרנסאקציות יקחו לא קצת זמן, קאש משותף יכול להגביל את הגישה האינדבידואלית של כל ליבה לזכרון אבל מאפשר לכל ליבה לגשת לכל טווח הזכרון המטמון במעבד.

הייתרון בליבות מרובות על DIE אחד אמור להיות בעקר בקיצוץ לא קטן של כמות המוליכים על הPCB הסופי, מה שמונע זליגת מתחים ומוריד בסופו של דבר את ההספק הדרוש למעבד, מעבר לזאת שאפשר לתכנן אפיקי תקשורות מתקדמים יותר בין הליבות, אבל זה מעולם לא יצוץ או ינוצל בדור הראשון במילא.

מצד שני לייצר DIE כלכך גדול זה בעייתי, ככל שהDIE גדול יותר הסיכוי לפגמים גובר בהרבה, מה שמניב תנובה הרבה יותר נמוכה מכל וואפר.

מלבד זאת שIntel יכולים בסופו של דבר לתקוע יותר ליבות על כל וואפר בגודל זהה, כלל שעובדים עם DIEים קטנים יותר בסופו של דבר יותר מהם ייצאו תקינים, כיוון שפגמים נקודתיים בזמן הגידול או הליטוגרפיה ובזמן החיתוך ישפיעו על פחות DIEים ובכך ישפיעו בסופו של דבר על כמות המעבדים הסופית שיוצאת מכל וואפר.

פגיעה נקודתית בליבה על וואפר של מעבדי קור פוגעת בליבה 1, על הוואפר של מעבדי ברצלונה 4 ליבות כלומר מעבד שלם הולכים לפח.

הדבר הזה מייקר את כל תהליך הייצור של המעבד הסופי, תוסיף בזה שAMD חייבת לתמחר את המעבדים שלה במחיר תחרותי פוגע ברווחים שלה, או בהתחשב במצבה הנוחכי מגדיל עוד יותר את ההפסדים שלה.

אין ספק שריבוי יחידות עיבוד על DIE משולב בסופו של דבר הוא פתרון אלגנטי יותר ושנותן הרבה יותר טווח תמרון בכל הנוגע לתכנון ועיצוב המעבד, שימוש בליבות מודבקות מגביל ואולי אפילו לא במקצת. אבל מצד שני לריבוי ליבות על DIE אחד אין שום ייתרון שאפשר ליישמו כרגע בפועל, אולי חוץ מתצרוכת הספק נמוכה במקצת. ותהליך הייצור הבעייתי שלו פוגע בצורה קשה ביעילות השיווקית של המעבדים.

לAMD יש בעיה אחת הם אוהבים להראות, או לפחות בשנים האחרונות רוצים להראות שהם חכמים מכולם, הם יכולים לתכנן דברים מאוד יפים אבל לא נחוצים לחלוטין ובמקרים לא מעטים שהחסרונות שלהם גוברים על הייתרונות שלהם בין אם זה בפן טכני נטו או בהספק הסופי ללקוח ובפן העסקי, מה שחשוב לא פחות כיוון שבסופו של דבר היא חברה שצריכה להרוויח בשביל לשרוד.

קישור לתוכן
שתף באתרים אחרים

לAMD יש בעיה אחת הם אוהבים להראות, או לפחות בשנים האחרונות רוצים להראות שהם חכמים מכולם, הם יכולים לתכנן דברים מאוד יפים אבל לא נחוצים לחלוטין ובמקרים לא מעטים שהחסרונות שלהם גוברים על הייתרונות שלהם בין אם זה בפן טכני נטו או בהספק הסופי ללקוח ובפן העסקי, מה שחשוב לא פחות כיוון שבסופו של דבר היא חברה שצריכה להרוויח בשביל לשרוד.

בלי החוכמה הזאת C2D היה מעבד של MCM מודבק כמו פנטיום D האיום.

דובי, ליישומי VM בעתיד הלא רחוק במיוחד בשילוב של VM על מערכות , מעבדי K10 מרבעי ליבות טיבעיים הם העתיד.

קישור לתוכן
שתף באתרים אחרים

גם לאינטל יש סטי פקודות לVM אף אחד לא אמר שהפתרון של טוב יותר. אני עובד המון על VSI של VMware כמו הרבה מאוד ארגונים, התשתית כמובן היא תשתית יוניקסית השרתים עצמם הם 2003 server, המערכת שלנו יושבת על בליידים של IBM, שרצים על קסאונים, יחסי ציבור או לא זאת המערכת הממולצת ע"י VMware, גם המעבדים של אינטל מאפשרים DMA למערכות הפעלה ווירטואליות, וגם להם יש סטי פקודות יעודיים, ביינתיים המוצרים של VMware יודעים לנצל את זה, מי יודע כמה זמן יעבור עד הrefresh הבא שלהם שיאפשר תמיכה בפיטשרים של K10 ומי יודע אם הם בכלל יהיו יעילים, ושלא נדבר על יותר יעילים מהמתחרה.

AMD מוציאה בצורה דרסטית הרבה פחות מעבדים תקינים מכל וואפר מאשר Intel היא יירתה לעצמה ברגל לפחות ל2 דורות הקרובים, בהתחשב שIntel עולה על בפיתוח ליטוגרפיות, וAMD לא מזמן הצהירה שהיא בכלל רוצה לזנוח את הייצור העצמאי של המעבדים(מה שכופה אותה עוד יותר לליטוגרפיה הנפוצה אצל הייצרנים הג'נריים) לא מאפשר לה לנצל את הייתרונות של ליבות משותפות.

מבחן סטיסטי פשוט(בלי להכנס לfaul tolerance של כל ליבה כיוון שהם מתוכננות לספוג מספר מסויים של פגמים גם ככה).

נצא מהנחה שIntel וAMD מוציאות 80 ליבות מכל wafer כולמר 20 מעבדים מרובעי ליבה.

גודל הליבות זהה(ופחות או יותר זה נכון).

נקח שב2 הוואפרים לדוגמא נוצר פגם בזמן הגידול של הגביש שפוגם ב2 ליבות(לא מדובר כאן על DIE כיוון שזה לא מעניין אותי, הDIE בסופו של דבר הוא החתיכה שאתה חותך מהגביש).

בזמן הליטוגרפיה הלכו לך עוד 2 ליבות, ו4 ליבות נפגמו חלקית וכתוצאה חייבות לפעול בתדרים נמוכים יותר.

במקרה של Intel הולך לה מעבד 1 טוטאל לוס, מה4 ליבות הפגומות לגמרי. והיא צריכה לייצר מעבד 1 בדירוג נמוך יותר.

כלומר Intel מוציאה בסופו של דבר 19 מעבדים, כאשר 18 מהם הם בדירוג X ו1 בדירוג X-1.

אצל הולכים 4 מעבדים כיוון שהם יושבים על אותו DIE ובשונה מאינטל היא לא יכולה לחתוך ולזרוק את הליבה הפגומה ולהדביק במקומה תקינה.

כולמר היא מוציאה כבר רק 16 מעבדים תקינים מכל wafer כאשר רק 12 מהם הם בדירוג X ו4 בדירוג X-1.

בהתחשב שבתהליך ייצור יש לך קרוב ל30% פגמים כאלה ואחרים, Intel יכולה לספוג אותם ללא אבדות רציניות כיוון שיש לה מרחב תמרון גדול מאוד.

בעוד שAMD סופגת אבדות נואשות, עם כל הכבוד לזה שK10 הוא העתיד, צריכה לדאוג קודם כל לעתיד של עצמה.

קישור לתוכן
שתף באתרים אחרים

בזמן הליטוגרפיה הלכו לך עוד 2 ליבות, ו4 ליבות נפגמו חלקית וכתוצאה חייבות לפעול בתדרים נמוכים יותר.

במקרה של Intel הולך לה מעבד 1 טוטאל לוס, מה4 ליבות הפגומות לגמרי. והיא צריכה לייצר מעבד 1 בדירוג נמוך יותר.

כלומר Intel מוציאה בסופו של דבר 19 מעבדים, כאשר 18 מהם הם בדירוג X ו1 בדירוג X-1.

אצל הולכים 4 מעבדים כיוון שהם יושבים על אותו DIE ובשונה מאינטל היא לא יכולה לחתוך ולזרוק את הליבה הפגומה ולהדביק במקומה תקינה.

כולמר היא מוציאה כבר רק 16 מעבדים תקינים מכל wafer כאשר רק 12 מהם הם בדירוג X ו4 בדירוג X-1.

בהתחשב שבתהליך ייצור יש לך קרוב ל30% פגמים כאלה ואחרים, Intel יכולה לספוג אותם ללא אבדות רציניות כיוון שיש לה מרחב תמרון גדול מאוד.

בעוד שAMD סופגת אבדות נואשות, עם כל הכבוד לזה שK10 הוא העתיד, צריכה לדאוג קודם כל לעתיד של עצמה.

אני מבין את התאוריה שלך, רק אל תשכח שאינטל הולכת לאבד את יתרון ה-yield שיש לה היום בגלל המעבר לארכיטקטורת "נהלם", אז התאוריה שלך תיפול גם על , בגלל התכנון לעבור למרובע ליבות טבעי כמו K10 היום.

קישור לתוכן
שתף באתרים אחרים

אני מבין את התאוריה שלך, רק אל תשכח שאינטל הולכת לאבד את יתרון ה-yield שיש לה היום בגלל המעבר לארכיטקטורת "נהלם", אז התאוריה שלך תיפול גם על , בגלל התכנון לעבור למרובע ליבות טבעי כמו K10 היום.

כן אבל להבדיל מAMD יכולה לספוג את ההפסדים הללו בצורה יותר טובה...AMD לא ממש זורחת כרגע במקומה הייתי מנסה להחזיר ולכסות את ההפסדים העצומים לפני שהייתי מנסה (ללא הצלחה יתרה בינתיים) להראות לעולם שאני יותר חכם מכולם

קישור לתוכן
שתף באתרים אחרים

כן אבל להבדיל מAMD אינטל יכולה לספוג את ההפסדים הללו בצורה יותר טובה...AMD לא ממש זורחת כרגע במקומה הייתי מנסה להחזיר ולכסות את ההפסדים העצומים לפני שהייתי מנסה (ללא הצלחה יתרה בינתיים) להראות לעולם שאני יותר חכם מכולם

אתה לא יכול להגיד את זה בביטחון במיוחד בעולם העסקים של היום, וכמו שאמרתי בעבר חברות חומרה לא פחות גדולות מאינטל נמחקו מהמפה.

היום בהרבה יותר חזקה למרות המצב הפיננסי שלה, וזה בגלל השילוב של ATI בתוכה יוצרת פלטפורמת מיחשוב חזקה יותר מאינטל.

ברצלונה ינגוס חזק באינטל בתחום השרתים, אפילו אם אינטל תוציא מהיר ב-45 ננו! עדיין ברצלונה יהיה יותר אטרקטיבי למרכזי נתונים כי שם מה שחשוב זה צריכת חשמל, תקשורת טובה יותר בין המעבדים וכמובן יכולת השידרוג הקלה מאופטרון כפול לברצלונה.

קישור לתוכן
שתף באתרים אחרים

אני מבין את התאוריה שלך, רק אל תשכח שאינטל הולכת לאבד את יתרון ה-yield שיש לה היום בגלל המעבר לארכיטקטורת "נהלם", אז התאוריה שלך תיפול גם על אינטל, בגלל התכנון לעבור למרובע ליבות טבעי כמו K10 היום.

הם עוברים לזה רק 45NM אם לא ב35(30?) מה שמקטין את הליבה פי 2.2~ ופי 4.5.

ואתה חיי בסרט שIntel הולכת להתפוגג, אחרי שנים על גבי שנים של הפסדים וחובות עצומים עדיין כאן, היא חברה עם רווחים עצומים כל רבעון.

קישור לתוכן
שתף באתרים אחרים

גם לאינטל יש סטי פקודות לVM אף אחד לא אמר שהפתרון של טוב יותר. אני עובד המון על VSI של VMware כמו הרבה מאוד ארגונים, התשתית כמובן היא תשתית יוניקסית השרתים עצמם הם 2003 server, המערכת שלנו יושבת על בליידים של , שרצים על קסאונים, יחסי ציבור או לא זאת המערכת הממולצת ע"י VMware, גם המעבדים של מאפשרים DMA למערכות הפעלה ווירטואליות, וגם להם יש סטי פקודות יעודיים, ביינתיים המוצרים של VMware יודעים לנצל את זה, מי יודע כמה זמן יעבור עד הrefresh הבא שלהם שיאפשר תמיכה בפיטשרים של K10 ומי יודע אם הם בכלל יהיו יעילים, ושלא נדבר על יותר יעילים מהמתחרה.

מאפשרים DMA אבל לא מאפשרים ccNUMA במיוחד בוירטואליזציה שיש לזה חשיבות משמעותית, האייטניום תומך אבל לא וודקרסט מבוסס C2D, כמובן שאופטרון תומך.

קישור לתוכן
שתף באתרים אחרים

ccNUMA לא קשור לווירטואליזציה בגרוש.

גם מבלי להיכנס לעובי הקורה, ccNUMA נדרש למעבדי שרתים! במיוחד שיש Cache coherency במערכות ריבוי .

זה רק מוכיח שמעבדי אופטרון נולדו להיות מעבדי שרתים (לזכרו היקר של מעבד ה-EV7).

קישור לתוכן
שתף באתרים אחרים

לא הוא לא, הוא נדרש למעבדים שיש להם קאש לא משותף. בגלל זה בא הchace coherent לפני הnon uniform memory access..

בקרי הקאש מסתנכרנים בין עצמם(מה שתופס לך תעבורה(וגם לא מעטה) באפיק התקשורת בין הליבות\מעבדים) כדי לייצור תמונה אחידה של כל אזורי הזכרון שממופים בקאש.

בלי זה ייקח למעבד 20 שנה לגשת לזכרון, מצחיק שאתה אפילו לא מתייחס לזה שccNUMA גורם לאיטיות מחרידה כאשר מספר ליבות\מעבדים מנסים לגשת לאותו אזור בזכרון בצורה רציפה, והפתרון לזה הוא פתרון תוכנה שנעשה במערכת ההפעלה ע"י איזון הגישות לזכרון דרך מנהל המטלות.

מה עוד שאתה לא מתייחס בכלל לעובדה שמערכות מבוססות NT כמעט ולא תומכות בNUMA, התמיכה היחידה באה מערכות UNIX וגם אלה הן מערכות שבאות עם השרתים עצמם, כלומר שלמשתמש הסופי כל עוד הוא לא קונה שרת מHP לדוגמא שמייצרת גרסאת UNIX עם תמיכה יחסית מופלאה בNUMA(בשביל סדרת האינטגריטי מבוססת האיינטניום שלהם) הוא עדיין לא יכול לנצל את זה כיוון שרוב מערכות הUNIX\FREEBSD החופשיות בשוק גם אינן תומכות בNUMA בצורה נרחבת למדי.

אז כן אולי כדאי שתכנס לעובי הקורה מידי פעם...

קישור לתוכן
שתף באתרים אחרים

דובי אל תמציא את הגלגל, רוב מערכות השרתים בעולם כבר ממזמן על לינוקס ושם התמיכה ב-NUMA קיימת.

וכל עוד אופטרון כמעבד שרת X86 מאפשר תמיכה ב-NUMA זה מבורך.

*לגבי התמיכה ב-VM של ברצלונה אז יש לי חדשה בשבילך, VM תתמוך בברצלונה עם הארכיטקטורה החדשה nested paging tables , כנראה שמדובר במעבד מליגה אחרת, XEON מעבד שולחני בתחפושת של שרת.

http://www.theinquirer.net/?article=42308

קישור לתוכן
שתף באתרים אחרים

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

×
  • צור חדש...