כל הקשקשנים בקומקום יכולים להירגע עם "הליבות המודבקות" של AMD

פתח דיון חדש

פורסם 2007 בספטמבר 1218 שנים

כצפוי, יש משמעות מעטה בלבד, אם בכלל, להבדל אם המעבדים יושבים על אותו die או על שניים שונים.

Anandtech:

AMD's native quad-core needs about 76ns to exchange (L1) cache information. That's not bad, but it's not fantastic either as the shared L2 cache approach of the Xeons allows the dual cores to exchange information via the L2 in about 26-30ns. Once you need to get information from core 0 to core 3, the dual die CPU of Intel still doesn't need much more time (77ns) than the quad-core Opteron (76ns). The complex L1-L2-L3 hierarchy might negate the advantages of being a "native" quad-core somewhat, but we have to study this a bit further as it is quite a complex matter.

:kopfpatsch: :s07: :s07:

אתם מבינים את זה?

ל-AMD, ללא הדבקות, לוקח 76ns להעביר שורה מליבה אחת לשניה. לאינטל, שיצאה שנה קודם, לוקח 77ns. זה ההבדל כרגע. מחר זה ישתנה.

מי שלא הבין עד עכשיו: ההבדל בין תכנון 2C ובניית MCP לבין Native 4C הוא בסה"כ החלטה פנימית, של שיקולי פיתוח, ייצור, time to market, וכו', ויש להם השפעה מעטה על הלקוח.

באופן כללי, לקוח חכם צריך להחליט לפי ביצועים, מחיר, הספק (TDP) וחיי בטרייה, ולא לפי אם מודבק או לא מודבק, או אם זה 90nm או 45nm.

דורון

ציטוט

פורסם 2007 בספטמבר 1218 שנים

אתם מבינים את זה?
ל-AMD, ללא הדבקות, לוקח 76ns להעביר שורה מליבה אחת לשניה. לאינטל, שיצאה שנה קודם, לוקח 77ns. זה ההבדל כרגע. מחר זה ישתנה.
מי שלא הבין עד עכשיו: ההבדל בין תכנון 2C ובניית MCP לבין Native 4C הוא בסה"כ החלטה פנימית, של שיקולי פיתוח, ייצור, time to market, וכו', ויש להם השפעה מעטה על הלקוח.
באופן כללי, לקוח חכם צריך להחליט לפי ביצועים, מחיר, הספק (TDP) וחיי בטרייה, ולא לפי אם מודבק או לא מודבק, או אם זה 90nm או 45nm.
דורון

אתה באמת מסתמך על אתר שמבצע בנצ'מרק למעבד חדש על קומפיילר של אינטל?

רק לרענן לך את הידע, המעבד PHENOM יעבוד על הייפר-טרנספורט 3, עם זכרונות בתדר של 1066MHZ והצ'יפסט החדש RD790.

ומעבר לזה, שאלת את עצמך מה קורה במעבדי אינטל שצריך לטעון מידע חדש מהזכרון הראשי?

ציטוט

פורסם 2007 בספטמבר 1218 שנים

זה לא קשקשנים זה רק אורי, כן בהתחשב שלכל ליבה יש קאש משלה, היה ברור שטרנסאקציות יקחו לא קצת זמן, קאש משותף יכול להגביל את הגישה האינדבידואלית של כל ליבה לזכרון אבל מאפשר לכל ליבה לגשת לכל טווח הזכרון המטמון במעבד.

הייתרון בליבות מרובות על DIE אחד אמור להיות בעקר בקיצוץ לא קטן של כמות המוליכים על הPCB הסופי, מה שמונע זליגת מתחים ומוריד בסופו של דבר את ההספק הדרוש למעבד, מעבר לזאת שאפשר לתכנן אפיקי תקשורות מתקדמים יותר בין הליבות, אבל זה מעולם לא יצוץ או ינוצל בדור הראשון במילא.

מצד שני לייצר DIE כלכך גדול זה בעייתי, ככל שהDIE גדול יותר הסיכוי לפגמים גובר בהרבה, מה שמניב תנובה הרבה יותר נמוכה מכל וואפר.

מלבד זאת שIntel יכולים בסופו של דבר לתקוע יותר ליבות על כל וואפר בגודל זהה, כלל שעובדים עם DIEים קטנים יותר בסופו של דבר יותר מהם ייצאו תקינים, כיוון שפגמים נקודתיים בזמן הגידול או הליטוגרפיה ובזמן החיתוך ישפיעו על פחות DIEים ובכך ישפיעו בסופו של דבר על כמות המעבדים הסופית שיוצאת מכל וואפר.

פגיעה נקודתית בליבה על וואפר של מעבדי קור פוגעת בליבה 1, על הוואפר של מעבדי ברצלונה 4 ליבות כלומר מעבד שלם הולכים לפח.

הדבר הזה מייקר את כל תהליך הייצור של המעבד הסופי, תוסיף בזה שAMD חייבת לתמחר את המעבדים שלה במחיר תחרותי פוגע ברווחים שלה, או בהתחשב במצבה הנוחכי מגדיל עוד יותר את ההפסדים שלה.

אין ספק שריבוי יחידות עיבוד על DIE משולב בסופו של דבר הוא פתרון אלגנטי יותר ושנותן הרבה יותר טווח תמרון בכל הנוגע לתכנון ועיצוב המעבד, שימוש בליבות מודבקות מגביל ואולי אפילו לא במקצת. אבל מצד שני לריבוי ליבות על DIE אחד אין שום ייתרון שאפשר ליישמו כרגע בפועל, אולי חוץ מתצרוכת הספק נמוכה במקצת. ותהליך הייצור הבעייתי שלו פוגע בצורה קשה ביעילות השיווקית של המעבדים.

לAMD יש בעיה אחת הם אוהבים להראות, או לפחות בשנים האחרונות רוצים להראות שהם חכמים מכולם, הם יכולים לתכנן דברים מאוד יפים אבל לא נחוצים לחלוטין ובמקרים לא מעטים שהחסרונות שלהם גוברים על הייתרונות שלהם בין אם זה בפן טכני נטו או בהספק הסופי ללקוח ובפן העסקי, מה שחשוב לא פחות כיוון שבסופו של דבר AMD היא חברה שצריכה להרוויח בשביל לשרוד.

ציטוט

פורסם 2007 בספטמבר 1218 שנים

לAMD יש בעיה אחת הם אוהבים להראות, או לפחות בשנים האחרונות רוצים להראות שהם חכמים מכולם, הם יכולים לתכנן דברים מאוד יפים אבל לא נחוצים לחלוטין ובמקרים לא מעטים שהחסרונות שלהם גוברים על הייתרונות שלהם בין אם זה בפן טכני נטו או בהספק הסופי ללקוח ובפן העסקי, מה שחשוב לא פחות כיוון שבסופו של דבר AMD היא חברה שצריכה להרוויח בשביל לשרוד.

בלי החוכמה הזאת C2D היה מעבד של MCM מודבק כמו פנטיום D האיום.

דובי, ליישומי VM בעתיד הלא רחוק במיוחד בשילוב של VM על מערכות לינוקס, מעבדי K10 מרבעי ליבות טיבעיים הם העתיד.

ציטוט

פורסם 2007 בספטמבר 1218 שנים

גם לאינטל יש סטי פקודות לVM אף אחד לא אמר שהפתרון של AMD טוב יותר. אני עובד המון על VSI של VMware כמו הרבה מאוד ארגונים, התשתית כמובן היא תשתית יוניקסית השרתים עצמם הם 2003 server, המערכת שלנו יושבת על בליידים של IBM, שרצים על קסאונים, יחסי ציבור או לא זאת המערכת הממולצת ע"י VMware, גם המעבדים של אינטל מאפשרים DMA למערכות הפעלה ווירטואליות, וגם להם יש סטי פקודות יעודיים, ביינתיים המוצרים של VMware יודעים לנצל את זה, מי יודע כמה זמן יעבור עד הrefresh הבא שלהם שיאפשר תמיכה בפיטשרים של K10 ומי יודע אם הם בכלל יהיו יעילים, ושלא נדבר על יותר יעילים מהמתחרה.

AMD מוציאה בצורה דרסטית הרבה פחות מעבדים תקינים מכל וואפר מאשר Intel היא יירתה לעצמה ברגל לפחות ל2 דורות הקרובים, בהתחשב שIntel עולה על AMD בפיתוח ליטוגרפיות, וAMD לא מזמן הצהירה שהיא בכלל רוצה לזנוח את הייצור העצמאי של המעבדים(מה שכופה אותה עוד יותר לליטוגרפיה הנפוצה אצל הייצרנים הג'נריים) לא מאפשר לה לנצל את הייתרונות של ליבות משותפות.

מבחן סטיסטי פשוט(בלי להכנס לfaul tolerance של כל ליבה כיוון שהם מתוכננות לספוג מספר מסויים של פגמים גם ככה).

נצא מהנחה שIntel וAMD מוציאות 80 ליבות מכל wafer כולמר 20 מעבדים מרובעי ליבה.

גודל הליבות זהה(ופחות או יותר זה נכון).

נקח שב2 הוואפרים לדוגמא נוצר פגם בזמן הגידול של הגביש שפוגם ב2 ליבות(לא מדובר כאן על DIE כיוון שזה לא מעניין אותי, הDIE בסופו של דבר הוא החתיכה שאתה חותך מהגביש).

בזמן הליטוגרפיה הלכו לך עוד 2 ליבות, ו4 ליבות נפגמו חלקית וכתוצאה חייבות לפעול בתדרים נמוכים יותר.

במקרה של Intel הולך לה מעבד 1 טוטאל לוס, מה4 ליבות הפגומות לגמרי. והיא צריכה לייצר מעבד 1 בדירוג נמוך יותר.

כלומר Intel מוציאה בסופו של דבר 19 מעבדים, כאשר 18 מהם הם בדירוג X ו1 בדירוג X-1.

אצל AMD הולכים 4 מעבדים כיוון שהם יושבים על אותו DIE ובשונה מאינטל היא לא יכולה לחתוך ולזרוק את הליבה הפגומה ולהדביק במקומה תקינה.

כולמר היא מוציאה כבר רק 16 מעבדים תקינים מכל wafer כאשר רק 12 מהם הם בדירוג X ו4 בדירוג X-1.

בהתחשב שבתהליך ייצור יש לך קרוב ל30% פגמים כאלה ואחרים, Intel יכולה לספוג אותם ללא אבדות רציניות כיוון שיש לה מרחב תמרון גדול מאוד.

בעוד שAMD סופגת אבדות נואשות, עם כל הכבוד לזה שK10 הוא העתיד, AMD צריכה לדאוג קודם כל לעתיד של עצמה.

ציטוט

פורסם 2007 בספטמבר 1218 שנים

בזמן הליטוגרפיה הלכו לך עוד 2 ליבות, ו4 ליבות נפגמו חלקית וכתוצאה חייבות לפעול בתדרים נמוכים יותר.
במקרה של Intel הולך לה מעבד 1 טוטאל לוס, מה4 ליבות הפגומות לגמרי. והיא צריכה לייצר מעבד 1 בדירוג נמוך יותר.
כלומר Intel מוציאה בסופו של דבר 19 מעבדים, כאשר 18 מהם הם בדירוג X ו1 בדירוג X-1.
אצל AMD הולכים 4 מעבדים כיוון שהם יושבים על אותו DIE ובשונה מאינטל היא לא יכולה לחתוך ולזרוק את הליבה הפגומה ולהדביק במקומה תקינה.
כולמר היא מוציאה כבר רק 16 מעבדים תקינים מכל wafer כאשר רק 12 מהם הם בדירוג X ו4 בדירוג X-1.
בהתחשב שבתהליך ייצור יש לך קרוב ל30% פגמים כאלה ואחרים, Intel יכולה לספוג אותם ללא אבדות רציניות כיוון שיש לה מרחב תמרון גדול מאוד.
בעוד שAMD סופגת אבדות נואשות, עם כל הכבוד לזה שK10 הוא העתיד, AMD צריכה לדאוג קודם כל לעתיד של עצמה.

אני מבין את התאוריה שלך, רק אל תשכח שאינטל הולכת לאבד את יתרון ה-yield שיש לה היום בגלל המעבר לארכיטקטורת "נהלם", אז התאוריה שלך תיפול גם על אינטל, בגלל התכנון לעבור למרובע ליבות טבעי כמו K10 היום.

ציטוט

פורסם 2007 בספטמבר 1218 שנים

אני מבין את התאוריה שלך, רק אל תשכח שאינטל הולכת לאבד את יתרון ה-yield שיש לה היום בגלל המעבר לארכיטקטורת "נהלם", אז התאוריה שלך תיפול גם על אינטל, בגלל התכנון לעבור למרובע ליבות טבעי כמו K10 היום.

כן אבל להבדיל מAMD אינטל יכולה לספוג את ההפסדים הללו בצורה יותר טובה...AMD לא ממש זורחת כרגע במקומה הייתי מנסה להחזיר ולכסות את ההפסדים העצומים לפני שהייתי מנסה (ללא הצלחה יתרה בינתיים) להראות לעולם שאני יותר חכם מכולם

ציטוט

פורסם 2007 בספטמבר 1218 שנים

כן אבל להבדיל מAMD אינטל יכולה לספוג את ההפסדים הללו בצורה יותר טובה...AMD לא ממש זורחת כרגע במקומה הייתי מנסה להחזיר ולכסות את ההפסדים העצומים לפני שהייתי מנסה (ללא הצלחה יתרה בינתיים) להראות לעולם שאני יותר חכם מכולם

אתה לא יכול להגיד את זה בביטחון במיוחד בעולם העסקים של היום, וכמו שאמרתי בעבר חברות חומרה לא פחות גדולות מאינטל נמחקו מהמפה.

היום AMD בהרבה יותר חזקה למרות המצב הפיננסי שלה, וזה בגלל השילוב של ATI בתוכה יוצרת פלטפורמת מיחשוב חזקה יותר מאינטל.

ברצלונה ינגוס חזק באינטל בתחום השרתים, אפילו אם אינטל תוציא XEON מהיר ב-45 ננו! עדיין ברצלונה יהיה יותר אטרקטיבי למרכזי נתונים כי שם מה שחשוב זה צריכת חשמל, תקשורת טובה יותר בין המעבדים וכמובן יכולת השידרוג הקלה מאופטרון כפול ליבה לברצלונה.

ציטוט

פורסם 2007 בספטמבר 1218 שנים

אני מבין את התאוריה שלך, רק אל תשכח שאינטל הולכת לאבד את יתרון ה-yield שיש לה היום בגלל המעבר לארכיטקטורת "נהלם", אז התאוריה שלך תיפול גם על אינטל, בגלל התכנון לעבור למרובע ליבות טבעי כמו K10 היום.

הם עוברים לזה רק 45NM אם לא ב35(30?) מה שמקטין את הליבה פי 2.2~ ופי 4.5.

ואתה חיי בסרט שIntel הולכת להתפוגג, AMD אחרי שנים על גבי שנים של הפסדים וחובות עצומים עדיין כאן, אינטל היא חברה עם רווחים עצומים כל רבעון.

ציטוט

פורסם 2007 בספטמבר 1218 שנים

היום AMD בהרבה יותר חזקה למרות המצב הפיננסי שלה, וזה בגלל השילוב של ATI בתוכה יוצרת פלטפורמת מיחשוב חזקה יותר מאינטל.

תקרא את זה, אולי תחשוב אחרת

http://www.tgdaily.com/content/view/33776/128/

ציטוט

פורסם 2007 בספטמבר 1218 שנים

גם לאינטל יש סטי פקודות לVM אף אחד לא אמר שהפתרון של AMD טוב יותר. אני עובד המון על VSI של VMware כמו הרבה מאוד ארגונים, התשתית כמובן היא תשתית יוניקסית השרתים עצמם הם 2003 server, המערכת שלנו יושבת על בליידים של IBM, שרצים על קסאונים, יחסי ציבור או לא זאת המערכת הממולצת ע"י VMware, גם המעבדים של אינטל מאפשרים DMA למערכות הפעלה ווירטואליות, וגם להם יש סטי פקודות יעודיים, ביינתיים המוצרים של VMware יודעים לנצל את זה, מי יודע כמה זמן יעבור עד הrefresh הבא שלהם שיאפשר תמיכה בפיטשרים של K10 ומי יודע אם הם בכלל יהיו יעילים, ושלא נדבר על יותר יעילים מהמתחרה.

מאפשרים DMA אבל לא מאפשרים ccNUMA במיוחד בוירטואליזציה שיש לזה חשיבות משמעותית, האייטניום תומך אבל לא וודקרסט מבוסס C2D, כמובן שאופטרון תומך.

ציטוט

פורסם 2007 בספטמבר 1218 שנים

ccNUMA לא קשור לווירטואליזציה בגרוש.

ציטוט

פורסם 2007 בספטמבר 1218 שנים

ccNUMA לא קשור לווירטואליזציה בגרוש.

גם מבלי להיכנס לעובי הקורה, ccNUMA נדרש למעבדי שרתים! במיוחד שיש Cache coherency במערכות ריבוי מעבדים.

זה רק מוכיח שמעבדי אופטרון נולדו להיות מעבדי שרתים (לזכרו היקר של מעבד ה-EV7).

ציטוט

פורסם 2007 בספטמבר 1218 שנים

לא הוא לא, הוא נדרש למעבדים שיש להם קאש לא משותף. בגלל זה בא הchace coherent לפני הnon uniform memory access..

בקרי הקאש מסתנכרנים בין עצמם(מה שתופס לך תעבורה(וגם לא מעטה) באפיק התקשורת בין הליבות\מעבדים) כדי לייצור תמונה אחידה של כל אזורי הזכרון שממופים בקאש.

בלי זה ייקח למעבד 20 שנה לגשת לזכרון, מצחיק שאתה אפילו לא מתייחס לזה שccNUMA גורם לאיטיות מחרידה כאשר מספר ליבות\מעבדים מנסים לגשת לאותו אזור בזכרון בצורה רציפה, והפתרון לזה הוא פתרון תוכנה שנעשה במערכת ההפעלה ע"י איזון הגישות לזכרון דרך מנהל המטלות.

מה עוד שאתה לא מתייחס בכלל לעובדה שמערכות מבוססות NT כמעט ולא תומכות בNUMA, התמיכה היחידה באה מערכות UNIX וגם אלה הן מערכות שבאות עם השרתים עצמם, כלומר שלמשתמש הסופי כל עוד הוא לא קונה שרת מHP לדוגמא שמייצרת גרסאת UNIX עם תמיכה יחסית מופלאה בNUMA(בשביל סדרת האינטגריטי מבוססת האיינטניום שלהם) הוא עדיין לא יכול לנצל את זה כיוון שרוב מערכות הUNIX\FREEBSD החופשיות בשוק גם אינן תומכות בNUMA בצורה נרחבת למדי.

אז כן אולי כדאי שתכנס לעובי הקורה מידי פעם...

ציטוט

פורסם 2007 בספטמבר 1218 שנים

דובי אל תמציא את הגלגל, רוב מערכות השרתים בעולם כבר ממזמן על לינוקס ושם התמיכה ב-NUMA קיימת.

וכל עוד אופטרון כמעבד שרת X86 מאפשר תמיכה ב-NUMA זה מבורך.

*לגבי התמיכה ב-VM של ברצלונה אז יש לי חדשה בשבילך, VM תתמוך בברצלונה עם הארכיטקטורה החדשה nested paging tables , כנראה שמדובר במעבד מליגה אחרת, XEON מעבד שולחני בתחפושת של שרת.

http://www.theinquirer.net/?article=42308

ציטוט