המעבד הגרפי שיודע לעשות הכל: דור ה-Ampere של NVIDIA החל בצורה רשמית • HWzone
מחשביםכרטיסי מסך

המעבד הגרפי שיודע לעשות הכל: דור ה-Ampere של NVIDIA החל בצורה רשמית

האירוע המקוון של מפתחת השבבים עמד בציפיות ואף התעלה עליהן – הכירו את ליבת ה-A100, את מאיץ ה- A100 ואת מערכת ה-DXG-A100 המפלצתית שמתקבלת כאשר משלבים שמונה מהם יחד

ג'ן-סן הואנג הבטיח לנו את כרטיס המסך הגדול בעולם – וקיים זאת. ליבת ה-GA100 החדשה של , הראשונה בארכיטקטורת ה-Ampere והראשונה בהתבסס על תהליך ייצור של 7 ננומטר (מבית כמובן), גדולה אמנם רק במעט מליבת ה-GV100 הענקית שהחזיקה בשיא עד כה – אבל עם פי 2.57 טרנזיסטורים יותר מדובר בהתפתחות גדולה מאוד שמיועדת לבצע האצה של כל הטכניקות הרלוונטיות והמוכרות בעולם העיבוד כיום, ללא יוצא מן הכלל.

ליבות ה-GA100 הן בגודל עצום של 826 מילימטרים רבועים, ובמאיצי ה-A100 נקבל אותן עם תוספת 5 ערימות של מודרניים (מתוך 6 אפשריות בליבה) בנפח של 40GB ברוחב פס אפקטיבי של 1.6 טרה-בייט בשנייה תודות לממשק 5,120 ביט – ועם 6,912 יחידות עיבוד פעילות מסוג CUDA בתדר פעולה מירבי של 1,410MHz, עם תוספת של 432 יחידות טנזורים מדור חדש וזכרון מטמון כולל מרמה L2 של 40MB. כל אלו יחד פועלים תחת מעטפת הספק ענקית של 400 וואט – לביצועי חישוב נקודה צפה בדיוק רגיל (FP32) של 19.5TFLOPS (או 19.5 טריליון חישובים מדי שנייה) שהם שיפור של יותר מ-24 אחוזים ביחס לשיא הקודם בליבות ה-GV100.

המסע של בעולמה של ליטוגרפיית ה-7 ננומטר מתחיל עכשיו

על הנייר, שיפור הביצועים הזה נמוך יותר מהזינוק שראינו במעבר בין דור ה-Pascal לדור ה-Volta – אך היתרון של ליבת ה-A100 הוא בכך שהיא תומכת במספר גדול הרבה יותר של מצבי עיבוד, כולם בעוצמה חסרת תקדים לתחום: גם חישובי נקודה צפה בדיוק כפול (FP64) של 9.7TFLOPS, גם חישובי טנזורים עם מספרים שלמים בדיוק 8 ביט (INT8, מאפיין שכלל לא נתמך בליבות ה-Volta) של 624TOPS, גם חישובי טנזורים עם נקודה צפה בדיוק 16 ביט (FP16) של 312TOPS וגם חישובי טנזורים עם נקודה צפה של 32 ביט (TF32 – פיתוח חדש מ- בדור הנוכחי) של 156TOPS. מפתחת השבבים טוענת כי הצליחה ליצור לראשונה מוצר עיבוד יחיד אשר מסוגל להפוך את כל שאר המוצרים לבלתי רלוונטיים ובלתי נדרשים, ובכך לייעל משמעותית מערכות מחשבים עתירות הספק בעולם גם בהיבט הארכיטקטורה וגם בהיבט צריכת ההספק שלהן.

ב- כבר מתפארים בזכיות במספר מכרזים להקמת מחשבי-על עוצמתיים בהתבסס על מאיצי ה-Ampere

המוצר המסחרי הראשון של בעידן ה-Ampere יהיה מערך ה-DGX-A100, ובו שמונה כרטיסי A100 בתצורת SXM יחדיו, מחוברים בממשקי NVLink 3 משופרים ביניהם עם רוחב פס אפקטיבי של 600 ג'יגה-בייט בשנייה – המחיר המומלץ הוא 199,000 דולר, עם זוג מעבדי EPYC מבית , מערכת לינוקס, זכרון דינאמי כללי של טרה-בייט אחד, אחסון NVMe בנפח 17 טרה-בייט וצריכת הספק של עד 6,500 וואט, כאשר כל מערך שכזה מבטיח לספק של עד 5TFLOPS להאצת (FP16) ועד 10TOPS ללמידת מכונה.

ליבת ה-GA100 המלאה כוללת למעשה 128 אשכולות עיבוד עם 8,192 יחידות CUDA בסך הכל, כאשר מתוכם 108 אשכולות עיבוד הם פעילים ביחידת ה-A100 – ולא בטוח אם נזכה לראות מתישהו מוצר משוכלל עוד יותר בו כלל היחידות החומרתיות הללו נגישות ופעילות

האם לאינטל או ל-AMD תהיה תשובה ישירה למתקפה הטכנולוגית הזו, או ש- עומדת בפתח תקופה חדשה של פריחה עסקית גדולה? בקרוב נגלה – אם כי כבר עכשיו ניתן להודות שארכיטקטורת ה- היא כל מה שציפינו וקיווינו לו ואולי אפילו קצת יותר מזה.

199,000 דולר הם מחיר מציאה עבור ביצועי שיא בתצורת 6U סטנדרטית לארונות שרתים?

תגיות
Back to top button
Close
Close