המעבד הגרפי שיודע לעשות הכל: דור ה-Ampere של NVIDIA החל בצורה רשמית

עדכון אחרון: 14/05/2020 בשעה 22:43

14/05/2020

5 דקות קריאה

האירוע המקוון של מפתחת השבבים עמד בציפיות ואף התעלה עליהן – הכירו את ליבת ה-A100, את מאיץ ה-NVIDIA A100 ואת מערכת ה-DXG-A100 המפלצתית שמתקבלת כאשר משלבים שמונה מהם יחד

ג'ן-סן הואנג הבטיח לנו את כרטיס המסך הגדול בעולם – וקיים זאת. ליבת ה-GA100 החדשה של NVIDIA, הראשונה בארכיטקטורת ה-Ampere והראשונה בהתבסס על תהליך ייצור של 7 ננומטר (מבית TSMC כמובן), גדולה אמנם רק במעט מליבת ה-GV100 הענקית שהחזיקה בשיא עד כה – אבל עם פי 2.57 טרנזיסטורים יותר מדובר בהתפתחות גדולה מאוד שמיועדת לבצע האצה של כל הטכניקות הרלוונטיות והמוכרות בעולם העיבוד כיום, ללא יוצא מן הכלל.

ליבות ה-GA100 הן בגודל עצום של 826 מילימטרים רבועים, ובמאיצי ה-A100 נקבל אותן עם תוספת 5 ערימות של זכרונות HBM2 מודרניים (מתוך 6 אפשריות בליבה) בנפח של 40GB ברוחב פס אפקטיבי של 1.6 טרה-בייט בשנייה תודות לממשק 5,120 ביט – ועם 6,912 יחידות עיבוד פעילות מסוג CUDA בתדר פעולה מירבי של 1,410MHz, עם תוספת של 432 יחידות טנזורים מדור חדש וזכרון מטמון כולל מרמה L2 של 40MB. כל אלו יחד פועלים תחת מעטפת הספק ענקית של 400 וואט – לביצועי חישוב נקודה צפה בדיוק רגיל (FP32) של 19.5TFLOPS (או 19.5 טריליון חישובים מדי שנייה) שהם שיפור של יותר מ-24 אחוזים ביחס לשיא הקודם בליבות ה-GV100.

המסע של NVIDIA בעולמה של ליטוגרפיית ה-7 ננומטר מתחיל עכשיו

על הנייר, שיפור הביצועים הזה נמוך יותר מהזינוק שראינו במעבר בין דור ה-Pascal לדור ה-Volta – אך היתרון של ליבת ה-A100 הוא בכך שהיא תומכת במספר גדול הרבה יותר של מצבי עיבוד, כולם בעוצמה חסרת תקדים לתחום: גם חישובי נקודה צפה בדיוק כפול (FP64) של 9.7TFLOPS, גם חישובי טנזורים עם מספרים שלמים בדיוק 8 ביט (INT8, מאפיין שכלל לא נתמך בליבות ה-Volta) של 624TOPS, גם חישובי טנזורים עם נקודה צפה בדיוק 16 ביט (FP16) של 312TOPS וגם חישובי טנזורים עם נקודה צפה של 32 ביט (TF32 – פיתוח חדש מ-NVIDIA בדור הנוכחי) של 156TOPS. מפתחת השבבים טוענת כי הצליחה ליצור לראשונה מוצר עיבוד יחיד אשר מסוגל להפוך את כל שאר המוצרים לבלתי רלוונטיים ובלתי נדרשים, ובכך לייעל משמעותית מערכות מחשבים עתירות הספק בעולם גם בהיבט הארכיטקטורה וגם בהיבט צריכת ההספק שלהן.

ב-NVIDIA כבר מתפארים בזכיות במספר מכרזים להקמת מחשבי-על עוצמתיים בהתבסס על מאיצי ה-Ampere

המוצר המסחרי הראשון של NVIDIA בעידן ה-Ampere יהיה מערך ה-DGX-A100, ובו שמונה כרטיסי A100 בתצורת SXM יחדיו, מחוברים בממשקי NVLink 3 משופרים ביניהם עם רוחב פס אפקטיבי של 600 ג'יגה-בייט בשנייה – המחיר המומלץ הוא 199,000 דולר, עם זוג מעבדי EPYC מבית AMD, מערכת לינוקס, זכרון דינאמי כללי של טרה-בייט אחד, אחסון NVMe בנפח 17 טרה-בייט וצריכת הספק של עד 6,500 וואט, כאשר כל מערך שכזה מבטיח לספק ביצועים של עד 5TFLOPS להאצת בינה מלאכותית (FP16) ועד 10TOPS ללמידת מכונה.

ליבת ה-GA100 המלאה כוללת למעשה 128 אשכולות עיבוד עם 8,192 יחידות CUDA בסך הכל, כאשר מתוכם 108 אשכולות עיבוד הם פעילים ביחידת ה-A100 – ולא בטוח אם נזכה לראות מתישהו מוצר משוכלל עוד יותר בו כלל היחידות החומרתיות הללו נגישות ופעילות

האם לאינטל או ל-AMD תהיה תשובה ישירה למתקפה הטכנולוגית הזו, או ש-NVIDIA עומדת בפתח תקופה חדשה של פריחה עסקית גדולה? בקרוב נגלה – אם כי כבר עכשיו ניתן להודות שארכיטקטורת ה-Ampere היא כל מה שציפינו וקיווינו לו ואולי אפילו קצת יותר מזה.