האירוע המקוון של מפתחת השבבים עמד בציפיות ואף התעלה עליהן – הכירו את ליבת ה-A100, את מאיץ ה-NVIDIA A100 ואת מערכת ה-DXG-A100 המפלצתית שמתקבלת כאשר משלבים שמונה מהם יחד
ג'ן-סן הואנג הבטיח לנו את כרטיס המסך הגדול בעולם – וקיים זאת. ליבת ה-GA100 החדשה של NVIDIA, הראשונה בארכיטקטורת ה-Ampere והראשונה בהתבסס על תהליך ייצור של 7 ננומטר (מבית TSMC כמובן), גדולה אמנם רק במעט מליבת ה-GV100 הענקית שהחזיקה בשיא עד כה – אבל עם פי 2.57 טרנזיסטורים יותר מדובר בהתפתחות גדולה מאוד שמיועדת לבצע האצה של כל הטכניקות הרלוונטיות והמוכרות בעולם העיבוד כיום, ללא יוצא מן הכלל.
ליבות ה-GA100 הן בגודל עצום של 826 מילימטרים רבועים, ובמאיצי ה-A100 נקבל אותן עם תוספת 5 ערימות של זכרונות HBM2 מודרניים (מתוך 6 אפשריות בליבה) בנפח של 40GB ברוחב פס אפקטיבי של 1.6 טרה-בייט בשנייה תודות לממשק 5,120 ביט – ועם 6,912 יחידות עיבוד פעילות מסוג CUDA בתדר פעולה מירבי של 1,410MHz, עם תוספת של 432 יחידות טנזורים מדור חדש וזכרון מטמון כולל מרמה L2 של 40MB. כל אלו יחד פועלים תחת מעטפת הספק ענקית של 400 וואט – לביצועי חישוב נקודה צפה בדיוק רגיל (FP32) של 19.5TFLOPS (או 19.5 טריליון חישובים מדי שנייה) שהם שיפור של יותר מ-24 אחוזים ביחס לשיא הקודם בליבות ה-GV100.
על הנייר, שיפור הביצועים הזה נמוך יותר מהזינוק שראינו במעבר בין דור ה-Pascal לדור ה-Volta – אך היתרון של ליבת ה-A100 הוא בכך שהיא תומכת במספר גדול הרבה יותר של מצבי עיבוד, כולם בעוצמה חסרת תקדים לתחום: גם חישובי נקודה צפה בדיוק כפול (FP64) של 9.7TFLOPS, גם חישובי טנזורים עם מספרים שלמים בדיוק 8 ביט (INT8, מאפיין שכלל לא נתמך בליבות ה-Volta) של 624TOPS, גם חישובי טנזורים עם נקודה צפה בדיוק 16 ביט (FP16) של 312TOPS וגם חישובי טנזורים עם נקודה צפה של 32 ביט (TF32 – פיתוח חדש מ-NVIDIA בדור הנוכחי) של 156TOPS. מפתחת השבבים טוענת כי הצליחה ליצור לראשונה מוצר עיבוד יחיד אשר מסוגל להפוך את כל שאר המוצרים לבלתי רלוונטיים ובלתי נדרשים, ובכך לייעל משמעותית מערכות מחשבים עתירות הספק בעולם גם בהיבט הארכיטקטורה וגם בהיבט צריכת ההספק שלהן.
המוצר המסחרי הראשון של NVIDIA בעידן ה-Ampere יהיה מערך ה-DGX-A100, ובו שמונה כרטיסי A100 בתצורת SXM יחדיו, מחוברים בממשקי NVLink 3 משופרים ביניהם עם רוחב פס אפקטיבי של 600 ג'יגה-בייט בשנייה – המחיר המומלץ הוא 199,000 דולר, עם זוג מעבדי EPYC מבית AMD, מערכת לינוקס, זכרון דינאמי כללי של טרה-בייט אחד, אחסון NVMe בנפח 17 טרה-בייט וצריכת הספק של עד 6,500 וואט, כאשר כל מערך שכזה מבטיח לספק ביצועים של עד 5TFLOPS להאצת בינה מלאכותית (FP16) ועד 10TOPS ללמידת מכונה.
האם לאינטל או ל-AMD תהיה תשובה ישירה למתקפה הטכנולוגית הזו, או ש-NVIDIA עומדת בפתח תקופה חדשה של פריחה עסקית גדולה? בקרוב נגלה – אם כי כבר עכשיו ניתן להודות שארכיטקטורת ה-Ampere היא כל מה שציפינו וקיווינו לו ואולי אפילו קצת יותר מזה.