שלוש ליבות גראפיות, כולן מעל Ampere: דור ה-Ada Lovelace של NVIDIA זוכה לפירוט טכני נוסף

מפתחת השבבים מאשרת כי שלושת דגמי ה-RTX 4000 הראשונים שהוצגו מבוססים כל אחד על פיסת סיליקון שונה – ושנשאר עוד פוטנציאל לתוספת ביצועים של יותר מ-12 אחוזים עבור ה-RTX 4090 Ti העתידי

הבאזז סביב דור כרטיסי המסך החדש של NVIDIA, טוב יותר וטוב פחות, מסרב לדעוך – גם אם המוצרים עצמם עדיין אינם זמינים בשום חנות בעולם. אחרי שקיבלנו את המחירים והמפרטים הטכניים העקרוניים עבור שלושת הדגמים הראשונים במסגרת ההכרזה בכנס GTC 2022, יש לנו פירוט של נתוני הליבות עליהן יתבססו: AD104, AD103 ו-AD102 – ובכל שלושת המקרים מדובר בזינוק פשוט מדהים בצפיפות הטרנזיסטורים שבפנים.

ליבת ה-AD104 שתשמש את ה-GeForce RTX 4080 12GB כוללת 35.8 מיליארד טרנזיסטורים בשטח פיזי של 294.5 מילימטרים רבועים, בדרך לצפיפות של 121.1 מיליון טנזיסטורים לכל מילימטר רבוע – עם 60 אשכולות עיבוד ו-7,680 יחידות CUDA זמינות, בתוספת 240 מאיצים לחישובי טנזורים, 60 מאיצים עבור חישובי עקיבת קרניים ו-48MB של זכרון L2, כשמספרים אלו מבהירים למעשה כי ה-RTX 4080 12GB ממצה את כל מה שיש לחומרה לתת לנו, על כן אם יהיה שימוש נוסף ב-AD104 זה יהיה במסגרת דגמי RTX 3070 מקוצצים ומוזלים יותר.

ליבת ה-AD103 שתשמש את ה-GeForce RTX 4080 16GB, שעל פי כל שיקול הגיוני היה ראוי לקבל שם דגם שונה שיסייע להבליט את ההבדלים המשמעותיים בינו לבין ה-RTX 4080 12GB בכל היבט אפשרי, כוללת 45.9 מיליארד טנזיסטורים בשבב עם שטח פנים של 378.6 מילימטרים רבועים, עם צפיפות זהה ל-AD104 ו-80 אשכולות עיבוד שבהם 10,240 יחידות CUDA זמינות, 320 יחידות טנזור, 80 יחידות RT ו-80MB כוללים של זכרון מטמון L2.

ה-RTX 4080 16GB עצמו כולל 76 אשכולות עיבוד פעילים ו-9,728 יחידות CUDA, מה שאומר כי תיאורטית יתכן שדגם RTX 4080 נוסף (או RTX 4080 Ti כלשהו) יעשה שימוש באותה ליבת AD103, הפעם פעילה באופן מלא, בכדי לספק שיפור קטן של כ-5 אחוזים בביצועים. זו ספקולציה בלבד בשלב זה, ראוי לציין, שכן יש לנו דוגמאות היסטוריות לליבות עיבוד שמעולם לא קיבלו הזדמנות להיכנס אל מוצר כשהן פעילות במלואן בשל שיקולי תפוקה וייצור שונים.

ליבת ה-AD102 האימתנית כוללת כבר 76.3 מיליארד טרנזיסטורים שנפרשים על פני 608 מילימטרים רבועים, עם צפיפות טובה אפילו יותר של 125.5 מיליון טרנזיסטורים לכל מילימטר רבוע ו-144 אשכולות עיבוד שבהם 18,432 יחידות CUDA זמינות, 576 יחידות טנזורים, 144 יחידות RT ו-96MB של זכרון L2 בסיכום הכולל.

נתונים מפלצתיים במלוא מובן המילה, שמתוכם ה-GeForce RTX 4090 עושה שימוש רק בכ-87.5 אחוזים – מה שכבר מצייר לנו את קווי המתאר עבור דגם RTX 4090 Ti עתידי שיוכל לעשות שימוש ב-100 אחוזים מרכיבי החומרה שעל הליבה, או קרוב לכך.

הנתון הכי מדהים עבור כל שלושת ליבות עידן Ada Lovelace הוא שהן כולן כוללות יותר טרנזיסטורים בתוכן מאשר ליבת ה-GA102 הגדולה מדור ה-Ampere ששימשה את ה-RTX 3090 וה-RTX 3090 Ti – עם 28.3 מיליארד טרנזיסטורים "בלבד" על שטח של 628 מילימטרים רבועים, אשר מתורגם לצפיפות של 45.1 מיליון טרנזיסטורים למילימטר רבוע. במילים אחרות, הקפיצה של NVIDIA מתהליך ייצור של 8 ננומטר אצל סמסונג לתהליך ה-4N של TSMC איפשרה לה להתקרב לשילוש (!) הצפיפות של הטרנזיסטורים בליבות שלה, באופן שעוזר להסביר בין היתר מדוע RTX 4080 12GB עם ליבה בעלת שטח של פחות ממחצית מ-GA102 ומחצית מהזכרון הדיאנמי אמור להציע ביצועים דומים או גבוהים מה-RTX 3090 Ti תוך שימוש במעטפת הספק של 285 וואט במקום 450 וואט.

אין ספק שההמתנה הארוכה יחסית שעברה עלינו בין דור ה-RTX 3000 לדור ה-RTX 4000, בצל משבר הזמינות של עולם החומרה, סייעה להפוך את הקפיצה בין הדורות למלהיבה ביותר – ועכשיו יהיה מעניין לגלות האם המעבר של המתחרה AMD לתהליך ייצור וותיק מעט יותר מ-5 ננומטר במסגרת דור ה-Radeon RX 7000 יצליח לעמוד בקצב.