טרנזיסטורים תלת מימדיים, HBM וביצועי על: NVIDIA מדברת על העתיד

במסגרת כנס ה-GTC 2015 חשפה מפתחת השבבים פרטים חדשים על ארכיטקטורת הדור הבא שלה – Pascal, שמתיימרת לספק שיפור ביצועים של עד פי 10 (!) לעומת הארכיטקטורה העכשווית

אנחנו כבר יודעים ש-AMD מכינה כרטיס דגל חדש ועתיר טכנולוגיות מתקדמות וחדשניות, אך אל תטעו לחשוב ש-NVIDIA אינה מודעת לכך – בכנס ה-GTC השנתי שערכה בעמק הסיליקון, חשפה גם היצרנית הירוקה את תוכניותיה הגרנדיוזיות לדור הבא שלה, ארכיטקטורה שתיקרא על שמו של המתמתיקאי הצרפתי בלז פסקל.

זכרון תלת מימדי – HBM ורוחבי פס שטרם ראינו

השיפור המשמעותי ביותר של דור ה-Pascal העתידי, לפחות מנקודת מבטם של הגיימרים, יהיה כנראה השילוב של זכרונות מוערמים תלת מימדית על גבי מצע שמשותף להם ולליבה הגראפית עצמה – HBM (ר"ת High Bandwidth Memory) במילים אחרות, בדומה למה שצפוי להציע ה-Radeon R9 390X. למרות הדמיון, נראה כי ב-NVIDIA מכוונים היישר אל הדור השני של זכרונות ה-HBM, ומדברים על ממשק זכרון במהירות של מעל לטרה-בייט לשנייה וזכרונות גראפיים בנפחים אדירים של עד 32 ג'יגה בייט.

ספק אם באמת נראה כרטיסי מסך עם 32GB של זכרון כבר בדור הקרוב (ה-Titan X כבר הוכיח שגם 12GB הוא נפח זכרון גראפי שאף משחק כיום לא באמת יכול לנצל באופן סביר), אך עצם התמיכה והיכולת מרמזות לנו היטב על הפוטנציאל הענק שעוד ממתין לנו במעלה הדרך – ואם לא די בנפחים ובמהירויות המשופרות מאוד, ערימת הזכרונות התלת מימדית על בסיס אינטרפוזר תאפשר גם יצירה של לוחות מודפסים קומפקטיים יותר מאי פעם בעבר.

חישובים בדיוק מעורב – הכפלת ביצועים, אבל לא בהכרח לגיימינג

החישובים שמבצעים כרטיסי המסך ברוב הזמן הינם חישובי נקודה צפה (פעולות על מספרים שהם שברים) בדיוק של 32 ביט – כשביט אחד מייצג האם המספר הוא חיובי או שלילי, שמונה ביטים נוספים מייצגים אקספוננט ו-23 הביטים הנותרים את השבר עצמו. שיטה זו נחשבת כיעילה ביותר עבור מרבית החישובים המקביליים בהם מצטיינים כרטיסי המסך, אם כי קיימים גם שימושים נוספים (לרוב בתחומי הסימולציה והמדע) בהם נדרש דיוק כפול גבוה יותר של 64 ביט – ועל כן כל הארכיטקטורות של AMD ו-NVIDIA בשנים האחרונות תומכות הן בחישובים אלו, כאשר הביצועים עצמם מופחתים בהתאם.

ב-NVIDIA מאמינים שארכיטקטורת ה-Pascal תוכל להציע ביצועים של עד פי עשר מארכיטקטורת ה-Maxwell הנוכחית – אם כי לשימושים שרלוונטיים עבור הצרכן הביתי הממוצע, כנראה שהמטרה להכפיל את יעילות הביצועים היא קצת יותר מעשית

כעת, ב-NVIDIA מאמינים כי יוכלו לשפר משמעותית את ביצועי כרטיסי המסך שלכם על ידי תוספת של תמיכה גם בחישובי נקודה צפה בדיוק חצי של 16 ביט בלבד – בצורה חדשה ויעילה יותר שתאפשר ביצועים תיאורטיים כפולים מאלו של חישובי 32 ביט. כמו במקרה של חישובי 64 ביט, גם כאן נראה כי השימוש המובהק לחישובי דיוק חצי הם באלמנטים ספציפיים מעולם המדע והמחקר – אך לא מן הנמנע שתוספת יכולת זו בדור ה-Pascal תדרבן פיתוח של דרכים ושיטות להנציל אותה גם בעולם הגיימינג, אחרי הכל גם שבב ה-Tegra X1 החדש של NVIDIA וגם ליבות ה-Mali העדכניות של ARM כוללות תמיכה בחישובים שכאלו.

NVLink – זיכרון אחוד בנוסח NVIDIA

אחת ההבטחות הגדולות לעתיד עולם המחשוב, בעיקר מבחינתה של AMD, הוא טכנולוגיית ה-HSA (ר"ת Heterogeneous System Architechture) שלה, במסגרתה יחידת העיבוד הכללית ויחידות העיבוד הגראפיות יוכלו לגשת האחת לזכרון של האחרת בצורה ישירה. למתחרה NVIDIA אומנם עדיין אין מקבילה משלה ל-HSA, אך בדור ה-Pascal יהיה לה את ה-NVLink – ממשק ייחודי ומהיר (עד 80 ג'יגה-בייט לשנייה) לתקשורת בין מספר כרטיסי מסך, ואף לתקשורת מול המעבד במערכות ייעודיות שלא צריכות להתבסס על חיבורי PCI-Express.

בעתיד, מערכי SLI של ארבעה, שישה ואפילו שמונה כרטיסי מסך יוכלו להפוך לסטנדרט מקובל – תודות ל-NVLink

NVLINK תוכל לאפשר למספר גדול של יחידות עיבוד גראפי לעבוד יחד בצורה אפקטיביות יותר – ותוכל לאפשר, לדבריה של NVIDIA, מערכים מרובי כרטיסים עם עד ל-64 יחידות.

נכון לעכשיו השימושיות המרכזית של ה-NVLink, בדומה לכל הטכנולוגיות עליהן דיברה NVIDIA בכנס בהקשר לארכיטקטורת ה-Pascal, מכוונות בעיקר לשימושים בעולם השרתים והמחשוב עתיר הביצועים – אך יתכן מאוד שנראה את החידושים הללו זולגים גם לשוק הביתי, בין אם מדובר במערכי מרובי כרטיסים גדולים יותר, יחידות כרטיסי מסך מוקטנות וייעודיות להטמעה במערכות או אפילו טכנולוגיה ליצירת זכרון משותף ל-CPU ול-GPU.

מנכ"ל NVIDIA הציג על הבמה יחידת עיבוד גראפי זעירת מימדים אותה ניתן יהיה להטמיע במערכות גדולות ועתירות ביצועים – ומי יודע, אולי בהמשך נראה יישומים מתקדמים דומים גם בעולם הגיימינג

ארכיטקטורת ה-Pascal תתבסס על טרנזיסטורי FinFET תלת מימדיים בליטוגרפיה של 16 ננומטר מבית שותפת הייצור הוותיקה TSMC, תציע לכאורה שיפור של פי שניים ביעילות הביצועים (חישובים לפי מדד ה-SGEMM לכל וואט) ואמורה להגיע מתישהו במהלך שנת 2016 – מה שכנראה אומר שכבר במהלך החודשים הקרובים נתחיל לשמוע שלל דיווחים ונבואות בנוגע למוצרים הספציפיים שנמצאים בדרכם אל השוק. משעמם בטוח לא יהיה.