עם יותר מ-20 מיליארד טרנזיסטורים, תהליך ייצור חדש ומימדים פיזיים עצומים, מפתחת השבבים הירוקה מקווה לבצע מהפכה נוספת בעולם הלמידה החישובית והבינה המלאכותית – ואנחנו כבר מפנטזים על דור ה-GeForce החדש לגיימינג
קיווינו לקבל אזכורים כלשהם לארכיטקטורת ה-Volta החדשה והמסקרנת של חברת NVIDIA במסגרת אירוע ה-GTC השנתי שלה שהתקיים בקליפורניה – אך אנחנו מוכרחים להודות כי לא ממש ציפינו לחשיפה רשמית מלאה, מאסיבית ומרשימה כמו זו שקיבלנו בפועל. המפתחת מסנטה מוניקה שוב הצליחה להותיר אותנו בלי יותר מדי מילים, כשהכריזה על ליבת ה-GV100 שלה שאמורה לקחת את עולם העיבוד עתיר הביצועים לרמה שונה לגמרי. שוב.
עידן ה-Volta של NVIDIA נפתח בסערה עם תהליך ייצור חדש, אצל השותפה הוותיקה TSMC, שאפילו קיבל את שמה של החברה – 12 ננומטר מסוג FFN, כשראשי התיבות הם עבור טרנזיסטורי FinFET תלת מימדיים ועבור NVIDIA. בנוסף לתהליך הייצור שאמור להיות יעיל יותר מתהליך ה-16 ננומטר של החברה הטאיוואנית הענקית (ולכאורה גם יעיל מתהליכי ה-14 ננומטר של מתחרות כדוגמת סמסונג ו-GlobalFoundries). כמו כן, יש לנו ארכיטקטורה שונה משמעותית שכוללת עתה ליבות חדשות לגמרי שקיבלו את הכינוי Tensor Cores, ומתווספות אל ליבות ה-CUDA המוכרות לנו היטב, עם התאמה ספציפית לביצוע פעולות חיבור וכפל של מטריצות קטנות במימדים של 4 (ביטים) על 4, ואחסון התוצאות המתקבלות בתאי נקודה צפה של 16 ביט או 32 ביט לפי הצורך, לשם המשך העיבוד בידי שאר הליבות.
מערך זה אמור להיות אפקטיבי ומועיל במיוחד עבור יישומי למידה חישובית ולמידה עמוקה, וכן עבור יישומים מבוססי בינה מלאכותית הנגזרים בחלק גדול מהמקרים מתוך נתונים אלו, שבהם הדגם הוא על עיבוד מקבילי פשוט, רחב ההיקף ומהיר ככל האפשר – וזה מאפשר ל-NVIDIA להכריז כי ליבת ה-GV100 המאסיבית מעניקה ביצועים של עד 120TFLOPS לחישובי טנזורים, עד 30TFLOPS בחישובי 16 ביט (חצי דיוק), עד 15TFLOPS בחישובי דיוק 32 ביט סטנדרטי וגם עד 7.5TFLOPS של חישובי 64 ביט בדיוק כפול – כמעט 50 אחוז יותר מליבת ה-GP100 המלאה, שעד היום הייתה אלמנט העיבוד המקבילי העוצמתי ביותר בעולם כולו. מדהים!
על מנת להגיע לנתוני ביצועים פנטסטיים אלו, ב-NVIDIA החליטו לעדות שימוש באחת מפיסות הסיליקון הגדולות ביותר שנראו בשוק השבבים – עם שטח כולל של 815 מילימטרים רבועים (כ-33 אחוזים יותר מה-GP100), שבו תמצאו עד 5,376 יחידות CUDA, עוד 672 ליבות טנזור, 336 יחידות טקסטורה מסוג TMU, זכרון מטמון מרמה L1 של 128 קילו-בייט, 6 מגה-בייט של זכרון מטמון מרמה L2 (שניהם משותפים בין כל יחידות העיבוד לאפקטיביות מירבית) וגם 16 ג׳יגה-בייט של זכרון HBM2 חדשני, שמסודר בארבעה מערומים ומעניק רוחב פס אפקטיבי עצום של 900 ג׳יגה-בייט בשנייה, קרוב לרמה התיאורטית המירבית של טרה-בייט בשנייה שהובטחה לנו במסגרת הטכנולוגיה.
שימוש ביותר מ-21 מיליארד טרנזיסטורים על ליבת ענק אחת (במסגרת יחידת עיבוד בשם Tesla V100, שהיא המוצר המעשי הראשון המבוסס על ה-GV100), בתדר עבודה מירבי די מדהים של 1,455MHz, לקבלת ביצועי הענק פורצי הדרך שהוזכרו קודם זה דבר אחד – אך להשיג זאת תוך כדי שמירה על מעטפת הספק של 300 וואט בלבד, כמו זו של יחידות ה-Tesla P100 משנה שעברה שהתבססו על ליבת ה-GP100, זה משהו שמשאיר אותנו פעורי פה באמת. NVIDIA הצליחה לשפר את יעילות העיבוד שלה בכ-50 אחוזים במסגרת דור ה-Volta, לפחות על הנייר, בהשוואה לדור ה-Pascal, שהיה השיאן המובהק בתחום זה עד כה.
NVIDIA תציע את ה-Tesla V100 שלה במערכי עיבוד מתקדמים במיוחד לעולם השרתים, המחקר, המדע וה-HPC עם ארבע ושמונה יחידות עיבוד (שיחוברו בממשק NVLink 2.0 עם רוחב פס דו צדדי של 25 ג׳יגה-ביט בשנייה לכל עורק ועורק), ותגי מחיר שיעמדו על סכום בין 70,000 דולר ל-150,000 דולר – כאשר המפתח כאן הוא זמינות לרכישה מוקדמת לחברות ולגופים המעוניינים כבר עתה, והבטחה לזמינות מעשית במהלך הרבעון השלישי של שנת 2017.
זמן ה-GeForce
ממש כמו ליבת ה-GP100 לפניה, גם ליבת ה-GV100 אינה רלוונטית לצרכנים הביתיים הפרטיים שמחפשים גיימינג שובר שיאים – אך ברור לגמרי כח ב-NVIDIA יציעו ליבות Volta נוספות בעתיד הלא רחוק שיהיו מיועדות בדיוק לקהל זה, ככל הנראה ללא רוב המעגלים שמעניקים ביצועים מירביים בדיוק 64 ביט כפול, וללא ליבות הטנזור החדשות – אך כן עם זכרונות HBM2 חדשניים (לפחות בחלק מהדגמים) וכן עם עד ל-84 אשכולות עיבוד ועד 5,376 יחידות עיבוד מרכזיות, שהן תוספת של 40 אחוזים מעל למספר מירבי אותו קיבלנו בדור ה-Pascal, מה שעשוי להעיד על מידת השיפור הפוטנציאלי ברמות המחיר השונות, בעולם ורוד ואופטימי במיוחד כמובן.
NVIDIA לא אמרה מילה וחצי מילה בנוגע ל-Volta בהקשרי שוק הגיימינג ומשפחת מוצרי ה-GeForce, אך ראוי לציין כי בשנה שעברה ראינו הכרזה על יחידות ה-Tesla P100 ועל ליבות ה-GP100 בכנס ה-GTC בתחילת חודש אפריל – וחשיפה של כרטיסי ה-GTX 1080 וה-GTX 1070 בתחילת חודש מאי, כלומר חודש אחד בלבד לאחר מכן – ולמרות שאנחנו רצת סקפטיים אודות הסיכויים לראות שחזור מדוייק של מהלך זה השנה (אחרי הכל מוצר הדגל GeForce GTX 1080 Ti הושק עם רעש וצלצולים רק לפני כחודש), יד סיכוי לא רע בכלל שדור חדש של דגמי GeForce עם ארכיטקטורה חדשה לגמרי נמצא במרחק קצר של מספר חודשים מאיתנו.
הכרזה של דגמים ביתיים חדשים בעתיד הקרוב, גם אם זמינות מעשית תגיע רק כמה שבועות או אף חודשים לאחר מכן, תוכל להיות מכת מנע מנצחת של NVIDIA עבור דור ה-Vega המתעכב של AMD, ומהלך שיוודא כי ג׳ן-סון הואנג ואנשיו ממשיכים לשמור על היתרון הטכנולוגי המשמעותי שלהם בכל קטגוריות תחום העיבוד המקבילי. בשורה התחתונה, אם חשבתם שכבר קיבלנו כמעט את כל ההפתעות שהיו לשנת 2017 להעניק לנו, כדאי שתחשבו שוב – המצב רק מתחיל להתחמם כעת.
אני לא חושב שזה יהיה מהלך עסקי חכם מבחינת אנוידיה להשיק סדרה חדשה של כרטיסי מסך כל כך מהר. לכן, לא נראה לי שזה יקרה השנה. אולי עוד שנתיים.
אני לא אומרת משהו חדש שלא נאמר כבר פני כמה שעות.
אז זה נראה כמו PASCAL גדול מימדים, אולם לא נשכח שזה לא מיועד לשוק הביתי ואנחנו נקבל גרסאה מקוצצת ומסורסת משהו.
הכרטיס הטכנולוגיה והפוטנציאל (לעניות דעתי) הם עצומים! _ אבל בתור משתמשים גיימרים ביתיים לא נראה משהו יוצא דופן אלא כמו בכל שנה נקבל 10-20 אחוז תוספת ביצועים.
כל הנ"ל מתבסס על הTESLA שהציגו אתמול.
50% יותר ליבות…. שווה ל 40% יותר ביצועים… _ (ושלא נדבר על מזעור ביחס לביצועים כי הוא לא קיים אלא להפך למי ששם לב למידות)
אבל שוב… זה לא בשבילינו!!!!
(בנימה אישית)
ציפיתי למשהו מפוצץ מ VOLTA ולאחר שחשבתי שניה זה מובן לי שלאחר שטחנו את MAXWELL וPASCAL…. לא נשאר כלום מ VOLTA חוץ מפיצ'ר שלא נוגע לנו ונקרא "Tensor Cores".
(ואתם יודעים שבבית שלנו לא יהיה Tensor Cores כי זה לא בשבילנו!)
אז עם מה נשארנו…?
הרבה כמוני חושבים שנשארנו עם PASCAL שעשה שרירים.
נו…. כל עוד לא הזכירו אותנו אז הכל יכול להיות בטל בשישים…. _ (אבל לפי איך שזה נראה במעגל האלקטרוני הזה… לי נשאר רק להוציא אנחה מאוכזבת )
ניסיתי להגיד לך… נראה לי שסוף סוף הבנת….היי מה אפשר לצפות מחברה שמאז ומתמיד שיחקה בקקה לעזאזאל אפילו התמיכה שלהם בdx12 לא טובה כמו של אי אם די….או שזו התמיכה או שפשוט הכרטיס מנוצל לרמתו המקסימלית גם יכול להיות כנראה לעולם לא נדע… כל מקרה אל תיהי עיוורת תקחי את מי שנותן תמורה מרבית למחיר תמיד לא צריך להיות עיוורים בשביל זה קיבלנו עניים….אני לדוגמא מחר יקנה נוידיה אם יתנו מחירים פר ביצועים טובים למרות שאני חושב שהם קקות ואם אי אם די יגיעו למעלה סביר להניח שהם גם יהפכו לקקות…. קאפיש?? אל לנו להיות פאן בוייז זה בעוכרנו
Adam Brener
ו AMD עוד עובדת על הווגה שיתחרה ב 1080… (לא TI)
צודק במליון אחוז…. איכזבו בגדול בקטע הזה!!!! אני לא קונה במחשב חדש רק בגלל הוגה המחורבן הזה והכי גרוע שהוא לא יתן ביצועים של לפחות 1080 במחיר תחרותי…. זה אומר שאני לא משדרג שום דבר ונשאר עם ה940 המסריח שלי וה7970ge שבלי עין הרע עושה עבודה תפו תפו
7970 FOREVER!!!!!!!!!!!!!!!!!!!!!!!!!!!
@סימני קריאה מאבדים את האפקטיביות שלהם כשהם באים בכל משפט שני.
just saying.
אני אשתדל לשנות… אבל זה שנים שיש לי שם איזה GLITCH.. _ (גם באנגלית כל מילה מתחילה אצלי ב CAPITAL LETTER) … יש לי שם משהו… עמכם הסליחה.
נקווה מאד שזה משהו ברמה של 1080TI ועולה באיזור ה 500$
1. נראה לא אומר שנוכל לקנות, או שיפרסמו מחיר.
2. איזו סיבה יש להם לתת כרטיס ברמה של ה-1080TI בכזו רמת מחיר? הם מוכרים יופי גם ב-200$ יותר.
מהמידע החדשותי האחרון שראיתי (פורסם ממש בימים האחרונים) הנושא של vega עגום למדי:
ישנה בעיה קשה מאד עם זמינות בזכרונות HBM2, הטכנולוגיה שעליה AMD הימרו וכנראה הולכים להפסיד בענק.
ההשקה אכן תהיה במאי – אך זו תהיה השקת נייר בלבד, כאשר במלאי זמין למכירה יהיו רק 16 אלף כרטיסי vega .
זוהי כמות זניחה ואפסית ממש. מלא ליום מכירות בודד סדר גודל.
המשמעות היא שכל הכרטיסים, לא משנה מה יהיה מחיר MSRP, יסבלו ממלחמת price guaging אגרסיבית
ומחיר הכרטיס יתנהג בשוק יותר כמוצר אספנות שערכו הכספי אינו הולם את ערכו הביצועי, ובדומה לדבריו של איש המערכות שכתב מעלי בשרשור זה.
וכל עוד קצב אספקת HBM2 יישאר נמוך, המשמעות היא גם קצב יצור נמוך בהמשך השנה ואחרי מועד ההשקה.
קרי אלו אינן בשורות טובות בשום צורה שהיא.
להערכתי היה מוטב ל- AMD שלא להמר בנושא הזכרונות ולפעול בדומה לנוידיאה, קרי לבחור בנתיב ה- DDR5X שהוא זמין וזול,
ונותן רוחב פס פרטי בתדרים שהוא מאפשר סביבות 10-12MBPS.
כל שהיו צריכים היה לתת רוחב של 384 או 512 סיביות ובא לציון גואל. וזה כידוע אינו דבר קשה וכבר הוטמע מזמן והיטב בדור ה- 7970 וה- 290 שלאחריו.
איך שאני רואה את זה, מנגנון ניהול הסיכונים אצל אנשי AMD לוקה בחסר רציני אם ה לא לקחו בחשבון בעייתיות בנושא HBM2 הנישתי.
זו היתה בעיה שתלויה על הקיר לנגד כל מנהל פרויקט/מהנדס בר נסיון.
אחינו לא שמעת על המושג פייק ניוז?! אין שום בעיה עם הזכרונות… היצרניות לא הזכירו שום בעיה ההיפך הם עומדים בביקושים של המבקשים דבר שני כמה כרטיסי היי אנד בדרך כלל מושקים בהתחלה? בסביבות המספר הזה עזוב סיפורים… הכל מכוון ולך תדע אולי אפילו בכוונה עי אי אם די עצמם, נחכה ונראה מה יהיה זה הכי בטוח
הAI מפנה את כל כיווני הפיתוח אליו. זה לא מה שVR היה צריך. אבל זה מובן.. Ai יותר חשוב כרגע לעולם.
^הלוואי שכך יהיה, אך בנתיים לא ארצה לחיות בתקווה יתרה, ובסוף חלילה להתבדות לשלילה. מעדיף ההפך כמובן.