HWzone - אבני הבניה של GeForce RTX 50 - הכירו את ארכיטקטורת Blackwell של NVIDIA

מאמר זה מרכז את החלק הטכני שמאחורי כרטיסי המסך של NVIDIA אשר יושקו בקרוב – הכירו את ארכיטקטורת Blackwell אשר עומדת מאחורי כרטיסי המסך החדשים

תוכן עניינים

השינויים והשיפורים שנעשו
כרטיסי המסך והחלוקה לליבות השונות

השינויים והשיפורים שנעשו

בחיבור לחלק הקודם של כרטיסי המסך מסדרת RTX 50, ההקדמה לחלק הטכני של ארכיטקטורת Blackwell כוללת את העובדה שעבור NVIDIA ההמשך של אבולוציה ביכולות עיבוד גרפיקה חייבת לכלול את מה שהיא קוראת לו "עיבוד נוירוני", עיבוד גרפי שכולל שימוש במודלים פשוטים ומורכבים על מנת לקבל ביצועים וויזואליות מתקדמת עם ארכיטקטורות חדשות של ליבות גרפיות.

הבסיס של ארכיטקטורת Blackwell הוא לא חדש בעולם הטכנולוגיה שכן היה קיים עד כה בעולם השרתים של NVIDIA אך כעת הוא גם מגיע לעולם משתמשי הקצה עם כרטיסי המסך החדשים מסדרת GeForce RTX 50. העקרונות הטכנולוגיים שמאחורי הטכנולוגיה הזאת נשענים בעיקר על פיתוחים בוגרים יותר של כל מה שסובב ליבה גרפית שמיועדת לעולם ה-AI. כמובן שישנם גם אספקטים כמו תהליך יצור מתקדם יותר במפעל יצור השבבים עצמו שמאפשר לדחוף יותר טרנזיסטורים פר שטח מרובע.

גורמי המפתח שגורמים ל-Blackwell להיות צעד קדימה עבור NVIDIA בהשוואה ל-Ada, הארכיטקטורה הקודמת כוללים:

שיפור יכולות למידת מכונה ו-AI
שדרוג מעבדי עקיבת קרניים (RayTracing)
ליבות דחוסות יותר וגדולות יותר פיזית וגם במספר הטרנזיסטורים לעיבודים כללים זריזים יותר (זה אומר גם יותר זיכרון מהרמות השונות)
מעבר לזיכרון גרפי מסוג GDDR7 לעומת GDDR6X שמוסיף כ-40% בתעבורת הזיכרון הגרפי גם בשימוש אותו נפח בקר זיכרון (למשל 256BIT)

הנה השוואה בין קבוצות העיבוד שבונות את ליבות Blackwell לצד Ada. מעבדי ההצללה מקבלים תוספת כח עיבוד AI. בין חלוקת קבוצות העיבוד שלצד מעבדי ה-Tensor כעת הכל יכול לבצע עיבוד או מסוג FP32 או מסוג INT32. בגדול, ההבדל הוא יכולת חישוב של מספרים שלמים לעומת מספרים בעלי שבר.

זיכרון מסוג GDDR7 הוא רכיב מאוד משמעותי עבור דור כרטיסי המסך מסוג RTX 50. הסיבה לכך פשוטה, יותר מידע עובר בין הליבה הגרפית לבין שבבי הזיכרון בכל זמן נתון. הדרך לפיתוח זיכרון שכזה עוברת דרך שיפור איכות האות החשמלית שזה אומר אות נקי יותר בין היתר גם כתוצאה ממיקום השבבים כמה שיותר בצמוד לבקרי הזיכרון השונים בליבה. זו אחת מכמה סיבות שלוחות מודפסים לכרטיסי המסך החדשים יהיו צפופים וקטנים במיוחד. בנוסף, שבבי GDDR7 נחשבים גם ליעילים יותר חשמלית.

בעבר הרחוק חישוב הגיאומטריה של אלמנטים ויזואליים היה נתון לחלקים מאוד ספציפיים בליבות הגרפיות. כיום חישוב גיאומטרי מתבצע בכל יחידת עיבוד שקיימת עבור מטלות מתמטיות כלליות. עבור ליבות ה-RayTracing, טוענת NVIDIA שבארכיטקטורת Blackwell נעשה גדש גדול גם על יכולות עיבוד עקיבת קרניים וגם על הפחתה של תצרוכת הזיכרון הגרפי בעת חישוב עקיבת קרניים.

במהלך הנדסת הלוחות המודפסים וגם הליבות עצמן, אחד הדגשים של NVIDIA הוא לקצר את הזמנים שבין מעבר מצבים לליבה בדרגות המאמץ השונות. אחד הדברים שהופכים שבב ליעיל הוא היכולת להגיב במהרה לדרישות צריכת החשמל באותו הרגע. על פי NVIDIA מהירות השינויים החשמליים (מה שידוע כ-Switching Frequency) קוצרה לעשירית משהייתה בדור Ada. כתוצאה מכך, יכולה ליבת Blackwell להגיע לתדרים וצריכות החשמל הרצויות בתגובתיות משופרת משמעותית. זה אומר פחות חום, צריכת חשמל נמוכה יותר לכל פריים שהופק בממוצע וכתוצאה מכך גם רמות רעש נמוכות יותר ממערכת הקירור. זה אחד הגורמים שמשנים את התפיסה של מה מעטפת חום אומרת על מוצר, ויהיה מעניין לבחון זאת בפועל כשהחומרה תהיה זמינה.

חלק ניכר מאחורי זה היא היכולת להתאים את התדר לשימוש ולמגבלות מעטפת החום ולשימוש הספציפי. NVIDIA טוענת לשיפור של עד פי 1000 בתגובתיות של שעון הליבה לפעולות הללו.

הנה הוא מה שלדעתנו אחד מהשדרוגים החשובים ביותר שמבצעת ארכיטקטורת Blackwell – מנוע המדיה והקידוד. סוף כל סוף ישנו מעבר לממשקים מודרניים מסוג DisplayPort 2.1 UHBR20 עבור מסכים כמו גם שימוש ב-HDMI 2.1 שנכנס לפעולה עוד בסדרה הקודמת.

צלמי ווידאו שעובדים עם מצלמות HEVC 10BIT 4:2:2? ברכותנו, כרטיסי המסך החדשים יודעים להאיץ את הפורמט הזה. כיום עולם הצילום כולל מצלמות רבות של כל המותגים אשר כוללות תמיכה בצילום HEVC (ידוע גם כ-H265 או LongGOP במצלמות) בעומק 10BIT ובכרומת צבע 4:2:2. עד כה לא קיבלנו כרטיסי מסך עוצמתיים במיוחד שיכלו להאיץ עריכה עם הפורמט הזה שגם נחשב למאוד יעיל בנפח אחסון. כעת עורכי וידאו יוכלו לרכוש כרטיסי מסך מסדרת RTX 50 מכל דרגה ולדעת שתהיה האצה מאוד משמעותית בנושא.

NVIDIA מציינת גם הכפלה בביצועי H264 שהוא פורמט מאוד פופולרי נוסף אשר מגיע בשלל מעטפות ומקודדים במצלמות מודרניות מכל הסוגים. דרך מעניינת אחרת לראות את זה בשבבים של מחשבים ניידים היא ביצועים דומים בחצי מצריכת החשמל הדרושה ממנוע המולטימדיה.

כך זה נראה כששמים ספינות דגל על גרף. NVIDIA טוענת לשיפור של עשרות אחוזים באיכות ובמהירות המקודדים החדשים שלה לוידאו בכרטיסי RTX 50.

כרטיסי המסך והחלוקה לליבות השונות

בתג מחיר רשמי מומלץ של 2,000 דולר ה-GeForce RTX 5090 מוביל את הסדרה החדשה. הוא מכיל 32GB של זיכרון גרפי על בקר 512BIT ומבוסס ליבת Blackwell GB202 עם 21,760 מעבדי הצללה, 680 מעבדי Tensor ו-170 מעבדי RayTracing. זמינותו הרשמית תחל ב-30 לחודש. לכרטיס מסך זה מעטפת חום מירבית של 575W.

ה-GeForce RTX 5080 מגיע לשוק גם הוא ב-30 לחודש והוא מכיל 16GB של זיכרון גרפי על בסיס בקר 256BIT. ליבת ה-Blackwell GB203 בכרטיס המסך הזה מכילה 10,752 מעבדי הצללה, 336 מעבדי Tensor ו-84 מעבדי RayTracing. מחירו המומלץ של ה-RTX 5080 הוא 999 דולר ומעטפת החום המירבית שלו הינה 360W.

במהלך פברואר יגיח לעולם ה-GeForce RTX 5070 Ti. כרטיס המסך הזה גם הוא מכיל 16GB של זיכרון גרפי על בסיס בקר 256BIT. לליבת ה-Blackwell GB203 שלו 8,960 מעבדי הצללה, 280 מעבדי Tensor ו-70 מעבדי RayTracing. החלק המעניין פה הוא שאנחנו מקבלים 80% מ-RTX 5080 ב-75% מהמחיר כאשר הוא יגיע לשוק עם תג מחיר מומלץ של 749 דולר. מעטפת החום של כרטיס המסך הזה הינה 300W.

במהלך פברואר יגיע לשוק גם האח הקטן מבין ארבעת כרטיסי המסך הללו, ה-GeForce RTX 5070. כרטיס המסך הזה מגיע עם 12GB של זיכרון גרפי על בסיס בקר 192BIT. לליבת ה-Blackwell GB205 שלו 6,144 מעבדי הצללה, 192 מעבדי Tensor ו-48 מעבדי RayTracing. מחירו המומלץ של ה-RTX 5070 פונה לקהל רחב יותר מאחיו הגדולים כאשר הוא יגיע עם תג של 549 דולר, בדומה למחיר בו תמצאו RTX 4070 כיום. מעטפת החום של ה-RTX 5070 הינה 250W.