RDNA2 מעבר לסבוב, המידע הכי עדכני - עמוד 17 - כרטיסי מסך - HWzone פורומים
עבור לתוכן
  • צור חשבון

RDNA2 מעבר לסבוב, המידע הכי עדכני


nec_000
 Share

Recommended Posts

ציטוט של captaincaveman

ב-4k, כמו שראינו מספיק פעמים, המגבלה היא כרטיס המס ולא חלקים אחרים במערכת. אני לא מדבר על דברים כמו ray tracing, אלא רק רסטריזציה. יש 20% יותר cores, לפי מה שאתה אומר צריך לראות שיפור גדול יותר בביצועים בסיטאציות בהן יש רק רסטריזציה.

 

העלת שאלה נבונה ואני מבינך. אז אסבירה:

 

יהיה המצב הבא, שעובדים ברזולוציה גבוהה כפי שבקשת לתאר, כגון בעומס גראפי כבד, אשר מביאה את כל

הכרטיסים המושווים זה לזה לרוויה, כך שאף אחד מהם אינו מעוכב בשל סיבה חיצונית, כדוגמתו של המחשב (זו

שתוארה בהסבר הקודם מאתמול שנתתי בשרשור זה).

 

קרי אנו מבקשים להסביר, מדוע שני כרטיסים בפער חומרתי X, אינם מצליחים להפגין פער ביצועי לינארי בגודל X בפועל.

 

יהיה הכרטיס 3090 מושווה אל מול הכרטיס 3080.

הפער החומרתי בינהם הוא כ- 20%, אך בפועל הפער הביצועי כפי שרואים הוא טיפוסית רק 10%.

נבקש להתחקות אחר התופעה ולהבין, מדוע הפער הביצועי הזה מתרחש, אף כאשר העומס הגראפי הוא ב- load

מלא על שני הכרטיסים.

 

ברמה האבסטרקטית, עבוד תמונה גראפי מורכב משני שלבים עקרוניים. השלב הראשון הוא שלב החישוב הגאומטרי,

והשלב השני הוא רנדור התמונה, ציורם של הפיקסלים על האוביקטים הגאומטריים שחושבו בשלב הקודם.

 

עכשיו נשים לב לדבר הבא:

הפער החומרתי שבין 3080 ל- 3090 ברובד יחידות הרסטריזציה, להלן השיידרים, הוא 20%, אבל היחס החומרתי שבין

הכרטיסים הללו ברובד הגאומנטרי נותר על 1 ל- 1. המרכיב הגאומטרי לא קוצץ בליבת 3080 והוא זהה בהספקו

החישובי לזה שקיים בליבה המלאה GA102.

 

כאשר יצרני קיצוץ לליבות גראפיות (על מנת לסגמנט כמה רמות של מוצרים מאותה פיסת סיליקון)

הקיצוץ נעשה ברובד כמות יחידות העבוד הרסטריזציוני, וברוחב פס הזכרון, ולא במרכיב הגאומטרי, שבו קשה לביצוע

קיצוץ דומה. מדובר במעט מאד יחידות גאומטריות, לרוב 2 עד 8, והרכב טכני שמקשה על השמטת מי מהם החוצה

מהשרשרת.

 

עכשיו,

בהנתן עומס גראפי במשחק, שבו המרכיב הגאומטרי מצוי ברוויה, אך לכרטיס ישנה יתרת עובד רסטריזציה/ציור

פיקסלים, יווצר מצב, שהרכיב שמצייר את הפיקסלים (שלב שני בתהליך העבוד תמונה)  לא יהיה ב- load מלא אלא

בהמתנה לשלב הקודם.

 

במקרה שכזה, לא משנה כמה תוספת כח עבודי נוסיף לשלב הציור (20% לדוגמא), חלק מהתוספת הזו לא תוכל לבוא

לידי ביטוי. במקרים שכאלו המרכיב הציורי מעוכב על ידי המרכיב הגאומטרי.

 

בעת הזו כבר למדנו לאור הסקירות הנתונים והבנצ'ים השונים, שבדור 3000 נוידיאה שינתה את היחס בין המרכיב

הגאומטרי למרכיב הציורי שבמעבד הגראפי לעומת הדור הקודם. היא עיבתה מאד את המרכיב הציורי, אך ליוותה אותו

בעיבוי קטן יותר ברובד הגאומטרי.  כתוצאה מכך נוצרה תופעה, שבה סדרה 3000 מתקשה לספק שפור משמעותי

על פני הדור הקודם ברזלוציות נמוכות (שבהם המרכיב הציורי פחות משחק תפקיד בעוד שהמרכיב הגאומטרי הוא זה

שעובד קשה) ומנגד היא מצליחה להביא את השפור המרשים דווקא ברזולוציות הגבוהות (4K) שבהן העומס הציורי

עולה בשעה שהעומס הגאומטרי נשאר זהה לזה שברזולוציות הנמוכות.

 

השינוי הזה שנוידיאה יצרה ב- balance של סדרה 3000 מוביל לתופעות מעניינות שאנו חובים אותן בשטח.

 

נוידיאה בחרה ביחס הזה מן הסתם לאחר שחקרה ובדקה מה הלך הרוח בשוק המנועים הגראפיים העדכני וזה

שצפוי לבוא בהמשך, והסיקה, שהעומס הציורי יגדל יותר מאשר העומס הגאומטרי, ולכן בחרה את היחס החדש שבו

בחרה. השינוי balance הזה מוביל לא לאחת לתופעות של חוסר נצילות בעליה מליבה של 3080 לזו של 3090.

 

אפשר לומר אחרת, שהיחס שהם בחרו הוא אופטימאלי יותר (כיום) במקרה של הליבה של 3080, מאשר בזאת של

3090, ולכן זה לא ש- 3090 פחות מהיר מאותם 20 אחוזים שציפינו להם, אלא זה ש- 3080 סופג פחות עונשין

מאותם 20% הפחתת חומרה. זאת בשל התקרבות טובה יותר של 3080 לאופטימום שנוידיאה חישבה.

 

בכל דור ודור האופטימום יוצר לנו efficiency שונה בין גראפיים ב- stack של אותו דור.

בדור הזה 3080 יותר מאוזן כנראה מ- 3090. הדבר יכול להשתנות בהמשך, באם המנועים הגראפיים שיבואו,

ישנו את הדרישות והיחס, שהם בתורם משיתים על העבוד הגראפי.

נערך על-ידי nec_000
  • תודה! 1
קישור לתוכן
שתף באתרים אחרים

  • תגובות 340
  • נוצר
  • תגובה אחרונה

משתתפים בולטים בדיון

משתתפים בולטים בדיון

תמונות מצורפות

טוב,

 

אז יש כבר עוד מידע חשוב ומעניין, כמו למשל שהשבב החדש Navi21 הוא בגודל של 536 מ"מ רבועים.

כבר ידענו שהוא באזור 500 פלוס, אבל לא ידענו בדיוק כמה. עכשיו יודעים.

להשוואה Navi10 הקודם = rx5700  היה באותה ליטוגרפיה, ובגודל 251 מ"מ.

משמע שהכפילו את גודל השבב פי 2.13 למען הדיוק.

 

מבחינת כמות טרנזיסטורים, עלו מ- 10.3 מיליארד ל- 26.8 .

משמע שמדובר בעליה של פי 2.6 בטרנזיסטורים.

 

זו העלאת הנצילות לשטח בגודל (2.6 העליה בטרנזיסטורים, חלקי 2.13 הגידול בשטח) = 22% יותר טרנזיסטורים

למ"מ רבוע.  מרשים מאד לאור העובדה שהליטוגרפיה נותרה בעצם זהה.

 

העליה הזו נובעת מכך, שהנצולת התכנונית מבחינה גאוגראפית ב- החדש טובה יותר מקודם. מצליחים לדחוס

יותר טרנזיסטורים ליחידת שטח. קרי מבזבזים פחות שטח. יודגש כי לא שונתה הליטוגרפיה והם עדיין מיצרים באותו

7nm דור ראשון של . הליטוגרפיה מוכחת וותיקה אמינה וזולה ביחס לחדישות יותר, ולכן בחרו להשתמש בה.

 

כלומר, שכל התוספת הזו בטרנזיסטורים ליחידת שטח מבוססת אך ורק על תכנון גאוגראפי מוצלח יותר בשבב החדש,

וכנראה גם בזכות הטמעת ה- cache שהוא מטבעו מאוד צפוף ואינו מבזבז שטח יקר, אלא יושב על השטח בניצול

אפקטיבי. הדבר וודאי תורם גם את חלקו לעלייה הממוצעת בטרזיסטורים לתא שטח.

 

כמו כן קבלנו דיאגרמה מלאה של המחלקות השונות במעבד הגראפי, מיקום, סדר, היררכיה, והדבר החדש והמדליק

שהוא ה- cache הענק, כיצד ממשו אותו כטבעת עוטפת את כל המעבד (לקישוריות מהירה ורחבה, בשל קו השקה

ארוך מחד, וכנראה גם כדי לייצר מרחקים קרובים ושווים ככל שניתן, לכל אחד מרכיבי המעבד, לחסכון באבדן זמן על

עכבה).

https://www.techpowerup.com/gpu-specs/amd-navi-21.g923

 

923-block-diagram.jpg

 

 

צילום הסיליקון עצמו - כך זה נראה :

 

923-cgi-die-shot.jpg

 

ארצה לסכם לנו משהו מספרי שנבין:

קבלנו תוספת של פי 2.6 טרנזיסטורים, ועוד משהו כמו סביבות 10% סדר גודל עקרוני בתדר עבודה הטיפוסי

לעומת הדור הקודם. הנוכחי עובד על ממוצע (כנראה) סביב 2.1-2.15Ghz, הקודם rx5700 סביבות 1.95Ghz.

שילוב שניהם (2.6 יותר טרנזיסטורים כפול 1.1 תדר עבודה) מספק פי 2.9 לערך, כח חישובי מתמטי סדר גודל עקרוני.

שזה כמעט פי 3 !

 

במצב דברים שכזה, לא פלא שקבלנו, גם הכפלת ההספק של המאיץ הגראפי ככלל, X2,

ועוד נשאר בידם מקום לתת לנו יכולת RT, וגם הקטנת הרוחב פס החיצוני, כי לא כל כך תלויים בו עוד.

 

בדור הנוכחי RDNA2, בהשוואה הסטורית, מדובר באחת מההצלחות והשיפורים האלגוריתמיים היותר מרשימים

שתועדו, במעבר מדור אחד לזה שאחריו. לא סתם ראינו שפור מגודל 65% בניצולת, ומבלי אפילו לעבור ללטוגרפיה

חדשה כן. זה בלתי נתפס. 

RDNA2 עבור הוא יותר מאשר שהיה אירוע מקסוול עבור נוידאה ב- 2014. קרי העליה הביצועית והניצולתית

באותה ליטוגרפיה הפעם (7nm), גדולה יותר בעוצמתה, מזו שמקסוול סיפקה מעל קפלר אז ב- 28nm.

אני מאד מקווה שהצלחתם להעריך את גודל ההישג, עוד ידברו עליו שנים קדימה, ינתחו אותו כרפרנס לרבולוציות

מקבילות בתעשיה, אלו שהיו ואלו שיבואו.

 

קשה לאמוד כרגע בדיוק מספק, האם הם יישרו קו בנצילות אל מול נוידיאה. מה שכן יודעים זה, ש- navi21 באמצעות

שבב בגודל 536 מ"מ, שקול ביצועית סדר גודל גס ל- ga102, שהוא בגודל 628 מ"מ, ובנוסף הוא לא צריך רוחב

פס כה גדול כמו שהשבב של נוידיאה מצריך.

 

נכון הוא הדבר ש- 7nm של מקנה יתרון כלשהו על פני 8nm של נוידאה ואל לנו להתעלם מכך, אבל

קשה מאד לדעת ברמת דיוק גבוהה, האם יש לנו שוויון ביכולות או שאחת עולה על השניה. אילו נוידאה היתה מייצרת

באותו פס יצור זהה, היה אפשר להשוות יותר בקלות כי אז זה היה תפוחים לתפוחים.

 

אילו אצטרך להמר ובמלוא הזהירות הנדרשת כמובן, כרגע על פניו נראה שהושג שוויון או קרוב לכך (פלוס מינוס).

קרי שהנצילות המשופרת של לשטח שבב, מתקזזת אל מול הנחיתות הליטוגראפית של .

נערך על-ידי nec_000
קישור לתוכן
שתף באתרים אחרים

קצת ניתוח מספרים, מניח את זה פה שכל אחד יעשה חושבים לעצמו.

 

ג'נסן אדם מאד רציני שבודק את התחרות. הוא חישב ומצא,

שאם לוקחים את השבב Navi21 בגודל 536 מ"מ רבועים, שהוא כידוע במשקל 26.8 מיליארד טרנזיסטורים,
אך מפשיטים ממנו את הזכרון מטמון (בגודל 6 מיליארד טרנזיסטורים), מדובר יהיה בהפחתה של 22.3% מסך השבב

(6 חלקי 26.8)

במקרה שכזה הוא רצה לדעת, 

מה המשמעות של גודל השבב המשורין רק לטובת המרכיב של המעבד (בלי ה- cache כאמור).

 

הוא מצא שמשקל השבב Navi (בלעדי הזכרון מטמון) הוא רק 20.8 מיליארד טרנזיסטרים  (26.8 פחות 6)

ובשטח מעשי של 416 מ"מ בלבד (שהם 22.3% פחות מ- 536).

ג'נסן החרוץ סיכם לפניו את המספרים שוב - כדי לבצע עתה השוואה מול השבב שלו GA102:
רק 20.8 מיליארד טרנזיסטורים (בלי ה- cache), בגודל 416 מ"מ רבועים (בלי ה- cache)

שמתחרה ראש בראש מול GA102 שלו, שהוא במשקל 28 מיליארד טרנזיסטורים, ובגודל 628 מ"מ.

 

ג'נסן חישב את הפערים בגדלים ומצא:

ש- 20.8 מיליארד טרנזיסטורים זה 26% פחות מהשבב שלו, ו- 416 מ"מ זה 34% קטן יותר מהשבב שלו.

אבל, שוויון כוחות ביצועי (פלוס מינוס סדר גודל) בהתעלם מרוחבי הפס, אלא רק הספק הליבה החישובית גרידא.

 

דהיינו, שאם משדכים ל- navi21 במקום cache, דווקא חצוני VRAM מהיר דיו כדי לפצות על אבדן ה- cache,

נגיד 384 או 512 סיביות, וזה אפשרי, אז התחרות של GA102 תהיה מול שהוא משמעותית יותר קטן ממנו.

 

בכמה יותר קטן ?

בערך רבע בכמות הטרנזיסטורים ושליש בשטח.

 

מניח את זה פה שכל אחד יעשה חושבים לעצמו:

האם סגרה את הפער מול נוידיאה ?

עדיין לא סגרה ?

או שאולי, יש סיכוי קלוש, שעקפה אותה ?    🤔

  

נערך על-ידי nec_000
קישור לתוכן
שתף באתרים אחרים

תגידו, 

אם חברה ממש בטוחה במוצר שלה...למה אף פעם לא מאפשרים לפרסם סקירות צד ג לפני שחרור המוצר בפועל?

 

יש המון אנשים שמחכים לסקירות כאלה בשביל להחליט לרכוש...

אם המוצר באמת כשה חזק ועומד בהבטחות..למה לא לאשר פרסום מוקדם ולהרוויח עוד קונים שמתלבטים?

קישור לתוכן
שתף באתרים אחרים

גם יש מלאים על המדף מדור קודם שצריך לחסל. בדר"כ מוציאים את המידע אודות סדרה טכנולוגית

חדשה בדקה ה- 90 כדי שלא לחבל בהמשך יכולת מכירת מלאים ישנים בחנויות.

מי שקונה את הדור הישן כשהחדש בפתח אלו הצרכנים ההדיוטיים שלא מעודכנים בתחום והמוכרים

דוחפים להם כמה שיותר מהר כשעוד אפשר. כמו שאומרים...

חבר כמעט רכש עכשיו מחשב חדש לבן עם RTX2000 במחיר האתמול היקר, ומעבד יום האתמול.

ממש בפוקס התקשר להתייעץ שניה לפני שהזמין, ומזל שעשה, חסכתי לו עוגמנת נפש וכסף.

עכשיו הוא ימתין חודש ויקנה לבן שלו RTX3000 או RX6800, עם ריזן 5000.

 

נערך על-ידי nec_000
קישור לתוכן
שתף באתרים אחרים

https://www.dsogaming.com/news/nvidia-geforce-rtx3080-godfall-4k-ultra-12gb-vram/

 

לפי המפתחים של גודפול,הוא ידרוש לפחות 12 gb של vram ב4k..

נראה שאנווידיה פספסה אותם ב"בדיקות" שהיא ערכה בין מפתחים לגבי כמות הזיכרון שנדרשת בשנים הקרובות....

 

ואגב, 12 ב4k אומר מעל 10 ב1440p,לא?

קישור לתוכן
שתף באתרים אחרים

ציטוט של amit14

https://www.dsogaming.com/news/nvidia-geforce-rtx3080-godfall-4k-ultra-12gb-vram/

 

לפי המפתחים של גודפול,הוא ידרוש לפחות 12 gb של vram ב4k..

נראה שאנווידיה פספסה אותם ב"בדיקות" שהיא ערכה בין מפתחים לגבי כמות הזיכרון שנדרשת בשנים הקרובות....

 

ואגב, 12 ב4k אומר מעל 10 ב1440p,לא?

ותהיה בטוח שאין לזה קשר לעובדה שזה חומר שיווקי של ... אה, רגע...

קישור לתוכן
שתף באתרים אחרים

אורח
דיון זה נעול לתגובות חדשות.
 Share


×
  • צור חדש...