RDNA2 מעבר לסבוב, המידע הכי עדכני

פורסם 2020 באוקטובר 305 שנים

מחבר

ציטוט של captaincaveman

ב-4k, כמו שראינו מספיק פעמים, המגבלה היא כרטיס המס ולא חלקים אחרים במערכת. אני לא מדבר על דברים כמו ray tracing, אלא רק רסטריזציה. יש 20% יותר cuda cores, לפי מה שאתה אומר צריך לראות שיפור גדול יותר בביצועים בסיטאציות בהן יש רק רסטריזציה.

העלת שאלה נבונה ואני מבינך. אז אסבירה:

יהיה המצב הבא, שעובדים ברזולוציה גבוהה כפי שבקשת לתאר, כגון 4K בעומס גראפי כבד, אשר מביאה את כל

הכרטיסים המושווים זה לזה לרוויה, כך שאף אחד מהם אינו מעוכב בשל סיבה חיצונית, כדוגמתו של המחשב (זו

שתוארה בהסבר הקודם מאתמול שנתתי בשרשור זה).

קרי אנו מבקשים להסביר, מדוע שני כרטיסים בפער חומרתי X, אינם מצליחים להפגין פער ביצועי לינארי בגודל X בפועל.

יהיה הכרטיס 3090 מושווה אל מול הכרטיס 3080.

הפער החומרתי בינהם הוא כ- 20%, אך בפועל הפער הביצועי כפי שרואים הוא טיפוסית רק 10%.

נבקש להתחקות אחר התופעה ולהבין, מדוע הפער הביצועי הזה מתרחש, אף כאשר העומס הגראפי הוא ב- load

מלא על שני הכרטיסים.

ברמה האבסטרקטית, עבוד תמונה גראפי מורכב משני שלבים עקרוניים. השלב הראשון הוא שלב החישוב הגאומטרי,

והשלב השני הוא רנדור התמונה, ציורם של הפיקסלים על האוביקטים הגאומטריים שחושבו בשלב הקודם.

עכשיו נשים לב לדבר הבא:

הפער החומרתי שבין 3080 ל- 3090 ברובד יחידות הרסטריזציה, להלן השיידרים, הוא 20%, אבל היחס החומרתי שבין

הכרטיסים הללו ברובד הגאומנטרי נותר על 1 ל- 1. המרכיב הגאומטרי לא קוצץ בליבת 3080 והוא זהה בהספקו

החישובי לזה שקיים בליבה המלאה GA102.

כאשר יצרני כרטיסי מסך מבצעים קיצוץ לליבות גראפיות (על מנת לסגמנט כמה רמות של מוצרים מאותה פיסת סיליקון)

הקיצוץ נעשה ברובד כמות יחידות העבוד הרסטריזציוני, וברוחב פס הזכרון, ולא במרכיב הגאומטרי, שבו קשה לביצוע

קיצוץ דומה. מדובר במעט מאד יחידות גאומטריות, לרוב 2 עד 8, והרכב טכני שמקשה על השמטת מי מהם החוצה

מהשרשרת.

עכשיו,

בהנתן עומס גראפי במשחק, שבו המרכיב הגאומטרי מצוי ברוויה, אך לכרטיס ישנה יתרת כושר עובד רסטריזציה/ציור

פיקסלים, יווצר מצב, שהרכיב שמצייר את הפיקסלים (שלב שני בתהליך העבוד תמונה) לא יהיה ב- load מלא אלא

בהמתנה לשלב הקודם.

במקרה שכזה, לא משנה כמה תוספת כח עבודי נוסיף לשלב הציור (20% לדוגמא), חלק מהתוספת הזו לא תוכל לבוא

לידי ביטוי. במקרים שכאלו המרכיב הציורי מעוכב על ידי המרכיב הגאומטרי.

בעת הזו כבר למדנו לאור הסקירות הנתונים והבנצ'ים השונים, שבדור 3000 נוידיאה שינתה את היחס בין המרכיב

הגאומטרי למרכיב הציורי שבמעבד הגראפי לעומת הדור הקודם. היא עיבתה מאד את המרכיב הציורי, אך ליוותה אותו

בעיבוי קטן יותר ברובד הגאומטרי. כתוצאה מכך נוצרה תופעה, שבה סדרה 3000 מתקשה לספק שפור משמעותי

על פני הדור הקודם ברזלוציות נמוכות (שבהם המרכיב הציורי פחות משחק תפקיד בעוד שהמרכיב הגאומטרי הוא זה

שעובד קשה) ומנגד היא מצליחה להביא את השפור המרשים דווקא ברזולוציות הגבוהות (4K) שבהן העומס הציורי

עולה בשעה שהעומס הגאומטרי נשאר זהה לזה שברזולוציות הנמוכות.

השינוי הזה שנוידיאה יצרה ב- balance של סדרה 3000 מוביל לתופעות מעניינות שאנו חובים אותן בשטח.

נוידיאה בחרה ביחס הזה מן הסתם לאחר שחקרה ובדקה מה הלך הרוח בשוק המנועים הגראפיים העדכני וזה

שצפוי לבוא בהמשך, והסיקה, שהעומס הציורי יגדל יותר מאשר העומס הגאומטרי, ולכן בחרה את היחס החדש שבו

בחרה. השינוי balance הזה מוביל לא לאחת לתופעות של חוסר נצילות בעליה מליבה של 3080 לזו של 3090.

אפשר לומר אחרת, שהיחס שהם בחרו הוא אופטימאלי יותר (כיום) במקרה של הליבה של 3080, מאשר בזאת של

3090, ולכן זה לא ש- 3090 פחות מהיר מאותם 20 אחוזים שציפינו להם, אלא זה ש- 3080 סופג פחות עונשין

מאותם 20% הפחתת חומרה. זאת בשל התקרבות טובה יותר של 3080 לאופטימום שנוידיאה חישבה.

בכל דור ודור האופטימום יוצר לנו efficiency שונה בין מעבדים גראפיים ב- stack של אותו דור.

בדור הזה 3080 יותר מאוזן כנראה מ- 3090. הדבר יכול להשתנות בהמשך, באם המנועים הגראפיים שיבואו,

ישנו את הדרישות והיחס, שהם בתורם משיתים על העבוד הגראפי.

נערך 2020 באוקטובר 305 שנים על-ידי nec_000

פורסם 2020 באוקטובר 305 שנים

מחבר

טוב,

אז יש כבר עוד מידע חשוב ומעניין, כמו למשל שהשבב החדש Navi21 הוא בגודל של 536 מ"מ רבועים.

כבר ידענו שהוא באזור 500 פלוס, אבל לא ידענו בדיוק כמה. עכשיו יודעים.

להשוואה Navi10 הקודם = rx5700 היה שבב באותה ליטוגרפיה, ובגודל 251 מ"מ.

משמע שהכפילו את גודל השבב פי 2.13 למען הדיוק.

מבחינת כמות טרנזיסטורים, עלו מ- 10.3 מיליארד ל- 26.8 .

משמע שמדובר בעליה של פי 2.6 בטרנזיסטורים.

זו העלאת הנצילות לשטח שבב בגודל (2.6 העליה בטרנזיסטורים, חלקי 2.13 הגידול בשטח) = 22% יותר טרנזיסטורים

למ"מ רבוע. מרשים מאד לאור העובדה שהליטוגרפיה נותרה בעצם זהה.

העליה הזו נובעת מכך, שהנצולת התכנונית מבחינה גאוגראפית ב- navi החדש טובה יותר מקודם. מצליחים לדחוס

יותר טרנזיסטורים ליחידת שטח. קרי מבזבזים פחות שטח. יודגש כי לא שונתה הליטוגרפיה והם עדיין מיצרים באותו

7nm דור ראשון של TSMC. הליטוגרפיה מוכחת וותיקה אמינה וזולה ביחס לחדישות יותר, ולכן בחרו להשתמש בה.

כלומר, שכל התוספת הזו בטרנזיסטורים ליחידת שטח מבוססת אך ורק על תכנון גאוגראפי מוצלח יותר בשבב החדש,

וכנראה גם בזכות הטמעת ה- cache שהוא מטבעו מאוד צפוף ואינו מבזבז שטח יקר, אלא יושב על השטח בניצול

אפקטיבי. הדבר וודאי תורם גם את חלקו לעלייה הממוצעת בטרזיסטורים לתא שטח.

כמו כן קבלנו דיאגרמה מלאה של המחלקות השונות במעבד הגראפי, מיקום, סדר, היררכיה, והדבר החדש והמדליק

שהוא ה- cache הענק, כיצד ממשו אותו כטבעת עוטפת את כל המעבד (לקישוריות מהירה ורחבה, בשל קו השקה

ארוך מחד, וכנראה גם כדי לייצר מרחקים קרובים ושווים ככל שניתן, לכל אחד מרכיבי המעבד, לחסכון באבדן זמן על

עכבה).

https://www.techpowerup.com/gpu-specs/amd-navi-21.g923

צילום הסיליקון עצמו - כך זה נראה :

ארצה לסכם לנו משהו מספרי שנבין:

קבלנו תוספת של פי 2.6 טרנזיסטורים, ועוד משהו כמו סביבות 10% סדר גודל עקרוני בתדר עבודה הטיפוסי

לעומת הדור הקודם. הנוכחי עובד על ממוצע (כנראה) סביב 2.1-2.15Ghz, הקודם rx5700 סביבות 1.95Ghz.

שילוב שניהם (2.6 יותר טרנזיסטורים כפול 1.1 תדר עבודה) מספק פי 2.9 לערך, כח חישובי מתמטי סדר גודל עקרוני.

שזה כמעט פי 3 !

במצב דברים שכזה, לא פלא שקבלנו, גם הכפלת ההספק של המאיץ הגראפי ככלל, Navi X2,

ועוד נשאר בידם מקום לתת לנו יכולת RT, וגם הקטנת הרוחב פס זכרון החיצוני, כי לא כל כך תלויים בו עוד.

בדור הנוכחי RDNA2, בהשוואה הסטורית, מדובר באחת מההצלחות והשיפורים האלגוריתמיים היותר מרשימים

שתועדו, במעבר מדור אחד לזה שאחריו. לא סתם ראינו שפור מגודל 65% בניצולת, ומבלי אפילו לעבור ללטוגרפיה

חדשה כן. זה בלתי נתפס.

RDNA2 עבור AMD הוא יותר מאשר שהיה אירוע מקסוול עבור נוידאה ב- 2014. קרי העליה הביצועית והניצולתית

באותה ליטוגרפיה הפעם (7nm), גדולה יותר בעוצמתה, מזו שמקסוול סיפקה מעל קפלר אז ב- 28nm.

אני מאד מקווה שהצלחתם להעריך את גודל ההישג, עוד ידברו עליו שנים קדימה, ינתחו אותו כרפרנס לרבולוציות

מקבילות בתעשיה, אלו שהיו ואלו שיבואו.

קשה לאמוד כרגע בדיוק מספק, האם הם יישרו קו בנצילות אל מול נוידיאה. מה שכן יודעים זה, ש- navi21 באמצעות

שבב בגודל 536 מ"מ, שקול ביצועית סדר גודל גס ל- ga102, שהוא שבב בגודל 628 מ"מ, ובנוסף הוא לא צריך רוחב

פס זכרון כה גדול כמו שהשבב של נוידיאה מצריך.

נכון הוא הדבר ש- 7nm של TSMC מקנה יתרון כלשהו על פני 8nm של נוידאה ואל לנו להתעלם מכך, אבל

קשה מאד לדעת ברמת דיוק גבוהה, האם יש לנו שוויון ביכולות או שאחת עולה על השניה. אילו נוידאה היתה מייצרת

באותו פס יצור זהה, היה אפשר להשוות יותר בקלות כי אז זה היה תפוחים לתפוחים.

אילו אצטרך להמר ובמלוא הזהירות הנדרשת כמובן, כרגע על פניו נראה שהושג שוויון או קרוב לכך (פלוס מינוס).

קרי שהנצילות המשופרת של navi לשטח שבב, מתקזזת אל מול הנחיתות הליטוגראפית של סמסונג.

נערך 2020 באוקטובר 305 שנים על-ידי nec_000

פורסם 2020 באוקטובר 305 שנים

מחבר

קצת ניתוח מספרים, מניח את זה פה שכל אחד יעשה חושבים לעצמו.

ג'נסן אדם מאד רציני שבודק את התחרות. הוא חישב ומצא,

שאם לוקחים את השבב Navi21 בגודל 536 מ"מ רבועים, שהוא כידוע במשקל 26.8 מיליארד טרנזיסטורים,
אך מפשיטים ממנו את הזכרון מטמון (בגודל 6 מיליארד טרנזיסטורים), מדובר יהיה בהפחתה של 22.3% מסך השבב

(6 חלקי 26.8)

במקרה שכזה הוא רצה לדעת,

מה המשמעות של גודל השבב המשורין רק לטובת המרכיב של המעבד (בלי ה- cache כאמור).

הוא מצא שמשקל השבב Navi (בלעדי הזכרון מטמון) הוא רק 20.8 מיליארד טרנזיסטרים (26.8 פחות 6)

ובשטח מעשי של 416 מ"מ בלבד (שהם 22.3% פחות מ- 536).

ג'נסן החרוץ סיכם לפניו את המספרים שוב - כדי לבצע עתה השוואה מול השבב שלו GA102:
רק 20.8 מיליארד טרנזיסטורים (בלי ה- cache), בגודל 416 מ"מ רבועים (בלי ה- cache)

שמתחרה ראש בראש מול GA102 שלו, שהוא במשקל 28 מיליארד טרנזיסטורים, ובגודל 628 מ"מ.

ג'נסן חישב את הפערים בגדלים ומצא:

ש- 20.8 מיליארד טרנזיסטורים זה 26% פחות מהשבב שלו, ו- 416 מ"מ זה 34% קטן יותר מהשבב שלו.

אבל, שוויון כוחות ביצועי (פלוס מינוס סדר גודל) בהתעלם מרוחבי הפס, אלא רק הספק הליבה החישובית גרידא.

דהיינו, שאם משדכים ל- navi21 במקום cache, דווקא זכרון חצוני VRAM מהיר דיו כדי לפצות על אבדן ה- cache,

נגיד 384 או 512 סיביות, וזה אפשרי, אז התחרות של GA102 תהיה מול שבב שהוא משמעותית יותר קטן ממנו.

בכמה יותר קטן ?

בערך רבע בכמות הטרנזיסטורים ושליש בשטח.

מניח את זה פה שכל אחד יעשה חושבים לעצמו:

האם AMD סגרה את הפער מול נוידיאה ?

עדיין לא סגרה ?

או שאולי, יש סיכוי קלוש, שעקפה אותה ?

נערך 2020 בנובמבר 15 שנים על-ידי nec_000

פורסם 2020 באוקטובר 305 שנים

מחבר

סקירה מעניינת ובחינת המצב בזירה - מקשר לשניה שבו מתחיל התכלס, חוסך לכם את הפתיח המיותר:

פורסם 2020 בנובמבר 15 שנים

מחבר

סרטון מעניין בנוגע ל- RT :

פורסם 2020 בנובמבר 15 שנים

מה מעניין בו? הוא לא ממש אומר כלום כי כמונו, הוא לא יודע כלום על RT של AMD.

פורסם 2020 בנובמבר 15 שנים

ולצטט:
"the difference may in fact be, at the end of the day, if AMD have caught up. It's all gonna be about how well, or how poorly, their ray tracing works"

נערך 2020 בנובמבר 15 שנים על-ידי captaincaveman

פורסם 2020 בנובמבר 15 שנים

תגידו,

אם חברה ממש בטוחה במוצר שלה...למה אף פעם לא מאפשרים לפרסם סקירות צד ג לפני שחרור המוצר בפועל?

יש המון אנשים שמחכים לסקירות כאלה בשביל להחליט לרכוש...

אם המוצר באמת כשה חזק ועומד בהבטחות..למה לא לאשר פרסום מוקדם ולהרוויח עוד קונים שמתלבטים?

פורסם 2020 בנובמבר 15 שנים

כמה שפחות מידע בידיים של המתחרים שלך, יותר טוב בשבילך.

פורסם 2020 בנובמבר 15 שנים

מחבר

גם יש מלאים על המדף מדור קודם שצריך לחסל. בדר"כ מוציאים את המידע אודות סדרה טכנולוגית

חדשה בדקה ה- 90 כדי שלא לחבל בהמשך יכולת מכירת מלאים ישנים בחנויות.

מי שקונה את הדור הישן כשהחדש בפתח אלו הצרכנים ההדיוטיים שלא מעודכנים בתחום והמוכרים

דוחפים להם כמה שיותר מהר כשעוד אפשר. כמו שאומרים...

חבר כמעט רכש עכשיו מחשב חדש לבן עם RTX2000 במחיר האתמול היקר, ומעבד יום האתמול.

ממש בפוקס התקשר להתייעץ שניה לפני שהזמין, ומזל שעשה, חסכתי לו עוגמנת נפש וכסף.

עכשיו הוא ימתין חודש ויקנה לבן שלו RTX3000 או RX6800, עם ריזן 5000.

נערך 2020 בנובמבר 15 שנים על-ידי nec_000

פורסם 2020 בנובמבר 15 שנים

מחבר

מצאתי מקום עם גראפים יותר מפורטים למה שהראו לנו. עכשיו יש קצת פירוט:

https://www.notebookcheck.net/Gaming-benchmarks-reveal-that-the-AMD-Radeon-RX-6800-RX-6800-XT-and-RX-6900-XT-conquer-NVIDIA-GeForce-cards-at-1440p-and-4K.500951.0.html

פורסם 2020 בנובמבר 25 שנים

היו גם בדיקות על מערכת אינטל (ללא תמיכה בpcie4) ?

מעניין לדעת אם לכרטיסים של amd יהיה צוואר בקבוק גדול יותר מnvidia בשימוש בpcie3..

פורסם 2020 בנובמבר 25 שנים

מחבר

pci-e לא משנה אם הוא גרסא 3 או 4 עבור כרטיסי מסך.

*גם גרסא 2 לא ממש משפיע על כלום.

פורסם 2020 בנובמבר 35 שנים

https://www.dsogaming.com/news/nvidia-geforce-rtx3080-godfall-4k-ultra-12gb-vram/

לפי המפתחים של גודפול,הוא ידרוש לפחות 12 gb של vram ב4k..

נראה שאנווידיה פספסה אותם ב"בדיקות" שהיא ערכה בין מפתחים לגבי כמות הזיכרון שנדרשת בשנים הקרובות....

ואגב, 12 ב4k אומר מעל 10 ב1440p,לא?

פורסם 2020 בנובמבר 35 שנים

ציטוט של amit14

https://www.dsogaming.com/news/nvidia-geforce-rtx3080-godfall-4k-ultra-12gb-vram/

לפי המפתחים של גודפול,הוא ידרוש לפחות 12 gb של vram ב4k..

נראה שאנווידיה פספסה אותם ב"בדיקות" שהיא ערכה בין מפתחים לגבי כמות הזיכרון שנדרשת בשנים הקרובות....

ואגב, 12 ב4k אומר מעל 10 ב1440p,לא?

ותהיה בטוח שאין לזה קשר לעובדה שזה חומר שיווקי של AMD... אה, רגע...

RDNA2 מעבר לסבוב, המידע הכי עדכני

Featured Replies

ארכיון

דיונים חדשים

מסך 5K רחב (Dell UltraSharp U4025QW), בכמה שונה ממסך 4K רגיל (לא רחב)?

מחשב מרעיש מאוד בזמן משחקים

ייעוץ לקניית מחשב נייד לסטודנט למדעי החברה

חוות דעת על מפרט מחשב נייח חזק לגיימינג, פיתוח משחקים, ואימון AI - תקציב גמיש (18K+)

לא מצליחה לגלוש באתרי מסחר אלקטרוני ישראליים

כתבות אחרונות

סוני מוחקת מאות סרטים מספריית הפלייסטיישן: תזכורת חדה לכך שאינכם הבעלים של התוכן שקניתם

טסים בקרוב? ג'מיני יפתור לכם את הג'ט לג – אם רק תתנו לו את המפתחות למייל

יש גם בלבן – ניסינו מסך OLED מדגם MO27Q2A ICE של GIGABYTE

ה-4K OLED נעשה זול יותר – ניסינו את MO32U24 של GIGABYTE

שווה את החיסכון? בדקנו את כרטיס המסך Radeon RX 9070 GRE

מיקרוסופט זונחת את האפליקציות ואת ווינדוס לטובת סוכני ענן חכמים – הכירו את Solara, מערכת הפעלה עבור סוכני AI

Account

Navigation

חיפוש

Configure browser push notifications

Chrome (Android)

Chrome (Desktop)

Safari (iOS 16.4+)

Safari (macOS)

Edge (Android)

Edge (Desktop)

Firefox (Android)

Firefox (Desktop)

עקבו אחרינו ברשתות

ארכיון

Configure browser push notifications

Chrome (Android)

Chrome (Desktop)

Safari (iOS 16.4+)

Safari (macOS)

Edge (Android)

Edge (Desktop)

Firefox (Android)

Firefox (Desktop)