Ray Tracing on an AMD Graphics Card ? - כרטיסי מסך - HWzone פורומים
עבור לתוכן
  • צור חשבון

Ray Tracing on an AMD Graphics Card ?


nec_000

Recommended Posts

בנוסף הם הודיעו שהם ישלבו את זה אינטגרלית בגירסה הבאה של המנוע שלהם. עד שזה יצא ועד שיבוססו עליו משחקים (3-5 שנים) כרטיסים ברמה של 56 כבר יהיו ENTRY LEVEL ו RT יהיה זמין בצורה הרבה יותר מלאה בתקווה שללא צורך בחומרה "יעודית" (כל מאיץ גרפי סביר) נראה שהולך להיות מעניין.

קישור לתוכן
שתף באתרים אחרים

ציטוט של StavBN

המצב לא היה ברור ש NVIDIA עובדת על כולנו ושזה משהו שניתן לעשות בתוכנה? (וכעת מסתבר אפילו די יעיל)

 

בגדול כרטיסי נמכרו משמעותית מתחת לציפיות. אני לא ראיתי יותר מידי כותרות\דיונים באתרי חומרה שדיברו ( בזמנו, בהשקה ) על

זה שאפשרי יהיה עם כרטיסי להפעיל אופציות כאלה..

 

לי האמת זה לא היה ברור. 

 

ככה או ככה מי שפסח על RTX עשה בשכל מכל בחינה. המחירים הזויים, והנה כבר עכשיו יש תאריכים משוערים ל 7NM מבית .

קישור לתוכן
שתף באתרים אחרים

החדשות המרעישות אודות כך ש- RT אינו תלוי בשום צורה שהיא בארכיטקטורה החדשה של נוידיאה,

זו אשר שווקה לנו כסדרה 2000, זו שעליה בקשו הון תועפות וניסו להסביר ש- RT בלעדי לסדרה זו,

 

גרמה לרעידת אדמה במשרדי נוידיאה בעקבות הדמו שהודגם מעלה שלשום.

עד כדי מריטת שערות במשרדי הנהלת החברה בקליפורניה.

 

אז לא מספיק שהם מתקשים למכור את סדרה 2000 ומדווחים על צניחה רבתי של מכירות (נו בטח, מה הם חשבו

לעצמם כשביקשו 1300$ פר כרטיס)....   אלא שעכשיו הכניסו להם מקל נוסף בגלגלים המקרטעים,

של המעט שעוד נשענו עליו כאלמנט שמדרבן צרכנים בכל זאת לרכוש סדרה 2000 - וזה RT.

שהרי הנה גם vega56 יכול לעשות זאת ואפילו ב- .

 

התגובה המידית היתה לשחרר כבר בדרייבר הקרוב את האלמנט שנועל את יכולות RT (בכל מה שאינו 2000...)

ולאפשר RT גם בכרטיסי 1000. שאף אחד לא ישלה את עצמו, לא מדובר בצירוף מקרים שזה יומיים לאחר הדמו:

זוהי תגובת חירום - כדי שלא ליצור בושה אל מול קהילת הגיימרים שראו ש- עושה את זה מעולה (ב 4K). 

 

נוידיאה נתפסה הפעם עם המכנסיים למטה תרתי משמע, והיתה חייבת (איכשהו) למזער נזקים ולהודות שגם

סדרה 1000 יכולה לעשות RT. הנה אנו רואים מה תחרות עושה, כאשר מכניסה סנוקרת מתחת לחגורה

הישר באבזם השמנמן של Jensen Huang :

 

 

 

קישור לתוכן
שתף באתרים אחרים

ציטוט של StavBN

@nec_000

המצב לא היה ברור ש NVIDIA עובדת על כולנו ושזה משהו שניתן לעשות בתוכנה? (וכעת מסתבר אפילו די יעיל)

 

עושים את החישובים במאיץ הגראפי (לא ב- CPU).

 

מה שלא היה ברור בעת השקת סדרת 2000 של נוידיאה, זה שהכוח החישובי הנחוץ למעשה קיים בכל כרטיסי

המסך שיש בשוק. נוידיאה באמצעות מסע PR משומן יפה ומצגת מטמטמת וערוכה היטב, גרמה לנו לחשוב

(בטעות כך מסתבר) שזה רק הליבות החדשות שהם פיתחו מסוגלות לבצע. ופה ההטעיה שלהם.

 

מסתבר עתה שכל (גם מדור קודם) יכולה לבצע את החישובים הנחוצים. זה הכל שאלה של קידוד ופניה מתאימה

לליבות. תקני DX12 ו- מאפשרים low level access ולכן לעשות מה שרוצים עם הליבות של המעבד הגראפי,

וזה מה שהדגימה לנו cryteck עם מנוע 5.5. היתרון המיוחצן לליבות tensor מתברר למעשה כאחיזת עיניים לחלוטין.

 

עכשיו,

אם vega56 לפי הדמו שהודגם עושה את זה, ולמיטב זכרוני המהיר הוא מאיץ מבוסס ארכיטקטורת GCN לכל דבר ועניין,

אז כל הכרטיסים של סדרה 7000 (עוד מדצמבר 2011) יכולים לעשות את זה גם. הכל שאלה של כח חישובי:

לווגה 56 יש כ- 3584 ליבות GCN בתדר עבודה טיפוסי של כ- 1500mhz  .

 

בואו רגע נבחן את השבב האנכרוניסטי Tahiti המוכר בשמו גם HD7970 -  יש בו 2048 ליבות כאלו, בתדר עבודה שעובד

יפה גם ב- 1100mhz. משמע שכרטיסי HD7970/R9-280x מחזיקים חצי מכח העיבוד/חישוב של vega56, ולכן אמורים להיות

מסוגלים לבצע את הדמו שראינו מעלה בערך במחצית ה- FPS, או לכל הפחות להתמודד נהדר עימו באם נוריד רזולוציה

מ- למשל ל- 1080P.

 

נוידיאה וה- RTX שלהם קבלו במנוע החדש של סתירת לחי מצלצלת ומהדהדת היטב אצל כל מתמטיקאי או איש

תוכנה בהשכלתו והכשרתו.  ה- של נוידיאה נחשף במערומיו תהיה הטרמינולוגיה היותר מנומסת.

 

ממה שהצלחתי להבין בזריזות, ליבות tensor (גם כן שם מפוצץ שבחרו למשהו מאד פשוט) זה כולה ליבות float point של

חצי ורבע דיוק או מה שנקרא querter precision float and half precision float.

קרי חישובי דיוק של 8  ו- 4 bit, במקום הליבות הסטנדרטיות של 16 ול- 32 bit.

 

נוידיאה רצו לאפשר למאיץ הגראפי מדור 2000 לבצע הרבה חישובי חצי ורבע דיוק פר clock, שכאשר עושים אותן

בליבות הרגילות של 16bit, אז מאבדים סתם הספק חישובי לפח. זה הכל, אין פה שום קסם או טריק מעולם אחר.

 

העניין הוא שיש אלגורתמים שמאפשרים לבצע את החישובים האלו יעיל גם בליבות 16 bit, אלא שצריך לבצע הכנה מקדימה

של הקלט לליבה, ואחרי זה פירוק יפה של התוצאה בחזרה לחלקים הקטנים.

יתכן שזה מה שעשו cryteck במנוע שלהם וכך ניצלו יעיל מאד גם ליבות מהדור הקונוונצינאלי של המאיצים הגרפים.

קרי חילצו הספק טוב גם מליבות 16bit המסורתיות באמצעות העיבוד המקדים והפירוק של הפלט לאחר מכן לחתיכות

של 4 ו- 8 סיביות בהתאמה.

 

התהליך הזנה והפירוק קצת יעמיס על ה- CPU, אך בימים שבהם 8 ליבות CPU (ועד 16) הפכו כבר לסטנדרט בשוק,

התהליך הנוסף הזה כבר לא רלוונטי ולא מפריע לאף אחד.

 

כל הכבוד לחברה מגרמניה cryteck על החשיבה היצירתית ומתן אפשרות ביצוע RT לכל כרטיסי המסך בשוק עוד מאז

ימי GCN הראשונים וכנראה גם Kepler של נוידיאה.

למעשה הם יצרו כלי פורץ דרך שזורק את ה- propriety שנוידיאה ניסו לבצע ישירות לפח האשפה, ובכך גזלו להם תוכניות

ענק לגרוף מיליארדים בשל כך.

 

שיובן - הפרס מוענק ל- cryteck ולא ל- AMD שאין להם נגיעה בנושא. אולי AMD עזרו קצת בפיתוח הקוד או במימונו

זה אפשרי, אך הגדולה היא בקוד וב- low level API שמאפשרים זאת. שאפו למי שהראה יכולת חישובי RT יעילים גם

בחומרת float 16bit precision מסורתית 👍

קישור לתוכן
שתף באתרים אחרים

ציטוט של nec_000

עושים את החישובים במאיץ הגראפי (לא ב- CPU).

כן, כמובן, וכמו שאתה יודע, גם לGPU כותבים תוכנה.

והטענה שלי מההתחלה היא שיש כאן אחיזת עיניים ושזה ניתן לביצוע על כל כרטיס מסך והתלות היא רק בכוח חישובי ולא בחומרה ייעודית.

קישור לתוכן
שתף באתרים אחרים

אכן.

 

אני מניח שכל כרטיס מסך שתומך DX12 או יכול לבצע המשימה.

למיטב זכרוני המהיר בצד של מדובר בדור כרטיסי 7000 ואילך קרי מאז דצמבר 2011,

ובצד של נוידיאה הם כתבו DX12  ו- לדור Kepler ואליך קרי ממרץ 2012  וצפונה משם.

בקיצור RT לכל המוצרים מלפני 7 שנים...

כאשר השאלה היא הכח החישובי של המאיץ - מה שיכתיב רזולוציה איכות ו- FPS .

קישור לתוכן
שתף באתרים אחרים

כן רק שמבלי להבין בקוד ובתכנות, זה לא נראה פרקטי או ריאלי ש RT ירוץ בהגדרות סבירות עם כרטיסים של היום, או פעם.

 

אין מהצד שלי ויכוח שהשקת היא meh במקרה הכי טוב, אבל זה שיהיה אפשר עוד מעט ברמת דרייבר להריץ RT עם כרטיסי

AMD או סדרה 10.. לא בטוח שזה "חדשות". אני דווקא חושב שאין בכותרת הזו יותר מידי, בדיוק כמו בהשקת ..

 

קישור לתוכן
שתף באתרים אחרים

הצפי שנראה כרטיסים נחנקים על DXR ללא האצה ייעודית. אולי מיעוט באפקטים ואיכותם יביא ל"הישג" כלשהוא. העיקר שיהיה נגיש יותר למפתחים. 

אגב האם/מתי דריברים של יאפשרו הפעלת DXR במשחקים קיימים? אם אני מבין נכון באפריל יתמכו כרטיסי פסקל ומעלה.

קישור לתוכן
שתף באתרים אחרים

האמת כשאני חושב על זה,

ב- low level api המודרניים dx12 ו- ישנה יכולת הרי לחלק את החישוב לכמה ליבות במקביל (כמה במקביל)

וכך במחשב שבו יהיו יותר ממאיץ גראפי אחד, לקבל הספק חישובי מעולה.

 

זה לא מתנהג כמו cross fire או המוכרים, ממש לא...  העסק הזה יכול להיות מדהים ומרשים.

 

למשל אפשר לתקוע במחשב אחד 4 , למנף שלושה מהם רק לחישובי RT ואחד רביעי לכל היתר - וכך לשמר הספק ביצועי גבוה.

הייתי בוחן זאת במעבדות הקידוד אצל . אם זה עובד יפה מבלי לעשות שמיניות קידוד באוויר, אז קדימה יצרנית המנוע ,

להפשיל שרוולים ולעבודה.

 

הדבר יאשר reuse במאיצים ישנים שאפשר לרכוש בכסף קטן היום במשומשים, ולקבל חתיכת מכונת חישב מדהימה.

 

למשל שלישיית 7970 רק לחישובים הללו, סה"כ 6000 ליבות GCN, ועוד כרטיס אחד חזק לתמונה הסופית.

או שלישיית 290x לכדי סה"כ 8500 ליבות GCN...

 

או רביעיית gtx770 עם 4500 ליבות kepler, ועוד כרטיס אחד חזק לתמונה הסופית.

או שלישיית gtx780ti עם 8500 ליבות...

 

אפשר גם לערבב כרטיסים משתי החברות כי שוב - dx12  ו- אדישים לכך.

 

הכרטיסים הישנים האלו נקנים היום בכסף כיס לחלוטין.

הנה מצאנו שמוש טוב לכל הזבל שזרקו ממכונות הכריה אשתקד, ולבצע בהם שמוש מושכל לחישובי RT.

 

קישור לתוכן
שתף באתרים אחרים

קצת בידיוני לחשוב ש 7970 ו 770 יעבדו במערכים לחישובי RT. לא כי תאורטית זה לא אפשרי, פשוט כי זה לא יקרה...

לצערי לא תראה אף חברה הולכת אחורה, כדי ללכת קדימה...

 

:)

 

אחלה שבת.

קישור לתוכן
שתף באתרים אחרים

לעולם כרטיס יחיד, וטוב מכך, צ'יפ יחיד יהיו עדיפים על מערכים.
בזמנו היו כרטיסי פיזיקה יעודיים, הם פרחו מהעולם מאוד מהר.
יהיה נחמד כרטיסי יראו יתרון על NV דרך הטמעה צד שלישי ל-RT, שינצלו את החלקים חסרי השימוש בהם סופסוף (אלו שכה טובים ב-compute).
NV כרגע משקיעה המון משאבים כד לאפשר לכותרים ספציפיים שימוש ב-RT, אם יצרו מנוע שרץ עם זה הכל יהיה הרבה יותר פשוט ומהיר ליישום.
הערכה זהירה שלי שללא אופטימיזציה מיוחדת הביצועים בין 2 הצדדים יהיו דומים אך אם NV תשקיע באופטימיזציה לליבות RT\DL שלהם היתרון יהיה שלהם בבירור.

קישור לתוכן
שתף באתרים אחרים

איכשהו תמיד מנסים לדפוק אותנו הצרכנים, ובתקופה האחרונה תמיד יוצאים ה-Good Boy בסיפור.

כמו ה- שמצריך חומרה ייעודית ולנגדו יש את ה-Free Sync.

כמו ה-Hyper Threading ועכשיו יש SMT.

החלפת לוחות אם כצורך בשידרוג.

עכשיו מה ? Ray Tracing

קישור לתוכן
שתף באתרים אחרים

ציטוט של omertgm

NV כרגע משקיעה המון משאבים כד לאפשר לכותרים ספציפיים שימוש ב-RT, אם יצרו מנוע שרץ עם זה הכל יהיה הרבה יותר פשוט ומהיר ליישום.

 

ביקשת קיבלת: Unity ו- משחררים גרסאות ראשוניות עם תמיכה ב DXR. 

 

קבל סרטון מעניין ברמות, בהנחית תותח אמיתי, המדגים לפרטי פרטים שימוש בפיצ'רים RT שהטמיעו במנוע UE4 עד כה + אופטימיזציות: 

 

(אגב, הוא מאשר כי Multi-GPU יתמכו בהמשך. סביר שהכרטיסים יתבקשו לתמוך ב DXR לפחות)

קישור לתוכן
שתף באתרים אחרים

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

×
  • צור חדש...