הדיון הראשי על פרוייקט Larrabee, מאיץ ה3D של Intel - עמוד 4 - כרטיסי מסך - HWzone פורומים
עבור לתוכן
  • צור חשבון

הדיון הראשי על פרוייקט Larrabee, מאיץ ה3D של Intel


alex.turovsky

Recommended Posts

משמרת לילה במוקד מ23 עד 8:00 . . . ארוךךךךךךך . . . אחרי שסיימתי את מה שהיה צריך לעשות בעבודה ולא היו שיחות מלקוחות, היה קצת זמן להעשיר את הידע. ב5 בבוקר מצאתי דברים מאוד מעניינים ומדהימים שסוף סוף לא רק מסבירים מה זה RAY TRACING אלא גם מדגימים איך משחק שנראה מדהים מבחינה גרפית כQUAKE 4 הופך למדהים עוד יותר כאשר הבחור מתכנת אותו ב RAY TRACING. כתבה מדהימה. אם זה יוצא לפועל והמשחקים ייראו כמו שהוא מראה בסרטי הוידאו הרי שאני מצדיע לאינטל על זה שקודם כל שכרה אותו ושנית שיש לה ביצים של בת יענה להכניס את הטכנולוגיה לשוק הרחב ולאנוס מפתחים להשתמש בה בעתיד.

המשחקים כיום בנויים על עקרון הפוליגונים(מצולעים אשר מהם מורכבת סצינה תלת מימדית). רעיון מקורי שהולך וצובר תאוצה הוא RAY RACING, דרך שונה לתכנת ולבנות סצינה תלת מימדית. אינטל מבססת את כל קו כרטיסי המסך החדשים שלה על רעיון חדש שאותו הציג באופן היפה ביותר סטודנט בשם דניאל פול בעת שלמד לתואר שלו באוניברסיטה:

http://www.theinquirer.net/en/inquirer/news/2006/12/19/quake-4-gets-ray-traced

אף אחד לא רצה לדבר איתו על זה עד ש (למה רק באינטל יש אנשים חכמים, זו תעלומה בעיניי) אינטל פשוט חטפה אותו אליה ומעסיקה אותו כעת במעבדה למחקר אפליקציות (משחקים):

http://www.theinquirer.net/en/inquirer/news/2007/04/03/intel-hires-quake-4-ray-trace-guy

זו הכתבה המקורית שפירסם הבחור

חובה לראות את קטעי הוידאו בכתבה. התאורה, הצללים, המים שהוא תיכנת עם RT פשוט נראה מדהים ומאפשר לנו לראות איך המשחקים ייראו בעתיד. מה שחשוב עוד יותר שהוא מראה שקצב הFPS יורד רק ב1/4(רבע) עקב המעבר ל RT ושמעבד מרובע ליבה סוף סוף ימצא את מקומו עם RT כאשר כל ליבה תופקד על חישוב רבע מהסצינה והמשחק יטוס בשילוב עם הליבות הנוספות של הכרטיס הגרפי שיעבדו אפקטי הצללה,מרקם,וכדומה !:

http://www.pcper.com/article.php?aid=334&type=expert&pid=1

מה שיותר מדהים ששנייה אחרי זה אני קורא ראיון עם בכיר בתעשיית המשחקים ב TOMS HARDWARE, המפתח של מנוע המשחק UNREAL האגדי שאומר שDIRECTX יבוטל כליל כנראה בעוד שנה פלוס ויעברו לשימוש בטכניקות עוקפות DX10 המסתמכות על מה? נכון על RAY TRACING. הראיון:

http://www.tomshardware.com/2008/03/11/tim_sweeney_part_2_directx_10_is_the_last_relevant_graphics_api_/index.html

קישור לתוכן
שתף באתרים אחרים

  • תגובות 436
  • נוצר
  • תגובה אחרונה

משתתפים בולטים בדיון

משתתפים בולטים בדיון

בהחלט מרשים... אבל הוא לא הראה הבדלים יוצאים מגדר הרגיל בQ4.. אבל יפה שהוא לקח את זה על עצמו...

אני מנייח שצריך לעבוד הרבה על הטכנולוגייה הזאות בשביל לקבל תוצאות טובות.. אהבתי שאפשר לנצל מעבדים עם מספר רב של ליבות, אולי סוף סוף נימצא עוד שימושים למרובעי חוץ מגרפיקה ועריכת ווידיאו...

קישור לתוכן
שתף באתרים אחרים

זו הכתבה המקורית שפירסם הבחור

חובה לראות את קטעי הוידאו בכתבה. התאורה, הצללים, המים שהוא תיכנת עם RT פשוט נראה מדהים ומאפשר לנו לראות איך המשחקים ייראו בעתיד. מה שחשוב עוד יותר שהוא מראה שקצב הFPS יורד רק ב1/4(רבע) עקב המעבר ל RT ושמעבד מרובע ליבה סוף סוף ימצא את מקומו עם RT כאשר כל ליבה תופקד על חישוב רבע מהסצינה והמשחק יטוס בשילוב עם הליבות הנוספות של הכרטיס הגרפי שיעבדו אפקטי הצללה,מרקם,וכדומה !:

אני היחיד שטורך לקרוא את האותיות הקטנות? אכן מאמר מרשים, תמונות יפות, רעיון יפה (אבל ממש לא מקורי), המספרים שהוא מציג קצת מבושלים (כל מי שכתב תיזה או מאמר יכול להבין את זה) ונא לשים לב לפרטים בגוף הטקסט ולא לגרפים - מדובר ב-FPS בהפרדה של 256*256, שזה פי 35 פחות פיקסלים מתצוגת HD מלאה, לפי דעתי מדובר גם ב-best case scenario.

עדיין, אם להסתמך על המאמר הזה - אכן מרשימה עם המון פוטנציאל.

באינטרפולציה גסה ובהנחה שהבחור השתמש במעבד עם בערך 30GFLOPS לניסויים שלו (Q6600 לדוגמא), הצגה של משחק מורכב עם נופים פתוחים כמו קרייסיס בהפרדה של HD ובקצב פריימים מינימלי של 50FPS (ואני אפילו מפחית כאן 90% - לטובת אלגוריתם עתידי יעיל יותר משמעותית) דורשת לפחות 1000GFLOP (כאמור - הפחתתי 90% לטובת אלגוריתם יעיל יותר, אבל מניסיוני רינדור תמונה באוויר הפתוח כולל אפקטים אטמוספריים בסיסיים מסבכים חישובי RT פי 3 ויותר - הרבה יותר). הווה אומר כוח עיבוד המקביל לכוח העיבוד הגולמי הצפוי של ה-9800 הקרב ובא.

אבל חשוב לציין שמדובר כאן ב-best case scenario המתבסס על כך שהנתונים של הבחור הגרמני קרובים למציאות, על סצינות פשוטות בלי יותר מדי אפקטים אטמוספריים ומקורות אור ועל אלגוריתם יעיל באופן יותא מהכלל. בנוסף, על מנת לנצל את אותו כוח עיבוד גולמי אדיר הדרוש לחישובי RT בזמן אמת, יש צורך ברוחב פס לזיכרון שעדיין לא נראה כמותו - כל מי שמבין מעט במחשבי-על ובחישוב מקבילי יודע שרוחב פס לזיכרון הוא גורם מגביל משמעותי.

קישור לתוכן
שתף באתרים אחרים

^^^

כפי שכבר כתבתי - ייתכן מאוד ולמחשב הגרפי של יהיה את כוח החישוב הגולמי הדרוש . אולם עדיין יש להתגבר על בעיית רוחב הפס לזיכרון וליצור אלגוריתמים יעילים יותר ממה שיש היום.

המעניין הוא, שלפי הנתונים שהבחור ההוא הציג, גם מעבד גרפי עם כוח כמו של ה-9800 יוכל לבצע חישובי Ray tracing בזמן אמת. אני חושד שנתוני ה-FPS שהוצגו מתייחסים לסצנות מאוד פשוטות, בלי ריבוי מקורות אור, שבירת והחזרת אור ובלי אפקטים אטמוספריים.

קישור לתוכן
שתף באתרים אחרים

ה GPU ילך ויעלם, רק שאולי העיבוד הגרפי יתבצע ,על 32 או 64 מעבדים של אינטל, שאולי יוכלו לבצע RENDER ברזלוציה גבוהה ,כרגע זה בגדר חלומי בלבד

למחשב הבייתי.

אציין שראיתי ב YOUTUBE כתבה על מעבדי CELL של IBM ,שלקחו 8 מעבדים שכל אחד בנוי מ 8 ליבות ,והצליחו להריץ מודל של מכונית ברינדור מלא ברזולוציה של HD.

תסתכלו בלינק יש הסבר יפה מאוד

http://video.google.com/videoplay?docid=735886583686737366&q=ibm+cell&total=60&start=0&num=10&so=0&type=search&plindex=0

אבל רק מודל אחד בזמן אמת .נניח שנרצה מספר מודלים באותו רינדור ,נצטרך למאות כאלו.

ולפי דעתי בעוד מספר שנים זה יהיה אפשרי רק בשילוב של CPU AND GPU ,הכוונה שילוב של עולם בנוי ע"י כרטיס גרפי ,ומודולים ע"י ריבוי ליבות

קישור לתוכן
שתף באתרים אחרים

בארכיטקטורה המקובלת היום למחשבים ביתיים, אין עדיין מקום לאיחוד מלא בין ה-CPU וה-GPU. ה-CPU היום עסוק מאוד בחישובים כלליים שונים, ניהול התקנים, IO, מולטימדיה ועוד. כל התוכנות היום בשוק למחשבים אישיים מהודרים בסופו של דבר לשפת סף מורכבת עם המון תוספות. המיועדים לטחון FLOPS לא יודעים להתמודד עם המשימות האלו ללא overhead מטורף.

ייתכן ונראה בעתיד שבבים משולבים רבי עוצמה עם ליבות לא אחידות - חלקן לעיבודים כלליים (CPU) וחלקן לעיבודים גרפיים או טחינת מספרים (GPU).

קישור לתוכן
שתף באתרים אחרים

אם אתה מדבר על המכונית הזאת

http://video.google.com/videoplay?docid=735886583686737366&q=ibm+cell&total=60&start=0&num=10&so=0&type=search&plindex=0

זה בעצם 3 PS3 שמריצים ומחוברים ביחד עם איזה ראוטר

בכל מקרה 3 מ18 (6 כפול 3) מכווצים את התמונה כדי למנוע צוואר בקבוק של הראוטר הזה

בכל מקרה רק להשוואה

קח PS3 אחד

תגדיר את המהירות שלו פי 1.5 (2 במקרים מסויימים)

תכפיל את כמות הליבות שלו ב4

וקיבלת לרבי עם 24 ליבות

קישור לתוכן
שתף באתרים אחרים

בארכיטקטורה המקובלת היום למחשבים ביתיים, אין עדיין מקום לאיחוד מלא בין ה-CPU וה-GPU. ה-CPU היום עסוק מאוד בחישובים כלליים שונים, ניהול התקנים, IO, מולטימדיה ועוד. כל התוכנות היום בשוק למחשבים אישיים מהודרים בסופו של דבר לשפת סף מורכבת עם המון תוספות. מעבדים המיועדים לטחון FLOPS לא יודעים להתמודד עם המשימות האלו ללא overhead מטורף.

ייתכן ונראה בעתיד שבבים משולבים רבי עוצמה עם ליבות לא אחידות - חלקן לעיבודים כלליים (CPU) וחלקן לעיבודים גרפיים או טחינת מספרים (GPU).

מעבדי ה nehalem בגירסאת ה Havendale ו Auburndale יגיעו עם GPU מובנה בתוכם (צפויים לצאת ברבעון שני של 2009). גם רכשה בסוף שנה שעברה 2 חברות שמתמחות באיך לאחד מבחינת תכנות / API את כל הנושא של CPU/GPU.

קישור לתוכן
שתף באתרים אחרים

הGPU המובנה בCELL הוא רק תחליף לכרטיס מסך מובנה

הוא גם יהיה חלש ממנו זה רק בשביל לאפשר תצוגה על המסך

במובן הזה נחלם דיי דומה לCELL בכך שהוא מאפשר עיבוד גרפי על המעבד הראשי

קישור לתוכן
שתף באתרים אחרים

מעבדי ה nehalem בגירסאת ה Havendale ו Auburndale יגיעו עם GPU מובנה בתוכם (צפויים לצאת ברבעון שני של 2009). גם רכשה בסוף שנה שעברה 2 חברות שמתמחות באיך לאחד מבחינת תכנות / API את כל הנושא של CPU/GPU.

כל השמות האלה משגעים אותי. תזכירו לי מה בדיו מביא איתו NEHALE> הזה, עכשיו זה פנרין או משהו לא? חשבתי נראה קור2... אני לא אוהב לחפור בשמות יותר מדיי, אז תסלחו לי ;D

קישור לתוכן
שתף באתרים אחרים

לא ראית אחינו? זה מופיע בפוסט הראשי תחת "תאריכי השקה משוערים". ;)

חדשות. עוד כתבה על הנושא:

http://arstechnica.com/articles/paedia/hardware/clearing-up-the-confusion-over-intels-larrabee.ars/1

קישור לתוכן
שתף באתרים אחרים

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.


×
  • צור חדש...