עבור לתוכן

הדיון הראשי על פרוייקט Larrabee, מאיץ ה3D של Intel

Featured Replies

פורסם
  • מחבר

משמרת לילה במוקד מ23 עד 8:00 . . . ארוךךךךךךך . . . אחרי שסיימתי את מה שהיה צריך לעשות בעבודה ולא היו שיחות מלקוחות, היה קצת זמן להעשיר את הידע. ב5 בבוקר מצאתי דברים מאוד מעניינים ומדהימים שסוף סוף לא רק מסבירים מה זה RAY TRACING אלא גם מדגימים איך משחק שנראה מדהים מבחינה גרפית כQUAKE 4 הופך למדהים עוד יותר כאשר הבחור מתכנת אותו ב RAY TRACING. כתבה מדהימה. אם זה יוצא לפועל והמשחקים ייראו כמו שהוא מראה בסרטי הוידאו הרי שאני מצדיע לאינטל על זה שקודם כל שכרה אותו ושנית שיש לה ביצים של בת יענה להכניס את הטכנולוגיה לשוק הרחב ולאנוס מפתחים להשתמש בה בעתיד.

המשחקים כיום בנויים על עקרון הפוליגונים(מצולעים אשר מהם מורכבת סצינה תלת מימדית). רעיון מקורי שהולך וצובר תאוצה הוא RAY RACING, דרך שונה לתכנת ולבנות סצינה תלת מימדית. אינטל מבססת את כל קו כרטיסי המסך החדשים שלה על רעיון חדש שאותו הציג באופן היפה ביותר סטודנט בשם דניאל פול בעת שלמד לתואר שלו באוניברסיטה:

http://www.theinquirer.net/en/inquirer/news/2006/12/19/quake-4-gets-ray-traced

אף אחד לא רצה לדבר איתו על זה עד ש (למה רק באינטל יש אנשים חכמים, זו תעלומה בעיניי) אינטל פשוט חטפה אותו אליה ומעסיקה אותו כעת במעבדה למחקר אפליקציות (משחקים):

http://www.theinquirer.net/en/inquirer/news/2007/04/03/intel-hires-quake-4-ray-trace-guy

זו הכתבה המקורית שפירסם הבחור

חובה לראות את קטעי הוידאו בכתבה. התאורה, הצללים, המים שהוא תיכנת עם RT פשוט נראה מדהים ומאפשר לנו לראות איך המשחקים ייראו בעתיד. מה שחשוב עוד יותר שהוא מראה שקצב הFPS יורד רק ב1/4(רבע) עקב המעבר ל RT ושמעבד מרובע ליבה סוף סוף ימצא את מקומו עם RT כאשר כל ליבה תופקד על חישוב רבע מהסצינה והמשחק יטוס בשילוב עם הליבות הנוספות של הכרטיס הגרפי שיעבדו אפקטי הצללה,מרקם,וכדומה !:

http://www.pcper.com/article.php?aid=334&type=expert&pid=1

מה שיותר מדהים ששנייה אחרי זה אני קורא ראיון עם בכיר בתעשיית המשחקים ב TOMS HARDWARE, המפתח של מנוע המשחק UNREAL האגדי שאומר שDIRECTX יבוטל כליל כנראה בעוד שנה פלוס ויעברו לשימוש בטכניקות עוקפות DX10 המסתמכות על מה? נכון על RAY TRACING. הראיון:

http://www.tomshardware.com/2008/03/11/tim_sweeney_part_2_directx_10_is_the_last_relevant_graphics_api_/index.html

  • תגובות 436
  • צפיות 85.9k
  • נוצר
  • תגובה אחרונה

משתתפים בולטים בדיון

פורסם

בהחלט מרשים... אבל הוא לא הראה הבדלים יוצאים מגדר הרגיל בQ4.. אבל יפה שהוא לקח את זה על עצמו...

אני מנייח שצריך לעבוד הרבה על הטכנולוגייה הזאות בשביל לקבל תוצאות טובות.. אהבתי שאפשר לנצל מעבדים עם מספר רב של ליבות, אולי סוף סוף נימצא עוד שימושים למרובעי ליבה חוץ מגרפיקה ועריכת ווידיאו...

פורסם

זו הכתבה המקורית שפירסם הבחור

חובה לראות את קטעי הוידאו בכתבה. התאורה, הצללים, המים שהוא תיכנת עם RT פשוט נראה מדהים ומאפשר לנו לראות איך המשחקים ייראו בעתיד. מה שחשוב עוד יותר שהוא מראה שקצב הFPS יורד רק ב1/4(רבע) עקב המעבר ל RT ושמעבד מרובע ליבה סוף סוף ימצא את מקומו עם RT כאשר כל ליבה תופקד על חישוב רבע מהסצינה והמשחק יטוס בשילוב עם הליבות הנוספות של הכרטיס הגרפי שיעבדו אפקטי הצללה,מרקם,וכדומה !:

אני היחיד שטורך לקרוא את האותיות הקטנות? אכן מאמר מרשים, תמונות יפות, רעיון יפה (אבל ממש לא מקורי), המספרים שהוא מציג קצת מבושלים (כל מי שכתב תיזה או מאמר יכול להבין את זה) ונא לשים לב לפרטים בגוף הטקסט ולא לגרפים - מדובר ב-FPS בהפרדה של 256*256, שזה פי 35 פחות פיקסלים מתצוגת HD מלאה, לפי דעתי מדובר גם ב-best case scenario.

עדיין, אם להסתמך על המאמר הזה - טכנולוגיה אכן מרשימה עם המון פוטנציאל.

באינטרפולציה גסה ובהנחה שהבחור השתמש במעבד עם בערך 30GFLOPS לניסויים שלו (Q6600 לדוגמא), הצגה של משחק מורכב עם נופים פתוחים כמו קרייסיס בהפרדה של HD ובקצב פריימים מינימלי של 50FPS (ואני אפילו מפחית כאן 90% - לטובת אלגוריתם עתידי יעיל יותר משמעותית) דורשת לפחות 1000GFLOP (כאמור - הפחתתי 90% לטובת אלגוריתם יעיל יותר, אבל מניסיוני רינדור תמונה באוויר הפתוח כולל אפקטים אטמוספריים בסיסיים מסבכים חישובי RT פי 3 ויותר - הרבה יותר). הווה אומר כוח עיבוד המקביל לכוח העיבוד הגולמי הצפוי של ה-9800 הקרב ובא.

אבל חשוב לציין שמדובר כאן ב-best case scenario המתבסס על כך שהנתונים של הבחור הגרמני קרובים למציאות, על סצינות פשוטות בלי יותר מדי אפקטים אטמוספריים ומקורות אור ועל אלגוריתם יעיל באופן יותא מהכלל. בנוסף, על מנת לנצל את אותו כוח עיבוד גולמי אדיר הדרוש לחישובי RT בזמן אמת, יש צורך ברוחב פס לזיכרון שעדיין לא נראה כמותו - כל מי שמבין מעט במחשבי-על ובחישוב מקבילי יודע שרוחב פס לזיכרון הוא גורם מגביל משמעותי.

פורסם

אני מזכיר שוב

עד כמה שאני יודע הכרטיס המינימלי יכיל 16 ליבות שמבוססות על הCELL
פורסם

^^^

כפי שכבר כתבתי - ייתכן מאוד ולמחשב הגרפי של אינטל יהיה את כוח החישוב הגולמי הדרוש . אולם עדיין יש להתגבר על בעיית רוחב הפס לזיכרון וליצור אלגוריתמים יעילים יותר ממה שיש היום.

המעניין הוא, שלפי הנתונים שהבחור ההוא הציג, גם מעבד גרפי עם כוח כמו של ה-9800 יוכל לבצע חישובי Ray tracing בזמן אמת. אני חושד שנתוני ה-FPS שהוצגו מתייחסים לסצנות מאוד פשוטות, בלי ריבוי מקורות אור, שבירת והחזרת אור ובלי אפקטים אטמוספריים.

פורסם

ה GPU ילך ויעלם, רק שאולי העיבוד הגרפי יתבצע ,על 32 או 64 מעבדים של אינטל, שאולי יוכלו לבצע RENDER ברזלוציה גבוהה ,כרגע זה בגדר חלומי בלבד

למחשב הבייתי.

אציין שראיתי ב YOUTUBE כתבה על מעבדי CELL של IBM ,שלקחו 8 מעבדים שכל אחד בנוי מ 8 ליבות ,והצליחו להריץ מודל של מכונית ברינדור מלא ברזולוציה של HD.

תסתכלו בלינק יש הסבר יפה מאוד

http://video.google.com/videoplay?docid=735886583686737366&q=ibm+cell&total=60&start=0&num=10&so=0&type=search&plindex=0

אבל רק מודל אחד בזמן אמת .נניח שנרצה מספר מודלים באותו רינדור ,נצטרך למאות מעבדים כאלו.

ולפי דעתי בעוד מספר שנים זה יהיה אפשרי רק בשילוב של CPU AND GPU ,הכוונה שילוב של עולם בנוי ע"י כרטיס גרפי ,ומודולים ע"י ריבוי ליבות

פורסם

בארכיטקטורה המקובלת היום למחשבים ביתיים, אין עדיין מקום לאיחוד מלא בין ה-CPU וה-GPU. ה-CPU היום עסוק מאוד בחישובים כלליים שונים, ניהול התקנים, IO, מולטימדיה ועוד. כל התוכנות היום בשוק למחשבים אישיים מהודרים בסופו של דבר לשפת סף מורכבת עם המון תוספות. מעבדים המיועדים לטחון FLOPS לא יודעים להתמודד עם המשימות האלו ללא overhead מטורף.

ייתכן ונראה בעתיד שבבים משולבים רבי עוצמה עם ליבות לא אחידות - חלקן לעיבודים כלליים (CPU) וחלקן לעיבודים גרפיים או טחינת מספרים (GPU).

פורסם

אם אתה מדבר על המכונית הזאת

http://video.google.com/videoplay?docid=735886583686737366&q=ibm+cell&total=60&start=0&num=10&so=0&type=search&plindex=0

זה בעצם 3 PS3 שמריצים לינוקס ומחוברים ביחד עם איזה ראוטר

בכל מקרה 3 מעבדים מ18 (6 כפול 3) מכווצים את התמונה כדי למנוע צוואר בקבוק של הראוטר הזה

בכל מקרה רק להשוואה

קח PS3 אחד

תגדיר את המהירות שלו פי 1.5 (2 במקרים מסויימים)

תכפיל את כמות הליבות שלו ב4

וקיבלת לרבי עם 24 ליבות

פורסם

בארכיטקטורה המקובלת היום למחשבים ביתיים, אין עדיין מקום לאיחוד מלא בין ה-CPU וה-GPU. ה-CPU היום עסוק מאוד בחישובים כלליים שונים, ניהול התקנים, IO, מולטימדיה ועוד. כל התוכנות היום בשוק למחשבים אישיים מהודרים בסופו של דבר לשפת סף מורכבת עם המון תוספות. מעבדים המיועדים לטחון FLOPS לא יודעים להתמודד עם המשימות האלו ללא overhead מטורף.

ייתכן ונראה בעתיד שבבים משולבים רבי עוצמה עם ליבות לא אחידות - חלקן לעיבודים כלליים (CPU) וחלקן לעיבודים גרפיים או טחינת מספרים (GPU).

מעבדי ה nehalem בגירסאת ה Havendale ו Auburndale יגיעו עם GPU מובנה בתוכם (צפויים לצאת ברבעון שני של 2009). אינטל גם רכשה בסוף שנה שעברה 2 חברות שמתמחות באיך לאחד מבחינת תכנות / API את כל הנושא של CPU/GPU.

פורסם

הGPU המובנה בCELL הוא רק תחליף לכרטיס מסך מובנה

הוא גם יהיה חלש ממנו זה רק בשביל לאפשר תצוגה על המסך

במובן הזה נחלם דיי דומה לCELL בכך שהוא מאפשר עיבוד גרפי על המעבד הראשי

פורסם
  • מחבר

מעבדי ה nehalem בגירסאת ה Havendale ו Auburndale יגיעו עם GPU מובנה בתוכם (צפויים לצאת ברבעון שני של 2009). אינטל גם רכשה בסוף שנה שעברה 2 חברות שמתמחות באיך לאחד מבחינת תכנות / API את כל הנושא של CPU/GPU.

כל השמות האלה משגעים אותי. תזכירו לי מה בדיו מביא איתו NEHALE> הזה, עכשיו זה פנרין או משהו לא? חשבתי נראה קור2... אני לא אוהב לחפור בשמות יותר מדיי, אז תסלחו לי ;D

פורסם

נחלם בתכלס

ארכיטקטורה חדשה

מספר גבוהה של ליבות (8 טבעיות)

לכל ליבה 2 threads

+Hyperthread חדש

GHZ גבוהה

ליטוגרפיה קטנה

בקר זיכרון בתוך המעבד

זניחת הFSB לטובת QUICKPATH (או משהו דומה בשם)

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

דיונים חדשים