GTX TITAN - עמוד 4 - כרטיסי מסך - HWzone פורומים
עבור לתוכן
  • צור חשבון

GTX TITAN


mikyl

Recommended Posts

בקשר לשלושה מסכים ברזולוציה שציינת, מערך sli של 660 ti לא יעשה את העבודה(הרזולוציה מטורפת).

גם מערך sli של gtx680 4gb יתקשה ולפי דעתי לא ירוץ(על הגדרות גבוהות כמובן).

אולי cf של 7970 toxic עם 6 gb היה מחזיק טוב(למרות שcf עדיין בעייתי), שני טיטאנים זה מה שצריך

לרזולוציה מטורפת כזו.

http://www.techpowerup.com/forums/showthread.php?t=158649

קישור לתוכן
שתף באתרים אחרים

  • תגובות 121
  • נוצר
  • תגובה אחרונה

תלוי איזו עבודה, אם אתה מריץ מסך אחד עם רזולוציה 1920x1080 אז הכרטיס אמור לעבוד בסדר, אבל ברזולוציות רחבות של 2550x1440 סביר להניח שהוא יתקשה להריץ על אולטרה/הגדרות גבוהות.

כמו שאמרו לך, ברזולוציה כזאתי יתכן יהיה באמת עדיף לקנות CF או כרטיסי High End כגון טיטאן.

אם עכשיו יש לך רק מסך אחד ואתה שואל בתיאורטי, הייתי במקומך לוקח 660x2 שזה פחות או יותר מה שאני מתכוון לעשות, ברגע שיהיה לי כסף :lol:

קישור לתוכן
שתף באתרים אחרים

אני לא היתי מליץ לא ולא CF

יש בעיות תאימות בחלק מהמישחקים ,צריך לדאוג לקרור טוב ,והצריכת חשמל גבוה ,ובכרטיסים רועשים תכפילו פי 2 את הרעש

בעניין הטיטן ,אני לא היתי חושב לקנות אפילו מיפלצת כזאת כל עוד הPS4\XBOX3 לא יהיו שנה לפחות בשוק עם לא שנתים

פשוט כי מאוד יכול להיות שיכנסו איתם טכנולוגיות שעוד לא ראינו ויהיו משמעותיות בעתיד

לדוגמה אולי MS תוציא את הXBOX3 עם תמיכה בDX12 או DX11 וחצי

הXBOX360 לדוגמה היה כמו DX9 וחצי בזמנו ,וחלק מהטכנולוגיה הגיע לPC בDX10

אני לא מצפה מהקונסולות האלו להיות מיפלצות -בכלל לא

אבל יש עניין של תמיכת התוכנה לחומרה ,ועם יצא DX12 ,ומפתחות יבנו אליו ,הטיטן ישאר מאחור

קישור לתוכן
שתף באתרים אחרים

נראה לי שכרטיס מסך GTX 670 4GB יעשה את העבודה, לא?

איזה עבודה הוא יעשה, אתה שואל ברצינות ?

גיא הוא שאל על רזולוציה כזו כפול שלושה מסכים..גם טיטאן יחיד לא ממש יעזור לך.

אני עובד עם cf של 7970 ghz על שלושה מסכים שלא כולם 1920x1080 ויש משחקים

כדוגמת קרייסיס 3 שממש היה טוב 60-90 fps בשיא ההגדרות fxaa ברזולוציה של 5200x1050 בערך.

קישור לתוכן
שתף באתרים אחרים

מתמטית הוא כן מוכפל, משום שכל ליבה עובדת מול עותק זהה של זכרון שעומד מולה, ולמשל קצר:

"שני פועלים" שעובדים על אותה עבודה ביצור מקבילי - המשל שלנו לשני כרטיסי 660,

מקביל לפועל בודד שעושה את אותה עבודה אך במהירות כפולה - המשל שלנו ל- titan,

ועל כן רוחב פס הזכרון ועוד איך שמוכפל, רק שהוא מחולק בין שני פועלים (בייצור מקבילי כאמור).

זה בדיוק כמו מנוע בנפח 1000 סמ"ק בן בוכנה אחת, למנוע 1000 סמ"ק שמכיל שתי בוכנות כל אחת 500 סמ"ק..

הנפח הכולל של המנוע עדיין נשאר 1000 סמ"ק, רק שמחולק הוא בין שתי הבוכנות באופן הומוגני.

הדבר היחידי שאינו מוכפל ב הוא נפח הזכרון, משום החובה (בכדי להכפיל תפוקות) גם להכפיל את תוכן הזכרון,

כך שכל ליבה עובדת על עותק זהה של מידע. אילו לא היה כך, לא היה עובד מערך וכל הראציונאל של עבודה מקבילית

לא היה יכול להתקיים מלכתחילה.

לכל מי אשר יש הגדרות אחרות בראש, במטותא, אנה עבדו תחת הגדרות הנדסיות מקובלות.

במערך שכזה כל כרטיס מרנדר חצי מסך. היות וזה המצב, לכל כרטיס עדיין יש 192bit של רוחב פס. הסבר עילג, אני יודע, אבל רוחב הפס במערך , כמו כל דבר אחר בו, לא מוכפל. מתמטית שני כרטיסים עובדים על חצי פרוייקט, ברור שהתוצאה תהיה גבוהה יותר.

^^^

כרטיסי המסך של נוידיה, לא משנה כמה תוסיף להם - עדיין יהיו מוגבלים. רוחב הפס תמיד ישאר קבוע (256 במקרה של 670 680), וכמו שמבחני בימועים מראים, אין תמורה ליותר על כרטיס שכזה.

קישור לתוכן
שתף באתרים אחרים

במערך שכזה כל כרטיס מרנדר חצי מסך. היות וזה המצב, לכל כרטיס עדיין יש 192bit של רוחב פס. הסבר עילג, אני יודע, אבל רוחב הפס במערך SLI, כמו כל דבר אחר בו, לא מוכפל. מתמטית שני כרטיסים עובדים על חצי פרוייקט, ברור שהתוצאה תהיה גבוהה יותר.

^^^

כרטיסי המסך של נוידיה, לא משנה כמה זכרון תוסיף להם - עדיין יהיו מוגבלים. רוחב הפס תמיד ישאר קבוע (256 במקרה של 670 680), וכמו שמבחני בימועים מראים, אין תמורה ליותר זכרון על כרטיס שכזה.

אויש אויש, כמה בורות והפגנת חוסר ידע בסיסי שזה זועק! אפילו המושגים קלוקלים ומעורבבים האחד בשני ללא כל קשר.

אז מאיפה להתחיל ?

אז ככה קצת רקע יסוד - רנדור כיום הן SLI והן CF הינו מבוצע בשיטת AFR , שזה Alternate Frame Rendering.

בשיטה זו כל כרטיס מסך מרנדר את התמונה העוקבת אחר זה שקודמו רינדר. קרי:

בשעה שכרטיס א' מרנדר תמונות אי-זוגיות, כרטיס ב' מרנדר תמונות זוגיות. וחוזר חלילה.

קצת הסטוריה בנושא:

נצלול אי שם 15 שנה אחורה על פני ציר הזמן, השנה שנת 1998 - היתה אז חברה שקראו לה 3Dfx,

היא החלוצה בתחום העיבוד המקבילי (המסחרי), שפיתחה את שיטת SLI שמשמעותה היתה: scan line interleave.

בשיטה זו כל כרטיס רינדר שורה בודדת, כאשר כרטיס א' רינדר שורות אי-זוגיות, וכרטיס ב' רנדר שורות זוגיות.

המתודה הוטמעה אז לראשונה בכרטיסי 3Dfx VooDoo 2.

לימים (בשנת 2000) החברה נרכשה ע"י , ומאז היא בעלת זכויות על השמוש בשם , אך מאז ועד היום

עברו הרבה מים ושיטת רנדור שורה שורה פסה לה מהעולם בשל חוסר היכולת להמשיך עימה. כיום בשל סיבות רבות

ובעיקרן ביצוע עבודות עיבוד מקדימות לרינדור - כמו חישובי גאומטריה בכרטיס המסך ולא עוד במעבד המחשב, שיטת רינדור

שורה שורה הפכה ללא אפקטיבית, כמו גם שיטת רנדור מחצית תמונה על מעבד אחד ומחציתה השניה על מעבד שני.

זאת היות והגאומטריה מחושבת כשלב מקדים על כל התמונה בלאו הרי, ובכל מקרה משתי השיטות המוזכרות לעיל נאלץ

לחשבה פעמיים, מה שיוריד את הנצילות של התהליך להרבה מתחת ל- 200%.

לכן עברו לשיטת רנדור תמונה בודדת אחת לכל כרטיס, כי רק כך כל אחד מהכרטיסים מחשב את הגאומטריה של תמונתו

ובעצם עבודת חישובי הגאומטריה הפכה לבעיה מקבילית שניתן לחלקה.

ועכשיו להסבר על עיבוד מקבילי:

עיבוד תמונה הינה למזלנו פעולה מקבילית, שניתן לחלקה למספר רב של יחידות עיבוד שעובדות יחדיו כל אחת על חלק אחר בתמונה.

ומדוע זה אפשרי ? משום שלמשל ציור השמיים ובאותו הזמן ציור האדמה שלמטה - הינן פעולות שאינם תלויות האחת בשניה.

כך למעשה בנוי גם מעבד גראפי בודד השוכן על מעגל מודפס, זוהי למעשה מכונת עיבוד מקבילית גרידא.

עוד מושג חשוב ללמידה והוא IC = integrated circuit.

מעבד בודד = IC שהוא מעבד ה- GPU ששוכן על מעגל מודפס, הינו למעשה רתימת הרבה מאד יחידות עיבוד מקביליות יחדיו

ליחידת סיליקון אחת. כל יחידות העיבוד הללו ממומשקות לבקר שמנהל עבורם את תעבורת המידע מ/אל הזכרון.

בפועל כיום בקר בודד הוא בן 32 ביט, ומחובר לשבב בודד (שגם הוא למעשה IC).

קרי: בכרטיס מסך גראפי בו 256 סיביות רוחב פס , יש למעשה 8 בקרי זכרון המחוברים ל- 8 יחידות זכרון נפרדות.

הסיבה לעבודה ב- 32 סביות היא משום שפלטת הצבעים היא 32 סיביות וכל החישובים עליהם נעשים ב- 32 סיביות גם כן.

עכשיו, זה שחברו יחדיו 1532 מעבדים מקבילים במקרה לדוגמא של GTX680, על יחידת IC בודדת להלן ה- GPU,

שאותה הלחימו על מעגל מודפס אחד, ובאמצעות 8 בקרי זכרון (שכולם נצרבו בשבב ה- GPU עצמו גם כן) ל- 8 יחידות זכרון נפרדות,

מדוע קוראים לזה כרטיס בעל רוחב פס של 256 סיביות ?

נחשתם נכון - כי זו יחידת עיבוד מקבילית וכח העיבוד בה לינארי.

רותמים ב- IC בודד = GPU, שמונה בקרי זכרון נפרדים של 32 סיביות האחד, לסך מצרפי של 256 סיביות.

"לינארי" אומר, שעבור קיצוץ כלל יחידת העיבוד ורוחב הפס במחצית, תפוקת המערכת תקוצץ אף היא באותו יחס בדיוק = מחצית,

ולהפך כמובן.

אותו הדין כאשר מחלקים עבודה מקבילית ליותר ממעגל מודפס אחד, כאשר כל אחד מהמעגלים המודפסים = גם ,

מקבל את מחצית העבודה. סך יחידות העיבוד נסכם כסך המעבדים, במקרה של שני GTX680 יהיו לנו 3064 יחידות עיבוד מקביליות,

סך יחידות בקרי הזכרון הינה 8 + 8 = 16, ומכאן שסך רוחב פס הזכרון הינו 256 * 2 = 512 סיביות.

קרי בכל פעימה = clock של המערכת, יכתבו/יקראו מהזכרון בו זמנית 512 סיביות, כאשר 256 מהן משמשות את 1532

יחידות העיבוד המקביליות במעגל מודפס א' - שעובדות להזכירנו על רנדורה של תמונה א', ו- 256 מהן משמשות את 1532

יחידות העיבוד במעגל מודפס ב', שעובדות להזכירנו על רנדורה של תמונה ב'.

פרקטיקת עיבוד מקבילי בתחום הגראפי -> עיבוד ביותר מאשר מעגל מודפס אחד = עיבוד בכמה כרטיסים:

עכשיו, חשוב להדגיש כי במקרה של עיבוד גראפי, נכון לשיטת העבוד דהיום ונכון לאבולוציה הטכנולוגית שאליה הגענו, היות ואין שתי תמונות

העוקבות אחר השניה זהות, כך שכל אחת לוקחת זמן מעט שונה לעיבוד, כמו גם הצורך להעתיק בסוף רנדורה של כל תמונה את הפלט

הנדרש אל ה- framebuffer של כרטיס ה- master במערך (זה שמחובר למסך) הנצילות של שני כרטיסים איננה בדיוק 200%,

אלא בממוצע גס עומדת על 190% סדר גודל.

עדיין הטרמינולוגיה לגבי כמות יחידות עיבוד ורוחב פס זכרון נותרת על כנה ונרשמת כסכימת סך היחידות שיש לנו בשני המעגלים המודפסים,

אך יש לציין בסוף התרשומת את הנצילות המעשית הממוצעת אשר יורדת כמעה מ- 200% לכ- 190% , וזאת בכדי לאמוד נכונה

את ההספק המצרפי של המערכת כולה.

קישור לתוכן
שתף באתרים אחרים

הנקודה היתה שכל כרטיס מעבד פריים (תמונה) אחת, או חלק אחד בתמונה, או איך שלא תקרא לזה - זוג כרטיסים לעולם לא ירנדר את אותו החלק באותו הזמן. שזה מה שנראה לי מתחבא שם בין כל המידע העקיף הזה שאתה אוהב לזרוק.

מכיוון שכל כרטיס עובד על חלק אחר במסך, לכל כרטיס עדיין זמינים רק 192 ביט. זה לא כרטיס אחד, כמו שאתה מנסה להשליך על זה.

קישור לתוכן
שתף באתרים אחרים

הנקודה היתה שכל כרטיס מעבד פריים (תמונה) אחת, או חלק אחד בתמונה, או איך שלא תקרא לזה - זוג כרטיסים לעולם לא ירנדר את אותו החלק באותו הזמן.

גם אף מעבד מתוך 1532 המעבדים המקביליים שיש במעבד GPU בודד לעולם לא יעבדו את אותו החלק בתמונה - זה הרי יצור התנגשות.

שזה מה שנראה לי מתחבא שם בין כל המידע העקיף הזה שאתה אוהב לזרוק.

"אוהב לזרוק" ?? קרא בבקשה מחדש את מודעותיך.

מכיוון שכל כרטיס עובד על חלק אחר במסך, אין שם 384 אלא 192X2.

גם כל אחת מאלפי יחידות העיבוד שבמעבד בודד עובדים על חלק אחר בתמונה. אז מה ? היש לך יש מה לומר על זה ? או שקצת הלכת לאיבוד חבר יקר...

סיכום:

heavymetal, אם נאמץ את שיטתך, אזי כרטיס מסך GTX680 הוא בעל ברוחב פס 32bit x 8 . מתאים לך לכתוב כך ?

קישור לתוכן
שתף באתרים אחרים

רק עניין קטן להוסיף, לפי הבנתי, ספציפית בכתיבה לזכרון, רוחב הפס לא יוכפל מאחר ואותו המידע בדיוק נכתב לזכרונות,

לעומת קריאה שם כל כרטיס יכול לקרוא מידע שונה לצורך עיבוד התמונה.

בכל אופן מהירויות כתיבה פחות רלוונטים לביצועי משחק (למשל זמני טעינת מפה או איזור).

קישור לתוכן
שתף באתרים אחרים

רק עניין קטן להוסיף, לפי הבנתי, ספציפית בכתיבה לזכרון, רוחב הפס לא יוכפל מאחר ואותו המידע בדיוק נכתב לזכרונות,

לעומת קריאה שם כל כרטיס יכול לקרוא מידע שונה לצורך עיבוד תמונה יחודית.

בכל אופן מהירויות כתיבה פחות רלוונטים לביצועי משחק (למשל זמני טעינת מפה או איזור).

לא לא, אכן רוחב הפס מוכפל בדיוק פעמיים, הן קריאה והן כתיבה. הדבר היחידי שאינו מוכפל הינה כמות הזכרון.

הסבר:

אם נתבונן על שרשרת העיבוד המלאה מרגע הקריאה, דרך שלב החישוב ועד שלב הכתיבה, נראה שרוחב הפס כולו מוכפל לינארית.

הכיצד זה קורה ?

משום שבכל זמן נתון שני הכרטיסים שומרים כמובן את המידע הגולמי (טקסטורות ועוד) פעמיים, בכדי לאפשר לכל אחד

מהמעבדים גישה בלתי תלויה למידע (כרטיס אחד לא אכפת לו מה כרטיס שני עושה כרגע),

כל יחידת עיבוד מבין השתיים קוראת ברגע נתון מהזכרון שלה למקטע הנדרש על ידה (שוב, באופן בלתי תלוי במה עושה היחידה השניה),

שתי יחידות העיבוד מייצרות חישוב על מקטע המידע השונה שהוזן להן (שוב, באופן בלתי תלוי בשניה),

וכל אחת מהן כותבת את הפלט השונה ל- frambuffer שלה (שוב, באופן בלתי תלוי במה עושה היחידה השניה).

**שתי קריאות בלתי תלויות, שני עיבודים נפרדים ובלתי תלויים, שתי כתיבות לשתי תמונות נפרדות ובלתי תלויות.

ולסיפת הערתך הרחבה חשובה ומאירה:

ספציפית לעיבוד גראפי של תמונה - מהירות כתיבה זהה בחשיבותה למהירות קריאה וזאת בשונה מעבודת CPU. מדוע זה כך ?

משום שהפעולה שגורמת לתעבורת המידע הגדולה ביותר ברוחב פס הזכרון בכרטיס מסך, הינה פעולת הרנדור הסופית = הציור של הפיקסלים.

אחת הסיבות בהן הוכנס לראשונה ובתחום עיבוד גראפי דווקא, היא בדיוק בשל כך - משום שבמעבר מ- SDR ל- הוכפלה

תפוקת הרנדור פי שתיים בדיוק, בשעה שהגישה לזכרון מותרת רק קריאה אחת וכתיבה אחת לכל clock.

ההגיון אומר שאם אין הבטחה לכמות כתיבה וקריאה שוות, הרי שבתכלס רוחב הפס בפועל לא היה באמת מוכפל במעבר ל .

למשל אם היו יותר קריאות מכתיבות, מה שלא היה מאפשר בכל clock גם לקרוא וגם לכתוב - כי פשוט לא היה מספיק מידע לכתוב

על כל קריאה שמתבצעת, אז גם לא היתה מתקיימת הכפלה מדויקת בביצועים הגראפיים. זו כאמור סתירה למתקיים בפועל.

אם כן באופן עקרוני לפעולת הרנדור, על כל פעולת קריאה מהזכרון בנפח X, נרשמת פעולת כתיבה לזכרון בנפח X גם כן.

זו הסיבה מדוע בעיבוד גראפי כן נצפת עלייה לינארית בביצועים במעבר מ- SDR ל- (ולאחר מכן שוב פעם במעבר ל- QDR),

בשעה שלא הורגשה שכזו בעיבוד CPU רגיל.

בעיבוד רגיל לא מתקיים באופן קבוע שוויון בין כמות הקריאות לכמות הכתיבות במרבית האלגורתמים הטיפוסיים, מה שמכונה מימוש א-סימטרי

בעבודה מול הזכרון.

קישור לתוכן
שתף באתרים אחרים

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.


×
  • צור חדש...