עבור לתוכן

איך נהפוך את GTX970 ל GTX980 עם פריצת חיבור זיכרון

Featured Replies

פורסם

-Hsun On GeForce GTX970Jen -Hsun HuangJenBy שלום לכולם,

כשהשקנו GeForce GTX970 חלק מכם מאוכזבים שלא תיארנו בבירור את הזיכרון המקוטע של אותו. אני מבין למה ועל כן הרשו לי להתייחס לכך. היא ארכיטקטורת זיכרון חדשה פרי המצאתנו. יצרנו יכולת חדשה זו כך שלתצורות Maxwell ויכול 3GB-אינו מוגבל ל GTX970 , כלומר – יהיה אוגר שקופיות גדול יותר Maxwell מצומצמות של נוסף. 1GBלקבל הנוסף מקוטעים ויש להם רוחב 1GBהעליונים של 512MB; אולם, 4GB הוא כרטיס עם GTX970 ומהנדסי התוכנה שלנו GTX970עבור 1GB פס מצומצם. זהו עיצוב טוב משום שאנו יכולים להוסיף .512MBיכולים לשמור על מידע בשימוש תכוף פחות במקטע למבקרינו בעת –לרוע המזל, כשלנו בהעברת מסר זה באופן פנימי לצוות השיווק שלנו, ובאופן חיצוני ההשקה. מאז, ג'ונה אלבן, סגן הנשיא הבכיר שלנו לענייני הנדסת חומרה, סיפק תיאור טכני של המוצר שהוצג היטב על ידי מספר עורכים. הרי דוגמא אחת מהדו"ח הטכני. היו ,4GB-ל 3GB- מ GTX970- במקום להתרגש מכך שהמצאנו דרך חדשה להגדיל את זיכרון ה אחרון זה של 1GBשהתאכזבו מכך שלא היטבנו לתאר את טבעה המקוטע של הארכיטקטורה של זיכרון. אפשר להבין זאת, אך הרשו לי להבהיר: כוונתנו היחידה הייתה ליצור את המעבד הגרפי הטוב ביותר של זיכרון, משום שמשחקים מנצלים זיכרון רב מאי-פעם. 4GB יהיו GTX970-עבורכם. רצינו של ומשתמשים בהם כדי להגיע לביצועים מהם אתם נהנים. וכתמיד, GTX970של 4GB-ניתן להשתמש ב המהנדסים שלנו ימשיכו להגביר את ביצועי המשחק אותם תוכלו להוריד באופן סדיר באמצעות GeForce Experience. היה להיות מפורט בבהירות רבה יותר מלכתחילה. Maxwellעל מאפיין חדש זה של לא ניתן לזה לקרות שוב. נשתפר לקראת הפעם הבאה. Jen-Hsun

The Tech Reportמקור: http://techreport.com/review/27724/nvidia-the-geforce-gtx-970-works-exactly-as- קישור: intended

עובד כראוי GeForce GTX970 : Nvidia מבט לתוך תצורת הזיכרון הלא רגילה של הכרטיס 2015 בינואר, 26- ב PM 12:00 – Scott Wassonמאת

כפי שציינו בכתבה בסוף השבוע האחרון, כמה בעלים סקרנים ובעלי ראש טכני של הכרטיסים הגרפיים הבחינו בהתנהגות בלתי צפויה ביחס לשימוש של הכרטיס בזיכרון. GeForce GTX970 מדגם ,GeForce GTX980- מקציב פחות מהזיכרון הפנוי שלו מ GTX970המשתמשים הבחינו שנדמה כי - לא משתמש ב GTX970- .באופן ספציפי, נדמה שה RAM-על ה 4GBלמרות שלשני הכרטיסים יש המשתמשים מצאו באמצעות .980GTXהאחרונים של הזיכרון בתכיפות בה משתמש בהם 512MB יכול להגיע לקטע GTX970- בדיקות מוכוונות שנבנו בכלים לפיתוח מחשוב מעבדים גרפיים כי ה , אבל רק בקצב העברה נמוך בהרבה.RAM-האחרון על ה מתבססים על אותו סיליקון GTX980 - וGeForce GTX970-השאלה הייתה: למה? אנחנו יודעים שה GM204 , אך יש להם תצורות שונות. כל יחידות עיבוד הגרפיקה של GM204 מעבד גרפי ,שבב ) מושבתותSM( shader multiprocessor-יחידות ה 16, בעוד ששלוש מתוך GTX980-מאופשרות ב .מאחר שלא כל שבב יוצא מושלם מהמפעל ,לעיתים קרובות חברות שבבים משביתות GTX970-ב חלקים פגומים בשבבים שלהן ובונות מוצרים זולים יותר סביבם. מעבדים גרפיים נוטים לעבוד האופן מקבילי מאסיבי, כך שמעבד גרפי שחלקיק מהיחידות שלו כבוי יכול עדיין להניע מוצר משכנע ובר- קיימא. גורם להתנהגות המוזרה בגישה לזיכרון? GTX970- השביתה חלקים מה Nvidiaהייתכן שהאופן בו שחררה בשבת האחרונה הצהרה עם הסבר קצר בעניין. Nvidia- הסיפור התרקם זמן מה עד ש בחלקה, היה כתוב בהצהרה:

שונה מזו SM יש תצורת 970- המוקדשים לזיכרון גרפי ,אולם ל 4GB- מצויד ב GeForce GTX970 ופחות משאבי קווי רוחב במערכת בזיכרון. על מנת לנהל באופן מיטבי את תנועת הזיכרון 980של למעבד הגרפי יש גישה .0.5GBולחלק של 3.5GB בתצורה זו, קיטענו את הזיכרון הגרפי לחלק של זיכרון וידאו לכל פקודת ציור 3.5GB-כשמשחק זקוק לפחות מ .3.5GB-בעדיפות גבוהה יותר לחלק ה בשימוש 3.5GB הוא ייגש רק למחיצה הראשונה ויישומי צד שלישי המודדים שימוש בזיכרון ידווחו על אם יש יותר זיכרון בשימוש פקודות אחרות. GTX980, אך אולי תדווח על יותר לגבי GTX970על ידי נשתמש בשני המקטעים. –של זיכרון 3.5GB-כאשר משחק דורש יותר מ אמור RAM על הביצועים על 0.5GB לאחר מכן, הוסבר בהצהרה כי סך כל ההשפעה של הגישה לחלק לעומת RAM- סיפקה מספר דוגמאות להשוואת ביצועים בתסריטים באילוץ Nvidiaלהיות מועט למדי. .GTX980-ה גילוי זה הצית סערת דיונים והשערות בהערות על כתבתנו ובמקומות אחרים, כשאנשים תוהים האם מקולקל או נגוע בבאג חמרה. GTX970 כדי לנקות את האווירה, דיבר אתנו אמש ג'ונה אלבן, סגן הנשיא הבכיר לענייני הנדסת חמרה של "עובד בדיוק על פי התכנית". הוא GTX970- .המסר העיקרי של אלבן היה גלוי .הוא אמר ש Nvidia וטען ש"אנחנו אכן משתמשים בו כשיש לנו צורך 4GB זיכרון מלא בן GTX970-הבטיח לנו שאכן יש ב בכך". בגישה לזיכרון היא תוצאה של GTX970לאחר מכן הסביר אלבן כי ההתנהגות הבלתי רגילה של Nvidia. מאפיין זה קשור לאופן בו Maxwellמאפיין חדש שנבנה לתוך מעבדים גרפיים מדרגת Nvidia- משביתה את החלקים הפגומים בשבבים שלה בעת הצורך. אלבן אמר שהמאפיין מאפשר ל ליצור מוצר טוב יותר משיכלה בלעדיו. כדי לעזור לנו להבין טוב יותר את המאפיין GM204אלבן לקח אותנו לסיור קצר בקרביו של מעבד גרפי .סיור זה מסתמך מאוד על דיאגרמה מפושטת GeForce GTX970הזה ואת אופן ההשפעה שלו על של השבב שסיפק לנו אלבן, אותה הטמענו למטה. , שם נעשה רוב SM או shader multiprocessors על פני החלק העליון של הדיאגרמה מופיעים העבודה הגרפית הממוחשבת. החלק התחתון של הדיאגרמה מציג את תצורת הזיכרון של השבב. חיצוניים. מחיצות DRAM ביט לשבבי 32 במעבד הגרפי יש ארבע מחיצות, בכל אחת יש שני קישורי ,פקד זיכרון וכן הלאה. L2 זיכרון אלה מחולקות לשני גושים, לכל אחד מהם חלק משלו של מטמון למערכי זיכרון. אתם יכולים shader- אמצע הדיאגרמה מתאר את קו הרוחב המסייע לתקשורת בין ה לדבר עם SM, דומה מאוד למתג אתרנט, המאפשר לכל switched fabric- לחשוב על קו רוחב זה כ . ופקד זיכרון L2כל מטמון

של השבב נצבעו באפור, נוסף על אחד משני SM-, שלושה מהGTX970מאחר שהדיאגרמה מתארת .980GTX- במחיצת הזיכרון בקיצון ימני. כל היחידות הללו מאופשרות ב L2-חלקי מטמון ה , מסביר אלבן, היה צורך להשבית את כל Kepler בדור הקודם של מעבדים גרפיים מונעים על ידי GeForce GTX 660 Ti .לדוגמא, L2מחיצת הזיכרון של כל שבבים עם חלקים פגומים של מטמון "aggregate ומחיצת זיכרון שלמה לא פעילה, כך שיש לה SM עם מספר GK104מתבסס על שבב ביט פחות ממלוא יכולות השבב. 64 ביט לזיכרון, 192 בן connection" מאפיין חדש המאפשר לחברה להשתמש גם בשבב שאינו Maxwell- בנו ב Nvidiaהמהנדסים של , החברה יכולה להשבית את החלק L2 מושלם. במקרה שלמחיצת זיכרון יש חלק מקולקל של מטמון הנותר במחיצת הזיכרון יוכל לשמש את שני פקדי הזיכרון במחיצה, הודות L2-הפגום במטמון. מטמון ה " זה מוצג כפעיל בחץ אנכי כהה buddy interface" לפקדי הזיכרון. L2 "בין buddy interfaceל" במחיצת הזיכרון הימנית-תחתונה בדיאגרמה. בשלוש מחיצות הזיכרון האחרות, חץ זה צבוע באפור ."buddyמשום שאין שימוש בממשק " ביט מלא ועדיין 256 בממשק זיכרון GeForce GTX970 יכולים לצייד את Nvidiaהודות לאמצעי זה, L2- עדיין מייצאת חלק מהשבבים כששני ה Nvidiaלייצא אותו במחיר אטרקטיבי ובכמויות גדולות. למחשבים מיידים, אך אלבן אומר "יש לנו GeForce GTX970M-במחיצת זיכרון מושבתים, כמו ב שומרת על יותר חומרה מתפקדת ביותר שבבים הודות Nvidia- הרבה פחות מאלה עכשיו"; כך ש למיטוב זה. עדיין, לתצורת מעבד גרפי זו יש השלכות אותן לא הבנו לחלוטין כאשר יצא הכרטיס לראשונה.

שהאמנו כי יש בו בתחילה. לכל חלק מטמון ROP חסר מקיבולת המטמון והספק GTX970-לדוגמא, ה - מקושרת האחראית לערבב את הרסיסים כלל פיקסלים ועוזרת ב ROP יש מחיצת GM204- ב L2 פיקסלים לכל שעון של 56 יש רק GTX970- מושבת, לL2-. כשאחד מהmultisampled antialiasing שצוין בדפי הנתונים הראשוניים של הכרטיס. ROPפיקסלים לכל שעון הספק 64 ,לא ROPהספק (במציאות מטורפת אף יותר, גבול זה אינו אפילו מגבלת קצב המילוי הראשית של מוצר זה, מאחר פיקסלים לשעון אל קו הרוחב). כמו כן, קיבולת 52 יכולים לשלוח רק GTX970 של shader- שמערכי ה אחד 256KB, מאחר שחלק מטמון 2048KB, לא 1792KB היא GTX970 הכוללת של L2-מטמון ה מושבת. במדריך למבקר GTX970 "פישלה" במסירת המפרטים של Nvidia אלבן הודה בפנינו בכנות כי מנצל את GTX970-שסיפקה לעיתונות. הוא אמר כי הצוות האחראי למסמך זה לא היה מודע לכך שה .L2 להשבית באופן סלקטיבי חלק ממטמון Maxwellיכולתה של

להשתמש בזיכרון הזמין לו. לשאלה זו יש שני GTX970השאלה המעניינת יותר היא עד כמה מיטיב ממדים קשורים, רוחב-פס וקיבולת. בדיאגרמה L2 כדי להבין את עניין רוחב-הפס, ראשית שימו לב למגבלה שהוטלה בהשבתת חלק מטמון נשאר GTX970 מושבת גם הוא. למרות שנתיב L2למעלה: קישור קו הרוחב לחלק זה של מטמון ביט, רוחב קישור קו הרוחב מצטמצם. שני פקדי הזיכרון במחיצה זו נאלצים לחלוק 256ברוחב כולל של מאחורי לפחות אחד משני DRAMשל 0.5GB- יחיד. הגישה ל L2קישור קו רוחב יחיד, בגיבוי מטמון אלה של זיכרון עדיין 512MB פקדי זיכרון אלה תהיה איטית יותר בזמן שיא מבכל מקום אחר במערכת. לעקוף מגבלה זו. Nvidia עשויים להיות שימושיים, אבל זה בעייתי מעט. על מנצל את כל רוחב-פס הזיכרון הזמין לו. לו GTX980 מוגמר כמו GM204 עכשיו, שקלו בדעתכם איך יכול היה לקרוא או לכתוב נתונים רק במהירות GM204היה מאחסן מידע בסמיכות בבועה אחת גדולה, - או קישור קו רוחב יחיד. במקום זאת, על מנת להגשים את מלוא פוטנציאל רוחב DRAMשל שבב

כך שיוכל לקרוא DRAM הפס, על המעבד הגרפי לפרוס את הנתונים אותם הוא מאחסן על פני מספר יש GM204- ולכבות בכולם בו-זמנית. הדיאגרמה של אלבן, המופיעה למעלה ,מצביעה על כך של -ב 1KB הראשון ואז מאחסן DRAM-של מידע ב 1KB .במילים אחרות, הוא מאחסן 1KB פסיעה בת ואז גולש DRAM השבב פוסע על פני שמונה GTX980- הבא, וכך הלאה על פני המערך. ב DRAM חזרה. פעילויות הקוראות או כותבות נתונים באופן רציף אמורות לנצל את כל שמונה ערוצי הזיכרון ולהשיג משהו קרוב לשיא קצב ההעברה של המעבד הגרפי. DRAM האיטי יותר של 0.5GB- להיות יצירתי כדי למנוע את הMaxwell, היה על צוות GTX970עבור לשני מקטעים: מקטע גדול ומהיר GTX970מלהפוך לבעיה. המענה שלהם היה לחלק את הזיכרון של . מטפלים בשני מקטעים אלה באופן שונה מאוד. מקטע 512MB ומקטע קטן ואיטי יותר בן 3.5GBבן כולל שבעה פקדי זיכרון והמעבד הגרפי פוסע על פני כל השבעה באופן שווה. כאשר המעבד 3.5GB 7-הגרפי ניגש למקטע זיכרון זה, הוא אמור להגיע ל משיא רוחב-הפס הפוטנציאלי שלו, כלל לא רחוק /8 אחרונים אלה של 512MB- מאופשר במלואו; אולם קצבי העברה ב GM204-ממה שהיינו רואים ב מהפוטנציאל הכולל של הכרטיס. 1/8זיכרון יהיו איטיים בהרבה, אמורה להתנהג כפי שמדדו כמה בעלי Nvidiaאם כן, על פי הסברו של אלבן, תצורת החמרה של הראשונים של הזיכרון ואיטי יותר לאחר מכן. 3.5GB-: מהיר בGTX970 מעבירה שני מקטעי זיכרון לפקודת Nvidia ,GTX980אלבן מציין, כי עם תצורת מעבד גרפי כמו - .ב PCI express של המעבד הגרפי עצמו וזיכרון המערכת הנוסף דרך RAM-מערכת ההפעלה: ה המהיר 3.5GB מציבה שני מקטעים נפרדים של זיכרון מעבד גרפי, ראשית גוש Nvidia ,GTX970 האיטי יותר, יחד עם כמה "רמזים" האומרים למערכת ההפעלה להעדיף בעת 512MBיותר ואז גוש האפשר את המקטע הגדול והמהיר יותר. כתוצאה מכך, מערכת ההפעלה אמורה לטפל בזיכרון של באופן היררכי עם העדפה נכונה: ראשית המקטע המהיר יותר ואז המקטע האיטי יותר. אם GTX970 - ,כפי שהיה עושה ב PCIe באופן כולל, הוא ידלוף לתוך זיכרון 4GBיאלץ זיכרון היישום לעלות על GTX980 .

דרך אגב, אלבן אמר לנו כי סידור זה עוזר להסביר את ההתנהגות שציינו כמה אנשים, על פיה נראה .חלק מהנתונים GTX970- משתמש ביותר מהקיבולת הכוללת של הזיכרון שלו מ GTX980-ש וידיאו במהלך פעילות רגילה נופלים באזור אפור: השתמשו בהם בשלב כלשהו, אבל RAM-שאוחסנו ב אינה נחוצה RAM-לא ניגשו אליהם לאחרונה ויתכן שלא ישתמשו בהם שוב. נוכחות נתונים אלה ב לעבודה הנוכחית, אך יתכן שהן יהיו שימושיים בעתיד. במקום לפנות נתונים אלה מהזיכרון, המעבד , עם מקטע זיכרון GTX980- אינו דרוש למטרה אחרת. בRAM-הגרפי ישמור אותם שם אם מקום זה ב נתונים GTX970-. ב4GB אחד, נתונים "קרים" אלה לא ייפלטו עד שהשימוש בזיכרון יגיע למגבלת עשוי להשתמש בפחות מקיבולת GTX970אם כן, בעת אותה עבודה, .3.5GB-קרים אלה נפלטים ב .שוב, על פי אלבן, התנהגות זו היא חלק מתכנונה GTX980- הכוללת שלו כעניין שבשגרה מ RAM-ה אם יידרש לכך. RAMשל 4GB עדיין יכול לגשת למלוא GTX970 .Nvidiaשל ?3.5GB ככרטיס GTX970 בשלב זה, הייתה לי שאלה פשוטה אל אלבן: האם היה טוב יותר ליצור את - נדמה מעט מפוקפק, לא כך? תשובתו: איני חושב כך, משום ש RAMזה של 0.5GBאחרי הכול, ,PCI Express-האחרונים בזיכרון מל 512MB זה של זיכרון הוא שימושי. עדיף לדלוף אל 0.5GB שהוא אף יותר איטי. יכולה להכניס נתונים שלא סביר שייעשה Nvidiaכמו כן, אלבן אמר כי בעזרת "היוריסטיקה טובה", כבר Nvidia . במילים אחרות, יתכן כי מפתחי הדרייבר של 0.5GBבהן שימוש באותה תכיפות למקטע .GTX970ממטבים את האופן בו התכנה שלהם מאחסנת נתונים במקטע הזיכרון העליון של 0.5GB ייאלץ לדלוף אל GTX970-אחת השאלות הגדולות בכל הטירוף הזה היא מה יקרה במקרה ש GM204 בהתבסס על GTX980-אחרון של זיכרון. איזו מידה של האטה בביצועים נראה ביחס ל בין כאחוז performance deltas מוגמר? עד כה, החברה הציעה כמה בוחני ביצועים המציגים

VRAM 3.5GB- לכשלושה אחוזים. במילים אחרות, כאשר מתקדמים לתסריט בו משתמשים ביותר מ .GTX980- נפגע אך מעט יותר מ GTX970באופן ניכר, - ממשיכה לבחון מצבים אפשריים בהם מדרונות הביצועים תלולים יותר ב Nvidiaאלבן אמר לנו כי Nvidia והציע שבמקרים אלה, החברה "תראה אם נוכל לשפר את ההיוריסטיקה". בקיצור, GTX970 ויתכן שניתן לעקוף את כל הבעיות GTX970 המשונה של VRAM-מקבלת אחריות על ניהול תצורת ה מעט שבריריים יותר GTX970שמעלים משתמשים באמצעות עדכון דרייבר. לבסוף, זה אומר שביצועי יש היסטוריה לא רעה של טיפול בדברים כאלה. זו אינה משימה Nvidia-, אך לGTX980מאלה של .SLIקשה כמו, נאמר, תחזוקת פרופיל בצורתו הנוכחית. "אנו גאים GTX970- מרוצה מהMaxwellעם סיום שיחתנו, אלבן חזר על כך שצוות במה שבנינו, חושבים שזה מוצר אדיר. חשבנו שמאפיין זה ישפר את המוצר ואנחנו חושבים שהשגנו את המטרה. אנחנו רוצים לוודא שאנשים מבינים אותו היטב."

פורסם

אחריי כמה פסקאות כבר התחלתי לשכוח את הפסקאות הראשונות.

אתה מציג כאן אפשרות לשפר את הביצועים של הכרטיס או שאתה סתם מציג תירוצים ועוד בעיות מ-NVIDIA?

כי אם כן תוכל להציג את האפשרות לשפר בצורה הרבה יותר יעילה.

עריכה: אביט במקור.

נערך על-ידי ExenTex

פורסם

אשכרה זרקת פה כתבה מגוגל translate?

פורסם

אני בשוק מעצמי שאיך שהו הצלחתי להגיע לפסקה השניה ..

פורסם

לרגע חשבתי שהוא אשכרה השקיע בכתיבת כל הגוש הזה ושזה סתם התחרבש לו בגלל האנגלית והעברית. עד שהתחלתי לראות את הדפקות המטומטמות שהזכירו לי את אותן דפקות של גוגל.

כיתב חסר טעם ולא מחדש שום דבר בעניין.

נערך על-ידי ExenTex

פורסם

חשבתי לרגע שמצאו דרך להפליש ביוס ש-"פתוח" את הליבות ה-CUDA המכובות (למרות שזה לא נראלי כזה הגיוני).

אבל אז כשקראתי את השורה הראשונה הבנתי שזה תרגום של גוגל

פורסם

^ תרגום של כתבה מינאור... כמה זה כבר יכול לחדש (לא קראתי)...

אגב, כדאי מאוד לערוך את הכותרת.

פורסם
:ugly26:

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

דיונים חדשים