ערכנו שיחה עם רן ברנסון, שאחראי על העיצוב של כל מעבדי הקליינט של אינטל ותחת אחריותו קבוצות פיתוח גדולות בישראל ארהב הודו ומלזיה, על מנת להבין את המטרות, השאיפות וכל מה שמחדשים מעבדי מטאור לייק הקרבים של אינטל במטרה להביא שידרוג משמעותי לעולם המחשבים הניידים
את הראיון מביא ליאור מתתיהו, כתב HWzone. כאן תוכלו למצוא רקע טכני אודות ארכיטקטורת מטאור לייק של אינטל.
ל.מ: שלום רן, אשמח אם תוכל להציג את עצמך ולספר לנו על התפקיד שלך באינטל
ר.ב: אני רן, בשנה האחרונה מנהל את כל פיתוח המעבדים לקליינט באינטל – זה אומר מחשבים שולחניים, מחשבים ניידים. ניהלתי בשנה האחרונה את הקבוצה שהיתה אחראית לתהליך הפיתוח. לפני כן ניהלתי את קבוצת הפיתוח המקבילה – זאת שפיתחה את Alder Lake ולאחר מכן את Raptor Lake (דורות 12 ו-13). בזמנו ניהלתי את ה-Core (ליבות עיבוד) וכיום אני מנהל את ה-SoC (ר"ת System on Chip, מתייחס כל מרכיבי המעבד יחד).
ל.מ: ברשותך אחזור להתחלה. ברמה הטכנית, הצרכנית והכל – מה הוביל את אינטל לבצע מהלך כזה קיצוני? אינטל מציינת כי מדובר במהלך המשמעותי ביותר שביצעה במעבד ב-40 השנים האחרונות. מה הוביל את אינטל להגיד "אוקי, עושים קאט, זה הדור שבו אנחנו מחליטים לעשות את השינוי הגדול", שבו עוברים מהעיצוב המונוליטי, האחיד אל עיצוב מודולארי של אריחים שמגיעים מפסי יצור שונים עבור מטרות שונות באותו המעבד?

ר.ב: התהליך של ההפרדה ושל "שבירה" של המעבד לחמש פיסות סיליקון שונות הוא תהליך שאנחנו דנים ומתווכחים עליו באינטל בעשר השנים האחרונות ובהתחלת עיצוב של כל מוצר אנחנו שואלים "עכשיו הגיע הזמן?", כן או לא, ועד מטאור לייק המסקנה הייתה "עוד לא, אפשר לחכות עוד קצת". במטאור לייק השתנו שלושה דברים שגרמו להחלטה הזאת.
הראשון זה יכולת. היכולות וטכנולוגיה מאוד התקדמו ואפשרו לחלק את המעבד לארבעה או חמישה חלקים בצורה יעילה. צורה יעילה זה עם שטח-יתר נמוך על שטח הסיליקון בתהליך ההפקה, עם יעילות גבוהה משמעותית בצריכת החשמל, וגם את היכולת לקבל תזמונים הדוקים ופרוטוקולי תקשורת שפועלים בצורה תקינה במעבר בין פיסה אחת לאחרת של סיליקון. אלו יכולות שהתקדמו ביכולת הפיתוח ואינטל היא המובילה ביכולות האלה היום.

מה שאנחנו קוראים לו FOVEROS בעצם מאפשר לנו להרכיב ארבע פיסות סיליקון שונות וליצור עם זה מעבד אחד על גבי סיליקון אחר, מצע סיליקון בתהליך יצור יותר ישן ויותר זול, כזה שמאפשר את ההרכבה הזאת בצורה מאוד יעילה.
הדבר השני הוא הצורך – הצורך התגבר. הצורך הזה מורכב מכמה דברים כאשר אחד הוא ליצר את הטיב המירבי במחיר המינימלי. התהליכים המתקדמים הולכים ונהיים הרבה יותר יקרים ואנחנו רוצים לשים כל טרנזיסטור על התהליך שמתאים לו. הטרנזיסטור שצריך את התדר הכי גבוה ילך לתהליכי יצור מסוים, הטרנזיסטור שצריך צריכת חשמל נמוכה ילך לתהליך יצור אחר, ואת הטרנזיסטור שלא צריך את זה ולא את זה אפשר לשלוח לתהליך היצור הזול ביותר. עם ההתקדמות של תעשיית יצור השבבים ועליית המחירים של הוייפרים (צלחות המעבדים אשר מיוצרות במפעלים) הגענו למצב שלמרות שיש שיטות הרכבות מאוד מתקדמות זה המצב הרצוי להגיע אליו, הרבה יותר כלכלי ליצר אותו ככה.

יש גם את אספקט הזמינות. יש תהליכי יצור שקל יותר לבצע להם עיצוב מעבד. יש חלקים שאפשר לקנות מחברות חיצוניות ולא צריך לפתח הכל לבד, או שיש כאלה שאפשר לקחת מהדור הקודם שלנו כי לא צריך שוב להמציא את הגלגל ואין צורך לשנות את החלק הזה (אי אלו בקרים). זה בעצם השלב השני, הצורך.
השלב השלישי הוא כנראה גם אומץ. היו הרבה סקפטיים לשינוי הגדול הזה, האם הוא יצליח, האם הוא יצליח במכה הראשונה. בעצם מה שאתה רואה עכשיו זה ההוכחה שזה הצליח אבל גם אומץ היה חלק מהתהליך.
ל.מ: אתה יכול לספר לנו על הגמישות של המערכת הזאת? אנחנו רואים שיש בגרסה הראשונה של מטאור לייק איזשהו הרכב מאוד ספציפי וקבוע והגיוני של האריחים האלה. יש לנו SoC, ויש לנו גרפיקה וליבות עיבוד וגם IO. אלו רכיבים שאנחנו מכירים ממעבדים קיימים ופה הם קיימים בחלקים נפרדים. כמה חופש יש במערכת כזאת? אם אני רוצה להרכיב מעבד דל-גרפיקה או דל-ליבות מסיבה כזאת אחרת בין אם זה חלוקת שוק או חלוקת צריכת חשמל.
ר.ב: בדוגמאות שנתת באמת הארכיטקטורה הזאת נותנת גמישות מרבית. אפשר לעשות הרבה גרפיקה או מעט גרפיקה, לשחק עם כמות ליבות העיבוד לפי הצורך. אפשר גם לתת מנעד גדול יותר של IO כאשר מחליטים לרענן את הארכיטקטורה ואת קו המעבדים בעתיד. לא צריך לשנות עבור כך את כל המערכת. גם מבחינת העיצוב זה מאוד פשוט וזה גם מקצר את הזמנים.

אנחנו לא מדברים על דורות עתידיים אבל במידה ונחליט לעשות ריענון עבור סדרת מעבדים, מאוד קל לעשות זאת עם עיצוב שרק משפר את כח העיבוד הכללי. זה מאוד פשוט. אתה יכול לדגום מתהליך יצור מתקדם יותר, להשתמש בעיצוב סיליקון מתקדם יותר ולהטמיע אותו בעיצוב שלך. אותו דבר לשאר האלמנטים – רוצים IO חדש, רוצים גרפיקה חזקה, מאוד פשוט לעשות את זה.
ל.מ: אני יוצא מנקודת הנחה שזה נותן איזשהו חופש מסוים לקבוצות הפיתוח. רוצה להאמין שאם לדוגמה מפתחים איזשהו IO מתקדם משמעותית אז האינטגרציה שלו היא הרבה יותר פשוטה.
ר.ב: זה גם הרבה יותר פשוט. קבוצות פיתוח מסוימות לא מייצרות מגבלות עבור קבוצות פיתוח אחרות. אם את ה-IO אתה רוצה לייצר באיזשהו תהליך מסוים או ליצור מספר מצומצם של גרסאות, אז אתה יכול לעשות את זה בלי להכריח את ה-IO להיות בדיוק באותו תהליך יצור של אריחים אחרים.

לפעמים מאוד קשה לעשות תהליכי IO מתקדמים כי לוקח הרבה זמן עד שהם מבשילים. אם תסתכל במטאור לייק, אז תראה שהחלק של העיבוד הכללי (אריח העיבוד) מאוד קטן ובעצם מאפשר להיות בחזית תהליכי היצור לפני שתהליך היצור עצמו ממשיך להבשיל. הבשלה של תהליך יצור תאפשר יצירת פיסות סיליקון גדולות יותר. כך, ניתן להחדיר תהליך יצור חדש אל השוק באופן הדרגתי.
ל.מ: מטאור לייק מציג משהו שהוא חדש לא רק אצל אינטל, אלא בכל עולם המחשוב. באריח ה-SOC יש לנו ליבות עיבוד חדשות, ה-Low Profile E-Core, שהן יעילות במיוחד. את העניין של עיבוד היברידי בעולם x86 עוד הכרנו ב-Alder Lake (דור 12) וכעת נעשה עוד צעד והגענו לעיבוד שהוא תלת-שכבתי.
יכול להיות שמשתמשים מסוימים יסתכלו על זה ויגידו "רגע, עד עכשיו קיבלנו 2 סוגי ליבות במעבדים שלנו, שזה דבר שמביא מורכבות מסוימת וכעת יש לנו עוד סוג?". איך אינטל מבצעת את התהליך הזה כשזה מגיע בצורה החלקה ביותר והשקופה ביותר לצרכן? כמה אקטיביות הן השותפות של אינטל ברמת התוכנה דוגמת מיקרוסופט ואנשי הקרנל של לינוקס?
ר.ב: אתחיל בסוף – הצלחה שלנו היא כך שזה שקוף למשתמש, ושהוא מרוויח מזה מבלי "להרגיש" שהתבצע שינוי שכזה במעבד. בחזרה להתחלה, כן, התחלנו את השימוש ההיברידי שלנו בליבות עיבוד עוד בדור 12 עם Alder Lake, שם יש ליבות Performance Core חזקות לצד ליבות Efficiency Core יעילות. השתמשנו בארכיטקטורה ההיברידית הזאת בעיקר כמאיץ תהליכים מרובים, מצב שבו יש לך כמשתמש הרבה תוכנות והרבה תהליכי עיבוד שחלק מכובד מהם אפשר להעמיס על הליבות היעילות יותר וכך להעלות את כלל יעילות העיבוד שלך.

כמו שאמרת במטאור לייק הכנסנו את השלב הבא. השלב הבא זו ליבה שמיועדת למשימות של אורך חיי סוללה. משימות שאני רוצה שהמערכת שלי תריץ בצורה הכי אופטימלית וזמן הסוללה יהיה כמה שיותר ארוך. למשימות הללו הבאנו את הליבה היעילה ביותר שמתאימה וזו למעשה סוג הליבה שנמצא בתוך אריח ה-SOC, ה-Low Profile Efficiency Core או LP E-Core. לא רק שהליבה הזאת יעילה, אלא בגלל שיש מעט שכאלה (צמד במטאור לייק) אז אפשר להשתמש בה עם יתרת צריכת חשמל מינימלית (כאשר כל ליבה פועלת בסיליקון, כל קבוצת הליבות מקבלת זרם חשמלי).

ליבות ה-LP E-Cores הללו ששוכנות באריח ה-SOC יושבות מאוד קרוב לערוץ הזיכרון והתצוגה והגרפיקה והמאיצים האחרים וברוב התרחישים היומיומיים אם אתה רואה סרט, או יושב בישיבה בטימס או זום בלי הרבה אנשים שמפעילים וידאו או בגלישה באינטרנט אז בעצם רק העיבוד שבאריח ה-SOC יעבוד וכל האריכים של העיבוד הכללי הוא הגרפיקה או ה-IO – הם יהיו מכובים.

הרמה השלישית של עיבוד שהוספנו היא גם ליבות יעילות, וגם מיקום יעיל ונכון של הליבות הללו לצד מאיצים אחרים. כך זה מאפשר לכל תרחיש שהמשתמש מבצע את השילוב הנכון של כח עיבוד ורכיבי סיליקון שונים. בשביל שזה יקרה יש הרבה שיתוף פעולה עם כל מערכות ההפעלה כי בסופו של דבר יש להם הרבה שליטה על זה. המפעיל יכול להחליט איך לעשות כיוונון למערכת. מקסימום ביצועים, מקסימום זמן סוללה, ולפי ההחלטות האלה ותמיכה של מערכת ההפעלה בעצם אנחנו דואגים לכך שבכל שלב נתון כל משימה תהיה על הליבה שהכי מתאימה לה.
ל.מ: איך אינטל דואגת לכך שהיא תישאר תחרותית, או במקרה של עולם הלפטופים היום תהפוך לתחרותית? בשנים האחרונות נוצר טרנד מאוד חזק של מחשבים ניידים קלי משקל ובעלי אורך חיי סוללה מאוד גבוהים – אבל הבעיה של אינטל היא שלא מדובר בלפטופים מבוססי x86 בכלל, אלא כאלה שמגיעים מהתחרות (אפל). איך מערכת היחסים שלכם עם חברות כמו לנובו או דל או HP נראות כשניגשים ליצר את המוצרים בפועל לשוק אל מול תחרות כל כך רצינית?
ר.ב: יש פה דחיפה משותפת של שלושה גורמים. מצד אחד זה אותם OEM שתיארת שברור להם שככל שהמערכות יהיו יותר שקטות, יותר דקות, יותר יפות ועם ביצועים טובים הם ימכרו יותר. זה חשוב להם, זה חשוב לנו, וזה חשוב למיקרוסופט שמתחרה כספקית של מערכת הפעלה.

היא בעצם הצד השלישי באופטימיזציה הזאת. יש הרבה שיתופי פעולה גם באחד על אחד, גם של שלושת הגורמים ביחד בלראות איך בונים מערכות יותר טובות, יותר יפות ויותר יעילות.

כן, יש הרבה תלות במערכת ההפעלה. הרבה אופטימיזציה נעשית במערכת ההפעלה על ידי בחירה מה לעשות מתי, איך לתאם את כל התהליכים שרצים על מעבד, איך לנצל את הליבות בצורה הכי נכונה ומתי לנצל מאיץ מסוים כשצריך אותו.
ל.מ: אפרופו מאיץ, והנה מעבר לחלק אחר מאוד מעניין. רכיב בעל נוכחות רצינית שנמצא במעבדי מטאור לייק, ונוכח שם יותר מאשר בכל ארכיטקטורה קודמת הוא ה-NPU או Neural Processing Unit, יחידת עיבוד שמטרתה היא האצה של פעולות AI ולימוד מכונה. אשמח לדעת מה הרקע של פיתוח הרכיב הזה ומה הוביל להטמעה שלו כפי שמופיע במעבד מטאור לייק, כמו גם משמעותו בעיבוד היומיום.
ר.ב: זמן הפיתוח של מעבד ממתי שמתחילים עד שיוצא לשוק הוא בדרך כלל שלוש שנים, אולי קצת יותר. אתה יכול להבין שאת ההחלטה להטמיע NPU בתוך המעבד קיבלנו לפני כשלוש שנים וזה היה די הימור. היה באז, ידענו AI אבל לא בהכרח ידענו לאן זה ילך כי קשה לצפות את העתיד בעולם ה-AI. בדיעבד זאת ההחלטה הנכונה. במטאור לייק יש שלוש אפשרויות לנצל מטלות עיבוד עבור AI וזה מאוד תלוי בסוג העיבוד שאתה מטיל על המעבד.

אז NPU הוא המאיץ העיקרי ובכל שלב שאתה צריך AI בביצועים מתקדמים וביעילות גבוהה אתה תרצה להריץ את זה על ה-NPU. אתה כותב את התוכנה בצורה שיודעת להשתמש במאיץ (דוגמת OpenVINO של אינטל) וזה לרוב המקרים שאתה רוצה את שילוב הביצועים הזה. בין אם זה ברקע שיש לך עכשיו בטימס (שיחת וידאו שבה מתבצע טשטוש של הרקע שלי על בסיס זיהוי המתאר שלי) או בכל שימוש יומיומי אחר כמו צריכה של תוכן או שיתוף פעולה בין אנשים. זה יכול גם להיות בשימוש כאשר אתה עובד בכתיבת מסמכים או בשליחת מיילים. אלו השימושים של רכיב ה-NPU במעבד.
מאיץ שני שיודע להאיץ תהליכי AI היא הליבה הגרפית. יש לה כח עיבוד מאוד גבוה במעבדי מטאור לייק ונשמש בה בעיקר וגם תוך כדי שאנחנו משתמשים בה לתהליכים אחרים כמו עיבוד תמונה או רינדור או האצת וידאו כזאת או אחרת. גם האצות AI במשחקים הם חלק ממה שהליבה הגרפית המובנית יודעת לעשות, עם טכנולוגיות כמו XeSS.
כמובן שהמאיץ השלישי הוא ליבות העיבוד הראשיות, שהן מריץ לא רע בכלל. בכל מקרה שנרצה משהו בתזמון מאוד נמוך או שכתבנו תוכנה מאוד ארוכה וצריך קטע קטן שמריץ גם AI אז נשתמש בליבות העיבוד בצורה הכי פשוטה למתכנת.
כל הקונספט של AI אנחנו מדברים עליו הרבה אבל הוא בהתחלה. זה דבר שיגביר את עצמו שכן ככל שהמתכנתים יתרגלו להשתמש ביכולות האלה הם ישתמשו בהם גם לדברים שהיום אפשר לעשות אחרת. משנה לשנה גם ימציאו שימושים חדשים למאיצים האלה וגם יתחילו להשתמש בהם יותר ויותר לדברים שהיום אנחנו פותרים בצורה אחרת. היכולת של אינטל להגיע מאוד מהר לעשרות מיליוני מחשבים שיושבים בבתים ויש להם את היכולות האלה תעזור לתהליך הזה של התגברות השימוש ב-AI.