انویدیا در کنفرانس GTC ۲۰۲۵، نسل آینده پردازندههای گرافیکی مراکز داده خود را معرفی کرد. این شرکت با رونمایی از پلتفرم روبین (Rubin) و روبین اولترا (Rubin Ultra)، چشمانداز خود را برای سالهای ۲۰۲۶ و ۲۰۲۷ مشخص کرد. در ادامه با همه مشخصات فنی و پتانسیلهای عظیم این پردازندههای گرافیکی و همچنین پردازنده VERA آشنا شوید.
در کنفرانس GTC ۲۰۲۵، جنسن هوانگ، مدیرعامل شرکت انویدیا، بهروزرسانی جدیدی از نقشه راه پردازندههای گرافیکی مراکز داده این شرکت برای سالهای ۲۰۲۶ و ۲۰۲۷ را ارائه کرد. او از پلتفرم روبین، که بهزودی در نیمه دوم سال ۲۰۲۵ وارد بازار خواهد شد، و روبین اولترا، که در نیمه دوم ۲۰۲۷ معرفی خواهد شد، پرده برداشت.
این معرفیها در حالی صورت میگیرد که انویدیا هنوز تولید کامل پردازنده گرافیکی Blackwell B۲۰۰ را به پایان نرسانده و پردازنده B۳۰۰ را برای نیمه دوم سال ۲۰۲۵ آماده کرده است، اما همزمان با این پیشرفتها، شرکت نگاهی به آینده دارد و در تلاش است تا همکاران خود را برای گذار به نسلهای جدیدتر آماده کند.
در همین رابطه بخوانید:
- غول پردازشی Blackwell Ultra B۳۰۰ معرفی شد؛ ۲۸۸ گیگابایت حافظه HBM۳e و ۱۵ پتافلاپ عملکرد FP۴
تحول در نامگذاری و توپولوژی NVLink
یکی از نکات مهمی که در این کنفرانس مطرح شد، اصلاح نحوه نامگذاری پردازندههای گرافیکی بود.
نامگذاری Blackwell اشتباه بود
در بخشهای ابتدایی این نطق، جنسن هوانگ، مدیرعامل انویدیا، توضیح داد که Blackwell B۲۰۰ در واقع دارای دو هسته (die) در هر GPU است که باعث تغییر در توپولوژی NVLink میشود. بنابراین، اگرچه این پردازنده در ابتدا Blackwell B۲۰۰ NVL۷۲ نامگذاری شده بود، اما بهتر بود با نام NV۱۴۴L معرفی میشد. این تغییر در نامگذاری در پردازندههای روبین نیز اعمال خواهد شد.
مشخصات پردازندههای روبین (Rubin NVL۱۴۴)
طبق اعلام انویدیا پردازنده Rubin NVL۱۴۴ جایگزین مدل Blackwell NVL۷۲ خواهد شد و بهطور کامل با زیرساختهای فعلی سازگار خواهد بود.
بهبود چشمگیر در عملکرد محاسباتی
در اولین نمودار منتشر شده توسط هوانگ، اطلاعات مربوط به مدل روبین NVL۱۴۴ نمایش داده شد که بهطور کامل با زیرساختهای موجود Blackwell NVL۷۲ سازگار است. پردازنده B۳۰۰ NVL۷۲ توان محاسباتی ۱,۱ پتافلاپس در محاسبات FP۴ فشرده ارائه میدهد، در حالی که مدل روبین NVL۱۴۴ با همان ۱۴۴ هسته GPU، توان محاسباتی ۳,۶ پتافلاپس در FP۴ را ارائه خواهد داد.
به صورت کلی میتوان ارتقاهای ایجاد شده در این نسل را به صورت زیر عنوان و خلاصه کرد:
- ۳,۶ پتافلاپس قدرت پردازشی در FP۴ (در مقابل ۱,۱ پتافلاپس در Blackwell B۳۰۰ NVL۷۲)
- ۱,۲ اگزافلاپس توانایی پردازشی در آموزش FP۸ (در مقایسه با ۰,۳۶ اگزافلاپس در B۳۰۰)
- بهبود ۳,۳ برابری در عملکرد محاسباتی نسبت به نسل قبل
ارتقاء حافظه و ارتباطات بینپردازشی
روبین به عنوان نقطه عطفی در انتقال از حافظه HBM۳/HBM۳e به HBM۴ نیز تلقی خواهد شد. ظرفیت حافظه همچنان ۲۸۸ گیگابایت به ازای هر GPU خواهد بود، مشابه B۳۰۰، اما پهنای باند از ۸ ترابایت بر ثانیه به ۱۳ ترابایت بر ثانیه افزایش خواهد یافت. انویدیا اعلام کرده که حافظه HBM۴e برای مدل روبین اولترا مورد استفاده قرار خواهد گرفت.
نکته دیگر این است که پیوند NVLink سریعتری نیز توسط تیم سبز ارائه خواهد شد که از پهنای باند ۲۶۰ ترابایت بر ثانیه برخوردار خواهد بود. مضاف بر این یک لینک جدید CX۹ بین رکها با پهنای باند ۲۸,۸ ترابایت بر ثانیه نیز به خدمت گرفته میشود، که ظرفیت پهنای باند آن دو برابر پهنای باند B۳۰۰ و CX۸ خواهد بود.
با توجه به موارد فوق میتوان گفت که اهم ارتقاهای ایجاد شده حافظه در روبین به شرح زیر خواهند بود:
- گذار از HBM۳/HBM۳e به HBM۴
- استفاده از HBM۴e در نسخه روبین اولترا
- افزایش پهنای باند حافظه از ۸ ترابایت بر ثانیه به ۱۳ ترابایت بر ثانیه
- استفاده از NVLink جدید با دو برابر پهنای باند (۲۶۰ ترابایت بر ثانیه)
- معرفی لینک CX۹ بین رکها با پهنای باند ۲۸,۸ ترابایت بر ثانیه (۲ برابر CX۸)
پردازنده مرکزی ورا (Vera CPU): قدرتی جدید در معماری پردازشی انویدیا
با معرفی نسل جدید پردازندههای گرافیکی روبین، انویدیا پردازنده مرکزی جدید خود را نیز به نام ورا (Vera CPU) معرفی کرد که جایگزین پردازندههای Grace خواهد شد. این پردازنده که بر اساس معماری ARM سفارشیشده توسعه یافته، با هدف ارائه عملکرد بهینه در پردازشهای مراکز داده و هوش مصنوعی طراحی شده است.
ورا از ۸۸ هسته پردازشی و ۱۷۶ رشته موازی بهره میبرد که امکان پردازش حجم عظیمی از دادهها را با کمترین تأخیر فراهم میکند. همچنین، این پردازنده برای ارتباط مستقیم و بدون وقفه با پردازندههای گرافیکی روبین، به یک رابط NVLink با پهنای باند ۱,۸ ترابایت بر ثانیه مجهز شده است که تعامل بین GPU و CPU را به سطح جدیدی ارتقا میدهد.
در کنار این مشخصات، ورا بهینهسازیهای خاصی برای پردازشهای مبتنی بر هوش مصنوعی و یادگیری عمیق دارد که آن را به گزینهای ایدهآل برای مراکز داده تبدیل میکند. با ترکیب ورا و روبین، انویدیا در تلاش است یک اکوسیستم پردازشی کاملاً هماهنگ و یکپارچه ایجاد کند که نهتنها قدرت پردازشی را به حداکثر برساند، بلکه مصرف انرژی و بازدهی کلی سیستم را نیز بهینه کند.
این پردازنده، علاوه بر پشتیبانی از حافظههای پرسرعت HBM، با فناوریهای جدید ارتباطی و شبکهای ترکیب شده تا عملکردی پایدار و مقیاسپذیر در بارهای پردازشی سنگین ارائه دهد. ورا تنها یک پردازنده مرکزی نیست؛ بلکه هستهای کلیدی در نسل جدید پردازشهای انویدیا خواهد بود.
مشخصات پردازندههای روبین اولترا (Rubin Ultra NVL۵۷۶)
بخش مهم و جذاب دیگر این مراسم معرفی پردازندههای روبین اولترا بود که طبق اعلام شرکت، در نیمه دوم سال ۲۰۲۷ وارد بازار خواهد شد. در این مدل، پردازنده ورا همچنان باقی خواهد ماند، اما از نظر پردازش گرافیکی، تغییرات بزرگی را تجربه خواهیم کرد. آرایش جدیدی در رکها جایگزین خواهد شد که به نام NVL۵۷۶ شناخته میشود. این مدل قادر خواهد بود تا ۵۷۶ پردازنده گرافیکی را در یک رک جای دهد که مصرف توان آن هنوز مشخص نشده است.
افزایش تعداد GPU، حافظه و پهنای باند
در حالی که مدل روبین NVL۱۴۴ دارای ۷۵ ترابایت حافظه سریع (برای هر دو پردازنده CPU و GPU) در هر رک است، مدل روبین اولترا NVL۵۷۶ دارای ۳۶۵ ترابایت حافظه خواهد بود. پردازندههای گرافیکی این مدل از حافظه HBM۴e بهره خواهند برد، اما جالب اینجاست که انویدیا پهنای باند ۴,۶ پتابایت بر ثانیه برای حافظه HBM۴e را اعلام کرده است، که در مجموع با ۵۷۶ پردازنده گرافیکی، این مقدار به ۸ ترابایت بر ثانیه برای هر GPU میرسد.
نکته مهمی که باید در اینجا به آن اشاره کنیم این است که به نظر میرسد پهنای باند اعلامی برای روبین اولترا کمتر از مدلهای قبلی باشد، اما احتمالاً این شرایط به نحوه اتصال چهار هسته GPU در هر پکیج مرتبط است. همچنین هر چهار پردازنده GPU در هر رک دارای ۱ ترابایت حافظه HBM۴e خواهند بود و قادر به انجام ۱۰۰ پتافلاپ محاسبات FP۴ خواهند بود.
عملکرد استنباط (inference) در FP۴ به ۱۵ اگزافلاپس خواهد رسید، در حالی که محاسبات آموزش FP۸ به ۵ اگزافلاپس افزایش خواهد یافت. این رقم تقریبا چهار برابر ظرفیت محاسباتی روبین NVL۱۴۴ است که منطقی است چرا که تعداد پردازندههای گرافیکی نیز چهار برابر خواهد شد. در این مدل، هر پکیج از چهار هسته GPU تشکیل شده تا چگالی محاسباتی افزایش یابد.
رابط NVLink۷ در مدل روبین اولترا شش برابر سریعتر از مدل روبین خواهد بود و قادر به ارائه پهنای باند ۱,۵ پتابایت بر ثانیه است. همچنین ارتباطات CX۹ بین رکها نیز شاهد چهار برابر بهبود در پهنای باند به ۱۱۵,۲ ترابایت بر ثانیه خواهند بود که احتمالاً به دلیل افزایش تعداد لینکها است.
به صورت کلی میتوانیم ارتقاهای صورت گرفته در پردازنده روبین اولترا را به شرح زیر خلاصه کنیم:
- تا ۵۷۶ پردازنده گرافیکی در هر رک
- ۱۵ اگزافلاپس قدرت استنباطی در FP۴
- ۵ اگزافلاپس قدرت آموزش در FP۸
- استفاده از ۴ هسته GPU در هر پکیج برای افزایش چگالی پردازشی
- ۳۶۵ ترابایت حافظه سریع در هر رک
- استفاده از HBM۴e با پهنای باند ۴,۶ پتابایت بر ثانیه
- هر ۴ پردازنده GPU دارای ۱ ترابایت حافظه HBM۴e
- ۱۰۰ پتافلاپ توان محاسباتی FP۴
- رابط NVLink۷، شش برابر سریعتر از مدل روبین با ۱,۵ پتابایت بر ثانیه پهنای باند
- ارتقاء پهنای باند CX۹ بین رکها به ۱۱۵,۲ ترابایت بر ثانیه (۴ برابر نسخه قبلی)
آینده پردازندههای انویدیا: معماری فاینمن (Feynman)
انویدیا با معرفی روبین و روبین اولترا، مسیر خود را تا سال ۲۰۲۷ مشخص کرده است، اما این پایان راه نیست. پس از روبین، معماری بعدی انویدیا در مراکز داده با نام فیزیکدان نظری ریچارد فاینمن معرفی خواهد شد.
این نامگذاری نشان میدهد، در صورتی که انویدیا الگوی نامگذاری خود را ادامه دهد، در آینده شاهد پردازندههای فاینمن (Feynman GPUs) و پردازندههای مرکزی ریچارد (Richard CPUs) خواهیم بود.
معماری Feynman نام خود را از ریچارد فاینمن، فیزیکدان نظری برجسته آمریکایی گرفته است که به دلیل نقش کلیدیاش در مکانیک کوانتومی، الکترودینامیک کوانتومی و مدل پارتونی در فیزیک ذرات شناخته میشود. انتخاب این نام نشاندهندهی رویکرد جدید انویدیا در پردازشهای پیشرفتهی هوش مصنوعی است که احتمالاً به روشهای محاسباتی الهامگرفته از فیزیک کوانتومی نزدیکتر خواهد شد.
درحالیکه هنوز اطلاعات خاصی در مورد این معماری عنوان نشده باید گفت که معماری فاینمن احتمالاً یکی از بزرگترین جهشهای انویدیا در حوزه پردازشهای هوش مصنوعی و یادگیری عمیق خواهد بود. استفاده از حافظههای نسل بعدی، بهینهسازی پردازندهی مرکزی و افزایش قدرت پردازشی، آن را به یک راهکار ایدهآل برای مراکز داده و پردازشهای پیچیدهی هوش مصنوعی تبدیل خواهد کرد.
همچنین، اگر انویدیا از مفاهیم الهامگرفته از فیزیک کوانتومی برای افزایش بهرهوری پردازش استفاده کند، میتوان انتظار داشت که معماری فاینمن سرآغاز یک تغییر اساسی در دنیای محاسبات هوش مصنوعی باشد.