غول های پلتفرم Rubin انویدیا معرفی شدند؛ اعداد و ارقام توان پردازشی نسل آینده پردازنده‌های گرافیکی که فکرش را هم نمی‌کنید


غول های پلتفرم Rubin انویدیا معرفی شدند؛ اعداد و ارقام توان پردازشی نسل آینده پردازنده‌های گرافیکی که فکرش را هم نمی‌کنید

انویدیا در کنفرانس GTC ۲۰۲۵، نسل آینده پردازنده‌های گرافیکی مراکز داده خود را معرفی کرد. این شرکت با رونمایی از پلتفرم روبین (Rubin) و روبین اولترا (Rubin Ultra)، چشم‌انداز خود را برای سال‌های ۲۰۲۶ و ۲۰۲۷ مشخص کرد. در ادامه با همه مشخصات فنی و...

انویدیا در کنفرانس GTC ۲۰۲۵، نسل آینده پردازنده‌های گرافیکی مراکز داده خود را معرفی کرد. این شرکت با رونمایی از پلتفرم روبین (Rubin) و روبین اولترا (Rubin Ultra)، چشم‌انداز خود را برای سال‌های ۲۰۲۶ و ۲۰۲۷ مشخص کرد. در ادامه با همه مشخصات فنی و پتانسیل‌های عظیم این پردازنده‌های گرافیکی و همچنین پردازنده VERA آشنا شوید.

در کنفرانس GTC ۲۰۲۵، جنسن هوانگ، مدیرعامل شرکت انویدیا، به‌روزرسانی جدیدی از نقشه راه پردازنده‌های گرافیکی مراکز داده این شرکت برای سال‌های ۲۰۲۶ و ۲۰۲۷ را ارائه کرد. او از پلتفرم روبین، که به‌زودی در نیمه دوم سال ۲۰۲۵ وارد بازار خواهد شد، و روبین اولترا، که در نیمه دوم ۲۰۲۷ معرفی خواهد شد، پرده برداشت.

این معرفی‌ها در حالی صورت می‌گیرد که انویدیا هنوز تولید کامل پردازنده گرافیکی Blackwell B۲۰۰ را به پایان نرسانده و پردازنده B۳۰۰ را برای نیمه دوم سال ۲۰۲۵ آماده کرده است، اما هم‌زمان با این پیشرفت‌ها، شرکت نگاهی به آینده دارد و در تلاش است تا همکاران خود را برای گذار به نسل‌های جدیدتر آماده کند.

در همین رابطه بخوانید:

- غول‌ پردازشی Blackwell Ultra B۳۰۰ معرفی شد؛ ۲۸۸ گیگابایت حافظه HBM۳e و ۱۵ پتافلاپ عملکرد FP۴

نقشه راه پردازنده های انویدیا نقشه راه پردازنده های انویدیا

تحول در نام‌گذاری و توپولوژی NVLink

یکی از نکات مهمی که در این کنفرانس مطرح شد، اصلاح نحوه نام‌گذاری پردازنده‌های گرافیکی بود.

نام‌گذاری Blackwell اشتباه بود

در بخش‌های ابتدایی این نطق، جنسن هوانگ، مدیرعامل انویدیا، توضیح داد که Blackwell B۲۰۰ در واقع دارای دو هسته (die) در هر GPU است که باعث تغییر در توپولوژی NVLink می‌شود. بنابراین، اگرچه این پردازنده در ابتدا Blackwell B۲۰۰ NVL۷۲ نام‌گذاری شده بود، اما بهتر بود با نام NV۱۴۴L معرفی می‌شد. این تغییر در نام‌گذاری در پردازنده‌های روبین نیز اعمال خواهد شد.

nvl72.webp

مشخصات پردازنده‌های روبین (Rubin NVL۱۴۴)

طبق اعلام انویدیا پردازنده Rubin NVL۱۴۴ جایگزین مدل Blackwell NVL۷۲ خواهد شد و به‌طور کامل با زیرساخت‌های فعلی سازگار خواهد بود.

بهبود چشمگیر در عملکرد محاسباتی

در اولین نمودار منتشر شده توسط هوانگ، اطلاعات مربوط به مدل روبین NVL۱۴۴ نمایش داده شد که به‌طور کامل با زیرساخت‌های موجود Blackwell NVL۷۲ سازگار است. پردازنده B۳۰۰ NVL۷۲ توان محاسباتی ۱,۱ پتافلاپس در محاسبات FP۴ فشرده ارائه می‌دهد، در حالی که مدل روبین NVL۱۴۴ با همان ۱۴۴ هسته GPU، توان محاسباتی ۳,۶ پتافلاپس در FP۴ را ارائه خواهد داد.

nvl144.webp

به صورت کلی می‌توان ارتقاهای ایجاد شده در این نسل را به صورت زیر عنوان و خلاصه کرد:

  • ۳,۶ پتافلاپس قدرت پردازشی در FP۴ (در مقابل ۱,۱ پتافلاپس در Blackwell B۳۰۰ NVL۷۲)
  • ۱,۲ اگزافلاپس توانایی پردازشی در آموزش FP۸ (در مقایسه با ۰,۳۶ اگزافلاپس در B۳۰۰)
  • بهبود ۳,۳ برابری در عملکرد محاسباتی نسبت به نسل قبل

ارتقاء حافظه و ارتباطات بین‌پردازشی

روبین به عنوان نقطه عطفی در انتقال از حافظه HBM۳/HBM۳e به HBM۴ نیز تلقی خواهد شد. ظرفیت حافظه همچنان ۲۸۸ گیگابایت به ازای هر GPU خواهد بود، مشابه B۳۰۰، اما پهنای باند از ۸ ترابایت بر ثانیه به ۱۳ ترابایت بر ثانیه افزایش خواهد یافت. انویدیا اعلام کرده که حافظه HBM۴e برای مدل روبین اولترا مورد استفاده قرار خواهد گرفت.

نکته دیگر این است که پیوند NVLink سریع‌تری نیز توسط تیم سبز ارائه خواهد شد که از پهنای باند ۲۶۰ ترابایت بر ثانیه برخوردار خواهد بود. مضاف بر این یک لینک جدید CX۹ بین رک‌ها با پهنای باند ۲۸,۸ ترابایت بر ثانیه نیز به خدمت گرفته می‌شود، که ظرفیت پهنای باند آن دو برابر پهنای باند B۳۰۰ و CX۸ خواهد بود.

با توجه به موارد فوق می‌توان گفت که اهم ارتقاهای ایجاد شده حافظه در روبین به شرح زیر خواهند بود:

  • گذار از HBM۳/HBM۳e به HBM۴
  • استفاده از HBM۴e در نسخه روبین اولترا
  • افزایش پهنای باند حافظه از ۸ ترابایت بر ثانیه به ۱۳ ترابایت بر ثانیه
  • استفاده از NVLink جدید با دو برابر پهنای باند (۲۶۰ ترابایت بر ثانیه)
  • معرفی لینک CX۹ بین رک‌ها با پهنای باند ۲۸,۸ ترابایت بر ثانیه (۲ برابر CX۸)

پردازنده مرکزی ورا (Vera CPU): قدرتی جدید در معماری پردازشی انویدیا

با معرفی نسل جدید پردازنده‌های گرافیکی روبین، انویدیا پردازنده مرکزی جدید خود را نیز به نام ورا (Vera CPU) معرفی کرد که جایگزین پردازنده‌های Grace خواهد شد. این پردازنده که بر اساس معماری ARM سفارشی‌شده توسعه یافته، با هدف ارائه عملکرد بهینه در پردازش‌های مراکز داده و هوش مصنوعی طراحی شده است.

ورا از ۸۸ هسته پردازشی و ۱۷۶ رشته موازی بهره می‌برد که امکان پردازش حجم عظیمی از داده‌ها را با کمترین تأخیر فراهم می‌کند. همچنین، این پردازنده برای ارتباط مستقیم و بدون وقفه با پردازنده‌های گرافیکی روبین، به یک رابط NVLink با پهنای باند ۱,۸ ترابایت بر ثانیه مجهز شده است که تعامل بین GPU و CPU را به سطح جدیدی ارتقا می‌دهد.

در کنار این مشخصات، ورا بهینه‌سازی‌های خاصی برای پردازش‌های مبتنی بر هوش مصنوعی و یادگیری عمیق دارد که آن را به گزینه‌ای ایده‌آل برای مراکز داده تبدیل می‌کند. با ترکیب ورا و روبین، انویدیا در تلاش است یک اکوسیستم پردازشی کاملاً هماهنگ و یکپارچه ایجاد کند که نه‌تنها قدرت پردازشی را به حداکثر برساند، بلکه مصرف انرژی و بازدهی کلی سیستم را نیز بهینه کند.

این پردازنده، علاوه بر پشتیبانی از حافظه‌های پرسرعت HBM، با فناوری‌های جدید ارتباطی و شبکه‌ای ترکیب شده تا عملکردی پایدار و مقیاس‌پذیر در بارهای پردازشی سنگین ارائه دهد. ورا تنها یک پردازنده مرکزی نیست؛ بلکه هسته‌ای کلیدی در نسل جدید پردازش‌های انویدیا خواهد بود.

مشخصات پردازنده‌های روبین اولترا (Rubin Ultra NVL۵۷۶)

بخش مهم و جذاب دیگر این مراسم معرفی پردازنده‌های روبین اولترا بود که طبق اعلام شرکت، در نیمه دوم سال ۲۰۲۷ وارد بازار خواهد شد. در این مدل، پردازنده ورا همچنان باقی خواهد ماند، اما از نظر پردازش گرافیکی، تغییرات بزرگی را تجربه خواهیم کرد. آرایش جدیدی در رک‌ها جایگزین خواهد شد که به نام NVL۵۷۶ شناخته می‌شود. این مدل قادر خواهد بود تا ۵۷۶ پردازنده گرافیکی را در یک رک جای دهد که مصرف توان آن هنوز مشخص نشده است.

nvl576.webp

افزایش تعداد GPU، حافظه و پهنای باند

در حالی که مدل روبین NVL۱۴۴ دارای ۷۵ ترابایت حافظه سریع (برای هر دو پردازنده CPU و GPU) در هر رک است، مدل روبین اولترا NVL۵۷۶ دارای ۳۶۵ ترابایت حافظه خواهد بود. پردازنده‌های گرافیکی این مدل از حافظه HBM۴e بهره خواهند برد، اما جالب اینجاست که انویدیا پهنای باند ۴,۶ پتابایت بر ثانیه برای حافظه HBM۴e را اعلام کرده است، که در مجموع با ۵۷۶ پردازنده گرافیکی، این مقدار به ۸ ترابایت بر ثانیه برای هر GPU می‌رسد.

نکته مهمی که باید در اینجا به آن اشاره کنیم این است که به نظر می‌رسد پهنای باند اعلامی برای روبین اولترا کمتر از مدل‌های قبلی باشد، اما احتمالاً این شرایط به نحوه اتصال چهار هسته GPU در هر پکیج مرتبط است. همچنین هر چهار پردازنده GPU در هر رک دارای ۱ ترابایت حافظه HBM۴e خواهند بود و قادر به انجام ۱۰۰ پتافلاپ محاسبات FP۴ خواهند بود.

عملکرد استنباط (inference) در FP۴ به ۱۵ اگزافلاپس خواهد رسید، در حالی که محاسبات آموزش FP۸ به ۵ اگزافلاپس افزایش خواهد یافت. این رقم تقریبا چهار برابر ظرفیت محاسباتی روبین NVL۱۴۴ است که منطقی است چرا که تعداد پردازنده‌های گرافیکی نیز چهار برابر خواهد شد. در این مدل، هر پکیج از چهار هسته GPU تشکیل شده تا چگالی محاسباتی افزایش یابد.

رابط NVLink۷ در مدل روبین اولترا شش برابر سریع‌تر از مدل روبین خواهد بود و قادر به ارائه پهنای باند ۱,۵ پتابایت بر ثانیه است. همچنین ارتباطات CX۹ بین رک‌ها نیز شاهد چهار برابر بهبود در پهنای باند به ۱۱۵,۲ ترابایت بر ثانیه خواهند بود که احتمالاً به دلیل افزایش تعداد لینک‌ها است.

به صورت کلی می‌توانیم ارتقاهای صورت گرفته در پردازنده روبین اولترا را به شرح زیر خلاصه کنیم:

  • تا ۵۷۶ پردازنده گرافیکی در هر رک
  • ۱۵ اگزافلاپس قدرت استنباطی در FP۴
  • ۵ اگزافلاپس قدرت آموزش در FP۸
  • استفاده از ۴ هسته GPU در هر پکیج برای افزایش چگالی پردازشی
  • ۳۶۵ ترابایت حافظه سریع در هر رک
  • استفاده از HBM۴e با پهنای باند ۴,۶ پتابایت بر ثانیه
  • هر ۴ پردازنده GPU دارای ۱ ترابایت حافظه HBM۴e
  • ۱۰۰ پتافلاپ توان محاسباتی FP۴
  • رابط NVLink۷، شش برابر سریع‌تر از مدل روبین با ۱,۵ پتابایت بر ثانیه پهنای باند
  • ارتقاء پهنای باند CX۹ بین رک‌ها به ۱۱۵,۲ ترابایت بر ثانیه (۴ برابر نسخه قبلی)

آینده پردازنده‌های انویدیا: معماری فاینمن (Feynman)

انویدیا با معرفی روبین و روبین اولترا، مسیر خود را تا سال ۲۰۲۷ مشخص کرده است، اما این پایان راه نیست. پس از روبین، معماری بعدی انویدیا در مراکز داده با نام فیزیکدان نظری ریچارد فاینمن معرفی خواهد شد.

feynman.webp

این نام‌گذاری نشان می‌دهد، در صورتی که انویدیا الگوی نام‌گذاری خود را ادامه دهد، در آینده شاهد پردازنده‌های فاینمن (Feynman GPUs) و پردازنده‌های مرکزی ریچارد (Richard CPUs) خواهیم بود.

معماری Feynman نام خود را از ریچارد فاینمن، فیزیکدان نظری برجسته آمریکایی گرفته است که به دلیل نقش کلیدی‌اش در مکانیک کوانتومی، الکترودینامیک کوانتومی و مدل پارتونی در فیزیک ذرات شناخته می‌شود. انتخاب این نام نشان‌دهنده‌ی رویکرد جدید انویدیا در پردازش‌های پیشرفته‌ی هوش مصنوعی است که احتمالاً به روش‌های محاسباتی الهام‌گرفته از فیزیک کوانتومی نزدیک‌تر خواهد شد.

درحالیکه هنوز اطلاعات خاصی در مورد این معماری عنوان نشده باید گفت که معماری فاینمن احتمالاً یکی از بزرگ‌ترین جهش‌های انویدیا در حوزه پردازش‌های هوش مصنوعی و یادگیری عمیق خواهد بود. استفاده از حافظه‌های نسل بعدی، بهینه‌سازی پردازنده‌ی مرکزی و افزایش قدرت پردازشی، آن را به یک راهکار ایده‌آل برای مراکز داده و پردازش‌های پیچیده‌ی هوش مصنوعی تبدیل خواهد کرد.

همچنین، اگر انویدیا از مفاهیم الهام‌گرفته از فیزیک کوانتومی برای افزایش بهره‌وری پردازش استفاده کند، می‌توان انتظار داشت که معماری فاینمن سرآغاز یک تغییر اساسی در دنیای محاسبات هوش مصنوعی باشد.



منتخب امروز

بیشترین بازدید یک ساعت گذشته

بهترین سیستم کامپیوتر پیشنهادی بر اساس قیمت و کاربرد