مدیرعامل انویدیا، جنسن هوانگ، با شروع کنفرانس GTC ۲۰۲۵ روی صحنه آمد تا نسل جدید GPUهای هوش مصنوعی Nvidia B۳۰۰ Blackwell Ultra را معرفی کند. این پردازنده تا ۵۰ درصد نسبت به نسل قبل سریعتر است و به ۲۸۸ گیگابایت حافظه HBM۳e با پهنای باند ۸ ترابایت بر ثانیه مجهز است.
ویژگیهای کلیدی Blackwell Ultra B۳۰۰
طبق اعلام Nvidia، این GPU برای «عصر استدلال» طراحی شده است که به مدلهای جدید هوش مصنوعی با قابلیت «Test-Time Compute» مانند DeepSeek R۱ اشاره دارد. این مدلها قادرند فراتر از تکرار اطلاعات آموزش دیده، پاسخ خروجی خود را بررسی و اصلاح کنند. اما معرفی Blackwell Ultra B۳۰۰ تنها به یک پردازنده محدود نمیشود؛ بلکه به عنوان بخشی از سیستمهای جدیدی مانند راهکارهای سرور NVL۱۶، ایستگاه DGX GB۳۰۰ و سیستمهای کامل NV۷۲L عمل میکند.
با تجمیع هشت رَک NV۷۲L، امکان ساخت یک سامانه مجتمع تحت عنوان Blackwell Ultra DGX SuperPOD فراهم میشود که شامل:
- ۲۸۸ پردازنده Grace
- ۵۷۶ پردازنده گرافیکی Blackwell Ultra،
- ۳۰۰ ترابایت حافظه HBM۳e،
- و توان پردازشی بالغ بر ۱۱,۵ اگزافلاپ برای دادههای FP۴ است.
این سیستمها که Nvidia آنها را «کارخانه هوش مصنوعی» مینامد، میتوانند به عنوان زیرساختهای ابررایانهای برای کاربردهای هوش مصنوعی مورد استفاده قرار گیرند.
بهبود در عملکرد و طراحی چیپ
Nvidia اعلام کرده است که GPUهای Blackwell Ultra شامل مدلهای GB۳۰۰ و B۳۰۰ از چیپهای متفاوتی نسبت به نسلهای قبلی GB۲۰۰ و B۲۰۰ بهره میبرند. این پردازندهها به گونهای طراحی شدهاند تا نیازهای مدلهای هوش مصنوعی استدلالی را با افزایش ۱.۵ برابری عملکرد FP۴ برآورده کنند. احتمالاً این امر به معنای استفاده از تراشههای بزرگتر با تعداد هستههای تنسور بیشتر در مدل B۳۰۰ است.
بهبود عملکرد محاسباتی در B۳۰۰ نسبت به B۲۰۰ به وضوح قابل مشاهده است. افزایش ۵۰ درصدی حافظه روی پردازنده، امکان توسعه مدلهای هوش مصنوعی با تعداد پارامترهای بیشتر را فراهم میکند. انویدیا نمونههایی از کارایی این فناوری را ارائه کرده است.
به عنوان مثال، با استفاده از دستورالعملهای FP۴ و نرمافزار جدید Dynamo برای اجرای مدلهای استنتاج مانند DeepSeek، یک رَک NV۷۲L میتواند تا ۳۰ برابر عملکرد استنتاج بالاتری نسبت به سختافزار مشابه با معماری Hopper ارائه دهد. در یک مثال دیگر، Blackwell Ultra قادر است تا با مدل DeepSeek R۱-۶۷۱B حداکثر ۱۰۰۰ توکن در ثانیه تولید کند در حالی که Hopper تنها ۱۰۰ توکن در ثانیه ارائه میدهد؛ بدین ترتیب زمان پاسخگویی به یک درخواست بزرگ از ۱.۵ دقیقه به تنها ۱۰ ثانیه کاهش مییابد.
در همین رابطه بخوانید:
زمان عرضه Blackwell Ultra
پیشبینی میشود محصولات مبتنی بر B۳۰۰ در نیمه دوم سال جاری میلادی به بازار عرضه شوند. با توجه به درآمد ۱۱ میلیارد دلاری حاصل از مدلهای قبلی (B۲۰۰/B۱۰۰) در سال مالی گذشته، انتظار میرود Nvidia بتواند با ارائه این فناوری نوین، به طور چشمگیری درآمد خود را در سال آینده افزایش دهد.