امروز، انویدیا در کنفرانس فناوری GPU خود (GPU Technology Conference) ، جزئیات معماری هاپر (Hopper) و پردازنده گرافیکی Nvidia H100 را فاش کرد. میدانستیم که انویدیا مدتی است روی پردازندههای گرافیکی نسل بعدی کار میکند، اما اکنون برخی از مشخصات دقیق آن را دراختیار داریم. معماری هاپر و پردازنده گرافیکی H100 را نباید با Ada، معماری متمرکز بر مصرفکننده که کارتهای GeForce آینده را تأمین میکند، اشتباه گرفت. انویدیا هنوز هیچ جزئیاتی در مورد Ada فاش نکرده و Hopper H100 جایگزین Ampere A100 خواهد شد که خود جایگزین Volta V100 شده است. اینها همه بخشهای مرکز داده هستند.
به گزارش tomshardware، همانطورکه با توجه به میراث آن انتظار میرود، H100 برای ابررایانهها با تمرکز بر قابلیتهای هوش مصنوعی طراحی شده است. این گزینه شامل بهروزرسانیها و ارتقاءهای متعدد در مقایسه با A100 فعلی است و همه طراحیها برای رسیدن به سطوح جدیدی از عملکرد و کارایی بهبود یافتهاند. هاپر ۸۰ میلیارد ترانزیستور دارد و با استفاده از فرایند سفارشی TSMC 4N ساخته شده است.
انویدیا تعداد هسته یا کلاک را فاش نکرد، اما جزئیات دیگری را به اشتراک گذاشت. H100 از نسل چهارم رابط NVLink انویدیا پشتیبانی میکند که میتواند تا ۱۲۸ گیگابایت بر ثانیه پهنای باند ارائه دهد. اتصال NVLink بهروز شده ۱٫۵ برابر پهنای باند بیشتری نسبت به A100 ارائه میدهد، درحالیکه PCIe 5.0 دو برابر پهنای باند PCIe 4.0 دراختیار سیستم قرار میگذارد.
H100 همچنین بهطور پیشفرض از ۸۰ گیگابایت حافظه HBM3 با پهنای باند ۳ ترابایت بر ثانیه پشتیبانی میکند که ۱٫۵ برابر سریعتر از HBM2E است. بهطور کلی، H100 نسبت به مدل قبلی خود ۵۰ درصد حافظه و پهنای باند رابط بیشتری دارد.
مطمئناً این پیشرفت خوبی محسوب میشود، اما سایر جنبههای هاپر پیشرفتهای بیشتری را تجربه کرده است؛ هاپر پشتیبانی بهبودیافته FP8 را با حداکثر ۴۰۰۰ TFLOPS محاسباتی ارائه میدهد که شش برابر سریعتر از A100 است. برای کمک به بهینهسازی عملکرد، انویدیا موتور ترانسفورماتور جدیدی نیز دارد که براساس حجمکاری بهطور خودکار بین فرمتهای FP8 و FP16 جابهجا میشود.
انویدیا دستورالعملهای جدید DPX را نیز ارائه خواهد کرد که برای تسریع برنامهنویسی پویا طراحی شدهاند. آنها میتوانند به طیف گستردهای از الگوریتمها، از جمله بهینهسازی مسیر و ژنومیک کمک کنند. انویدیا ادعا میکند عملکرد در این الگوریتمها تا ۷ برابر سریعتر از GPUهای نسل قبلیاش و تا ۴۰ برابر سریعتر از الگوریتمهای مبتنی بر CPU است. هاپر همچنین روی افزایش امنیت نیز تمرکز کرده است.
همه این تغییرات برای اهداف ابررایانه و هوش مصنوعی انویدیا مهم هستند. بااینحال، تغییرات برای بهتر شدن کافی نیست. بهطور کلی، انتظار داریم H100 عملکرد دو تا سه برابر سریعتر از Nvidia A100 باشد.
انویدیا مدعی است اسکیلهای H100 بهتر از A100 است و میتواند تا ۹ برابر توان عملیاتی بیشتری را در آموزش هوشمصنوعی ارائه دهد. این شرکت میگوید H100 تا ۷ برابر سریعتر از A100 است.