گوگل امروز از جدیدترین نسل مدلهای هوش مصنوعی خود با نام Gemini ۲,۵ رونمایی کرد و آن را «هوشمندترین» مدل خود تا به امروز خواند. اولین نسخه معرفی شده از این نسل، Gemini ۲,۵ Pro Experimental نام دارد که به گفته گوگل، یک «مدل استدلالی» است و برای حل مسائل بسیار پیچیده طراحی شده است.
این مدل آزمایشی توانسته در بنچمارکهای معتبر عملکردی خیرهکننده از خود نشان دهد و با اختلاف قابل توجهی در صدر جدول ردهبندی LMArena قرار گیرد.
تفکر عمیقتر، عملکرد بهتر
ویژگی کلیدی مدلهای Gemini ۲,۵، قابلیت «استدلال» آنهاست. این مدلها قادرند پیش از ارائه پاسخ، فرآیند استدلال و پردازش افکار خود را طی کنند که این امر منجر به بهبود قابل توجه عملکرد و افزایش دقت پاسخها میشود. به گفته گوگل، «استدلال» در هوش مصنوعی فراتر از طبقهبندی و پیشبینی صرف است و توانایی تحلیل اطلاعات، نتیجهگیری منطقی، درک عمیق زمینه و جزئیات، و در نهایت، تصمیمگیری آگاهانه را شامل میشود.
این پیشرفت بر پایه تحقیقات پیشین گوگل در زمینه یادگیری تقویتی، روشهای «زنجیره افکار» (chain-of-thought) و مدل قبلی یعنی Gemini ۲,۰ Flash Thinking بنا شده است. Gemini ۲,۵ با ترکیب یک مدل پایه بسیار قدرتمندتر و تکنیکهای پسا آموزش بهبودیافته، به سطح جدیدی از کارایی دست یافته است. گوگل قصد دارد این قابلیتهای استدلالی را به صورت ذاتی در تمام مدلهای آینده خود ادغام کند تا بتوانند مسائل پیچیدهتر را مدیریت کرده و از عاملهای هوشمند (agents) توانمندتر پشتیبانی کنند.
عملکرد Gemini ۲,۵ Pro در بنچمارکها
نسخه Pro Experimental مدل Gemini ۲,۵ به عنوان پیشرفتهترین مدل گوگل برای وظایف پیچیده معرفی شده است. کسب رتبه اول در LMArena، که اولویتها و رضایت کاربران انسانی را میسنجد، نشاندهنده توانایی بالا و کیفیت خروجی مطلوب این مدل است. علاوه بر این، Gemini ۲,۵ Pro در بنچمارکهای استاندارد مربوط به کدنویسی، ریاضیات و علوم نیز نتایج درخشانی کسب کرده است:
- استدلال پیشرفته: این مدل در بنچمارکهای معتبر سنجش استدلال مانند GPQA و AIME ۲۰۲۵ پیشتاز است. همچنین در آزمون دشوار «Humanity's Last Exam» که برای سنجش مرز دانش و استدلال انسانی طراحی شده است، بدون استفاده از ابزارهای کمکی، امتیاز قابل توجه ۱۸.۸٪ را کسب کرده است.
- کدنویسی پیشرفته: مدل Gemini ۲,۵ نسبت به نسخه ۲.۰ جهش بزرگی در عملکرد کدنویسی داشته است. این مدل در ایجاد اپلیکیشنهای وب، برنامههای کدنویسی مبتنی بر عامل (agentic)، و همچنین تبدیل و ویرایش کد، نسبت به نسل قبل برتری دارد.
چندوجهی بودن و پنجره زمینه عظیم
مدل Gemini ۲,۵ همچنان بر نقاط قوت کلیدی مدلهای Gemini، یعنی چندوجهی بودن ذاتی (native multimodality) و پنجره زمینه (context window) طولانی، استوار است. نسخه ۲,۵ Pro در حال حاضر با پنجره زمینه ۱ میلیون توکنی عرضه شده و گوگل وعده داده که به زودی این ظرفیت به ۲ میلیون توکن افزایش خواهد یافت. این قابلیت به مدل امکان میدهد تا حجم عظیمی از دادهها را درک کرده و مسائل پیچیده را با استفاده از منابع اطلاعاتی متنوع شامل متن، صدا، تصویر، ویدئو و حتی مخازن کامل کد، پردازش و حل کند.
راههای دسترسی به مدل Gemini ۲,۵
در حال حاضر، توسعهدهندگان و شرکتها میتوانند Gemini ۲,۵ Pro Experimental را از طریق Google AI Studio آزمایش کنند. کاربران سرویس Gemini Advanced نیز میتوانند این مدل را در اپلیکیشن Gemini (نسخه دسکتاپ و موبایل) انتخاب نمایند. گوگل اعلام کرده است که این مدل طی هفتههای آینده در پلتفرم Vertex AI نیز در دسترس قرار خواهد گرفت و جزئیات مربوط به قیمتگذاری برای استفادههای تجاری با حجم بالا نیز به زودی منتشر خواهد شد.
در همین رابطه بخوانید:
- OpenAI مدل هوش مصنوعی GPT-۴,۵ را معرفی کرد؛ بزرگترین و بهترین مدل زبانی برای گفتگو
- دانشمندان با ۵۰ دلار مدل هوش مصنوعی در حد ChatGPT o۱ ساختند!
- رونمایی ایلان ماسک از Grok ۳؛ هوشمندترین هوش مصنوعی جهان از راه رسید!