DeepSeek را فراموش کنید؛ هوش مصنوعی Qwen۲,۵-Max علی بابا با امکانات پیشرفته‌تر از راه رسید!

منبع خبر / شهر سخت‌افزار / فناوری / ۱۰-۱۱-۱۴۰۳

DeepSeek را فراموش کنید؛ هوش مصنوعی Qwen2.5-Max علی بابا با امکانات پیشرفته‌تر از راه رسید!

هنوز چند روزی از معرفی هوش مصنوعی جنجالی DeepSeek نگذشته که علی بابا به تازگی از یک مدل هوش مصنوعی با نام Qwen ۲,۵ رونمایی کرده که بر اساس ادعای این شرکت از مدل DeepSeek-V۳ بسیار بهتر عمل می‌کند. در ادامه به بررسی عملکرد هوش مصنوعی جدید علی...

بر اساس اعلام علی بابا، مدل جدید Qwen۲,۵-Max در بنچمارک‌هایی مانند Arena-Hard و LiveCodeBench و GPQA-Diamond خیلی بهتر از DeepSeek V۳ عمل می‌کند. عملکرد مدل جدید علی بابا در بنچمارک‌های دیگر تقریباً برابر با دیپ سیک است.

بر اساس گزارش neowin ظاهراً عملکرد مدل Qwen ۲,۵ از GPT-۴o و Llama-۳.۱-۴۰۵B در بخش‌های مختلف بسیار بهتر است. کاربران می‌توانند در Alibaba Cloud به این مدل هوش مصنوعی دسترسی داشته باشند. همچنین می‌توان با این مدل قدرتمند هوش مصنوعی، عکس و ویدیو نیز تولید کرد.

Qwen۲,۵-Max را می‌توان یک مدل MoE در مقیاس بزرگ دانست که روی بیش از ۲۰ تریلیون توکن و با روش‌های تنظیم دقیق نظارت‌شده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است.

مدل‌های MoE بدون نیاز به سرورهای قدرتمند آموزش دیده تا هزینه زیرساخت‌ها را ۴۰ تا ۶۰ درصد کاهش دهند. چینی‌ها نشان دادند که می‌توان با بهینه‌سازی معماری هوش مصنوعی مدل‌هایی کم‌هزینه و کارآمد توسعه داد.

در همین رابطه بخوانید:

- دیپ سیک چیست؟ چطور از هوش مصنوعی DeepSeek استفاده کنیم؟
- انفجار دوم DeepSeek در صنعت هوش مصنوعی: مدل تصویرساز Janus-Pro منتشر شد

عملکرد این مدل در مقوله تولید کد با امتیاز ۳۸,۷ درصد در بنچمارک LiveCodeBench و استدلال با امتیاز ۸۹.۴ درصد در Arena-Hard نشان از برتری مدل‌های هوش مصنوعی جدید بهینه با هزینه کمتر بوده تا بتوانند مدل‌های بزرگ مانند Chat GPT را به چالش بکشند. اکنون باید دید که آیا مدل جدید علی‌بابا می‌تواند در رقابت با دیپ‌سیک و مدل‌های آمریکایی عملکرد قابل‌قبولی داشته باشد یا خیر.

فناوری