هنوز چند روزی از معرفی هوش مصنوعی جنجالی DeepSeek نگذشته که علی بابا به تازگی از یک مدل هوش مصنوعی با نام Qwen ۲,۵ رونمایی کرده که بر اساس ادعای این شرکت از مدل DeepSeek-V۳ بسیار بهتر عمل میکند. در ادامه به بررسی عملکرد هوش مصنوعی جدید علی بابا خواهیم پرداخت.
بر اساس اعلام علی بابا، مدل جدید Qwen۲,۵-Max در بنچمارکهایی مانند Arena-Hard و LiveCodeBench و GPQA-Diamond خیلی بهتر از DeepSeek V۳ عمل میکند. عملکرد مدل جدید علی بابا در بنچمارکهای دیگر تقریباً برابر با دیپ سیک است.
بر اساس گزارش neowin ظاهراً عملکرد مدل Qwen ۲,۵ از GPT-۴o و Llama-۳.۱-۴۰۵B در بخشهای مختلف بسیار بهتر است. کاربران میتوانند در Alibaba Cloud به این مدل هوش مصنوعی دسترسی داشته باشند. همچنین میتوان با این مدل قدرتمند هوش مصنوعی، عکس و ویدیو نیز تولید کرد.
Qwen۲,۵-Max را میتوان یک مدل MoE در مقیاس بزرگ دانست که روی بیش از ۲۰ تریلیون توکن و با روشهای تنظیم دقیق نظارتشده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است.
مدلهای MoE بدون نیاز به سرورهای قدرتمند آموزش دیده تا هزینه زیرساختها را ۴۰ تا ۶۰ درصد کاهش دهند. چینیها نشان دادند که میتوان با بهینهسازی معماری هوش مصنوعی مدلهایی کمهزینه و کارآمد توسعه داد.
در همین رابطه بخوانید:
- دیپ سیک چیست؟ چطور از هوش مصنوعی DeepSeek استفاده کنیم؟
- انفجار دوم DeepSeek در صنعت هوش مصنوعی: مدل تصویرساز Janus-Pro منتشر شد
عملکرد این مدل در مقوله تولید کد با امتیاز ۳۸,۷ درصد در بنچمارک LiveCodeBench و استدلال با امتیاز ۸۹.۴ درصد در Arena-Hard نشان از برتری مدلهای هوش مصنوعی جدید بهینه با هزینه کمتر بوده تا بتوانند مدلهای بزرگ مانند Chat GPT را به چالش بکشند. اکنون باید دید که آیا مدل جدید علیبابا میتواند در رقابت با دیپسیک و مدلهای آمریکایی عملکرد قابلقبولی داشته باشد یا خیر.