شرکت OpenAI دقایقی پیش از انتشار مدل هوش مصنوعی استدلالی o۳-mini خبر داد. هوش مصنوعی جدید OpenAI در انحصار اشتراک پولی ChatGPT نبوده و تمام کاربران به آن دسترسی دارند.
شرکت OpenAI در روز جمعه، مدل استدلالی جدید خود به نام o۳-mini را معرفی کرد؛ جدیدترین آخرین عضو خانواده مدلهای استدلالی اوپن ای آی که به منظور ارائه پاسخهای دقیق و سریع در حوزههای تخصصی طراحی شده است. این رونمایی در زمانی صورت میگیرد که هنوز یک هفته از ظهور هوش مصنوعی چینی DeepSeek با مدل استدلالی R۱ نمیگذرد.
گامی مهم در جهت گسترش دسترسی به هوش مصنوعی پیشرفته
به گفته یک نماینده OpenAI، معرفی o۳-mini گامی مهم در جهت فراهم کردن دسترسی گستردهتر به هوش مصنوعی محسوب میشود. مدل o۳-mini که در آذرماه وارد فاز آزمایشی شد، اکنون به عنوان یک سیستم قدرتمند و مقرون به صرفه در اختیار تمام کاربران ChatGPT قرار گرفته است. این مدل بهویژه برای حل مسائل STEM (برنامهنویسی، ریاضیات و علوم) بهینه شده و عملکردی مشابه خانواده مدلهای o۱ ارائه میدهد؛ اما با سرعت بالاتر و هزینهای کمتر.

در مقایسه با مدلهای زبان بزرگ معمولی، مدلهای استدلالی مانند o۳-mini قبل از ارائه پاسخ، به صورت جامع پاسخ خود را بررسی و اعتبارسنجی میکنند. این فرآیند باعث میشود تا از خطاهای رایجی که معمولاً مدلها مرتکب میشوند، جلوگیری شود؛ گرچه این بررسیهای دقیق ممکن است کمی زمانبر باشد.
بر اساس آزمایشهای خارجی، پاسخهای o۳-mini بیش از نیمی از مواقع نسبت به مدل معمولی بهتر بوده و در مقایسه با o۱-mini، تعداد اشتباهات عمده آن تا ۳۹ درصد کمتر گزارش شده است. همچنین این مدل توانسته است پاسخهایی شفافتر و حدود ۲۴ درصد سریعتر ارائه دهد.
دسترسی و قیمتگذاری o۳-mini
کاربران ChatGPT میتوانند از همین حالا o۳-mini بهرهمند شوند. کاربران دارای اشتراکهای ChatGPT Plus و Team محدودیت ۱۵۰ درخواست در روز خواهند داشت، در حالی که مشترکان ChatGPT Pro دسترسی نامحدود خواهند داشت. همچنین به زودی مشتریان ChatGPT Enterprise و Edu نیز از این مدل استفاده خواهند کرد.
در نسخه ChatGPT، o۳-mini به صورت پیشفرض در حالت «استدلال متوسط» فعال است که تعادل مناسبی بین سرعت و دقت ایجاد میکند. مشترکان نسخه پولی ChatGPT میتوانند گزینه o۳-mini-high را انتخاب کنند تا پاسخهایی با صرف منابع پردازشی بالاتر دریافت کنند، اگرچه پاسخها کمی کندتر خواهند بود.
از نظر قیمتگذاری، این مدل به ازای هر یک میلیون توکن ورودی کششده ۱,۱ دلار و برای هر یک میلیون توکن خروجی ۴.۴۰ دلار هزینه دارد؛ که این قیمت ۶۳ درصد کمتر از هزینه o۱-mini بوده و شانس بیشتری برای رقابت با مدل استدلالی R۱ شرکت DeepSeek دارد.
مقایسه به DeepSeek R۱
اگرچه o۳-mini در بسیاری از حوزهها عملکرد رقابتی و هزینهای مطلوب ارائه میدهد، اما در برخی از بنچمارکهای تخصصی همچون تستهای فیزیک، زیستشناسی و شیمی در سطح دکتری، با مدلهای رقیب مانند DeepSeek و حتی نسخههای قدیمیتر o۱ اختلاف جزئی دارد. به عنوان مثال، در تست AIME ۲۰۲۴ در حالت o۳-mini-high حدود ۰,۳ درصد از o۱ پیشی میگیرد.
همین حالا میتوانید با ورود به حساب ChatGPT خود مدل o۳-mini را امتحان کنید.