رونمایی گوگل از پروژه مارینر: دستیار هوش مصنوعی که مثل یک انسان در وب جستجو می‌کند

منبع خبر / فناوری / 6 روز پیش

رونمایی گوگل از پروژه مارینر: دستیار هوش مصنوعی که مثل یک انسان در وب جستجو می‌کند

گوگل از اولین عامل هوش مصنوعی خود با نام پروژه مارینر (Project Mariner) رونمایی کرد. این دستیار در واقع نمونه اولیه یک دستیار انسانی جستجوی وب است که توسط بخش دیپ‌مایند (DeepMind) توسعه یافته، می‌تواند با استفاده از فناوری جمینی (Gemini) مرورگر...

گوگل از اولین عامل هوش مصنوعی خود با نام پروژه مارینر (Project Mariner) رونمایی کرد. این دستیار در واقع نمونه اولیه یک دستیار انسانی جستجوی وب است که توسط بخش دیپ‌مایند (DeepMind) توسعه یافته، می‌تواند با استفاده از فناوری جمینی (Gemini) مرورگر کروم را کنترل کند، نشانگر موس را حرکت دهد، روی دکمه‌ها کلیک کند و فرم‌ها را پر کند. این عامل هوش مصنوعی عملاً قادر است به صورت مشابه با یک کاربر انسانی وبگردی کند.

این روزها فناوری هوش مصنوعی در هر زمینه‌ای وارد شده و قصد دارد کار انسان را خیلی ساده‌تر از قبل کند. اما نشستن به جای انسان نیز در برخی زمینه‌ها، هدفی است که AI دنبال می‌کند و مهندسان می‌خواهند هوش‌مصنوعی را در زمینه‌های متنوعی توسعه دهند که شاید هیچ عاملی به جز انسان تا پیش از این در آنها فعالیت نمی‌کرد.

در همین زمینه امروز شرکت گوگل از چند محصول جدید خود در حوزه هوش مصنوعی رونمایی کرده که بسیاری از آنها قواعد قبلی ارتباط انسان با دنیای وب و فناوری را تغییر می‌دهند. یکی از این قابلیت‌های به پروژه مارینر موسوم است که قرار است یک هوش مصنوعی باشد که می‌تواند مانند یک انسان در وب بگردد.

طبق اعلام گوگل، دستیار هوش مصنوعی توسعه یافته در پروژه مارینر ابتدا در اختیار گروه کوچکی از کاربران داوطلب و منتخب قرار خواهد گرفت. گوگل اعلام کرده که پروژه مارینر بخشی از یک تغییر اساسی در تجربه کاربری وب است. در این تغییر، کاربران به‌جای تعامل مستقیم با وب‌سایت‌ها، با سیستم هوش مصنوعی مولدی که وظایف را برای آنها انجام می‌دهد، در ارتباط خواهند بود.

چگونگی عملکرد پروژه مارینر

در یک دموی آزمایشی توسط جکلین کونزلمان، مدیر آزمایشگاه‌های گوگل منتشر منتشر شده، نحوه کار پروژه مارینر تشریح شده است. فرایند کار به این صورت است که پس از نصب یک افزونه در مرورگر کروم، یک پنجره چت در سمت راست مرورگر ظاهر می‌شود. سپس کاربر می‌تواند دستورات مختلفی به این دستیار بدهد. به‌عنوان مثال می‌توانید به دستیار خود بگویید: «یک سبد خرید برای این لیست از یک فروشگاه مواد غذایی ایجاد کن.»

google-deepmind-4.gif

در این مرحله دستیار هوش مصنوعی به وب‌سایت مورد اعتماد گوگل در این زمینه می‌رود و موارد مورد نظر را جستجو کرده و به سبد خرید اضافه می‌کند. هرچند در دموی منتشر شده، فرآیند کار عامل نسبتاً کند است؛ بین هر حرکت موس حدود ۵ ثانیه تأخیر وجود دارد و گاهی نیز این دستیار برای شفاف‌سازی از طریق پنجره چت سوال می‌پرسد (مثلاً به شما می‌گوید «چند تا هویج نیاز دارید؟»).

محدودیت‌ها و کنترل‌ها

یکی از نکاتی که گوگل در رونمایی از دستیار پروژه مارینر خود مطرح کرده این است که در حال حاضر این سیاست اتخاذ شده که دستیار مذکور نتواند اطلاعات کارت اعتباری یا جزئیات صورتحساب را پر کند. مضاف بر آن دستیار AI مذکور از پذیرش کوکی‌ها یا امضای شرایط استفاده خودداری می‌کند. بدیهی است که گوگل این محدودیت‌ها را با هدف حفظ کنترل بیشتر برای کاربران اعمال کرده است.

همچنین به این نکته نیز اشاره شده که این دستیار، در پشت صحنه از صفحه نمایش مرورگر کاربر اسکرین‌شات گرفته و آنها را به سرورهای جمینی ارسال می‌کند. سپس Gemini دستورالعمل‌های لازم برای پیمایش وب‌سایت را به کامپیوتر کاربر بازمی‌گرداند.

یکی از نقاط ضعف این فناوری این است که پروژه مارینر تنها روی تب فعال مرورگر کروم کار می‌کند. به این معنا که کاربر نمی‌تواند همزمان از کامپیوتر برای کار دیگری استفاده کند و باید کار عامل را مشاهده کند. به گفته کورای کاووک‌اوغلو، مدیر ارشد فناوری دیپ‌مایند، این تصمیم عمداً گرفته شده تا کاربران کاملاً از اقدامات عامل هوش مصنوعی آگاه باشند.

google-deepmind-2.jpg

Kavukcuoglu در مصاحبه ای با TechCrunch در این زمینه می‌گوید:

از آنجایی که [Gemini] حالا از طرف یک کاربر اقداماتی را انجام می دهد، مهم است که این کار را گام به گام انجام دهیم. این پروژه در واقع یک فرایند تکاملی را طی می‌کند. شما به‌عنوان یک فرد می‌توانید از وب‌سایت‌ها استفاده کنید و اکنون نماینده شما می‌تواند هر کاری که شما در یک وب‌سایت انجام می‌دهید نیز انجام دهد.

دیگر دستیارهای هوش مصنوعی معرفی‌شده توسط گوگل

علاوه بر پروژه مارینر، گوگل امروز از دستیارهای هوش مصنوعی دیگری نیز رونمایی کرده که عملکرد آنها به صورت زیر خواهد بود:

دستار محقق کامل Deep Research

یکی از عامل‌های هوش مصنوعی گوگل با نام Deep Research طراحی شده تا به کاربران در کاوش موضوعات پیچیده کمک کند. این عامل با ایجاد برنامه‌های پژوهشی چندمرحله‌ای، فرایند بررسی و تحقیق را سازماندهی می‌کند. Deep Research به نظر می‌رسد رقیبی برای OpenAI o1 باشد که آن نیز توانایی استدلال چندمرحله‌ای را دارد. با این حال، سخنگوی گوگل توضیح داده است که این عامل برای حل مسائل ریاضی و منطقی، نوشتن کد یا تحلیل داده طراحی نشده است. این عامل هوش مصنوعی امروز در نسخه پیشرفته Gemini عرضه شده و در سال 2025 به اپلیکیشن Gemini اضافه خواهد شد.

هنگامی که کاربران سوالات دشوار یا گسترده‌ای مطرح کنند، Deep Research یک برنامه اقدام چندمرحله‌ای برای پاسخ‌گویی ایجاد می‌کند. پس از تأیید این برنامه توسط کاربر، این عامل چند دقیقه وقت می‌گیرد تا وب را جستجو کرده و سپس گزارشی مفصل از یافته‌های خود ارائه دهد.

google-deepmind-1.jpg

Jules: عامل هوش مصنوعی برای توسعه‌دهندگان

یکی دیگر از عامل‌های جدید گوگل، Jules، برای کمک به توسعه‌دهندگان در انجام وظایف برنامه‌نویسی طراحی شده است. این عامل به‌طور مستقیم با فرایندهای کاری GitHub یکپارچه شده و به Jules امکان می‌دهد کدهای موجود را بررسی و تغییرات را مستقیماً در GitHub اعمال کند. Jules از امروز برای گروهی از آزمایش‌کنندگان بتا عرضه شده و در سال 2025 در دسترس عموم قرار خواهد گرفت.

عامل هوش مصنوعی برای بازی‌های ویدیویی

در نهایت، Google DeepMind اعلام کرده که در حال کار روی یک عامل هوش مصنوعی برای کمک به کاربران در هدایت بازی‌های ویدیویی است. این پروژه بر اساس تجربه طولانی گوگل در ساخت هوش مصنوعی برای بازی‌ها طراحی شده است. گوگل همچنین اعلام کرده که با توسعه‌دهندگانی مانند Supercell همکاری می‌کند تا توانایی Gemini در تفسیر دنیای بازی‌هایی مانند Clash of Clans را آزمایش کند.

هرچند گوگل هنوز تاریخ عرضه‌ای برای این نمونه اولیه ارائه نکرده، اما اعلام کرده که این پروژه به آنها کمک می‌کند تا عامل‌هایی بسازند که بتوانند هم در دنیای واقعی و هم در دنیای مجازی کاربران را هدایت کنند.


منتخب امروز

بیشترین بازدید یک ساعت گذشته

دانلود آهنگ علی زند وکیلی غمگین ترین آهنگ