گوگل از اولین عامل هوش مصنوعی خود با نام پروژه مارینر (Project Mariner) رونمایی کرد. این دستیار در واقع نمونه اولیه یک دستیار انسانی جستجوی وب است که توسط بخش دیپمایند (DeepMind) توسعه یافته، میتواند با استفاده از فناوری جمینی (Gemini) مرورگر کروم را کنترل کند، نشانگر موس را حرکت دهد، روی دکمهها کلیک کند و فرمها را پر کند. این عامل هوش مصنوعی عملاً قادر است به صورت مشابه با یک کاربر انسانی وبگردی کند.
این روزها فناوری هوش مصنوعی در هر زمینهای وارد شده و قصد دارد کار انسان را خیلی سادهتر از قبل کند. اما نشستن به جای انسان نیز در برخی زمینهها، هدفی است که AI دنبال میکند و مهندسان میخواهند هوشمصنوعی را در زمینههای متنوعی توسعه دهند که شاید هیچ عاملی به جز انسان تا پیش از این در آنها فعالیت نمیکرد.
در همین زمینه امروز شرکت گوگل از چند محصول جدید خود در حوزه هوش مصنوعی رونمایی کرده که بسیاری از آنها قواعد قبلی ارتباط انسان با دنیای وب و فناوری را تغییر میدهند. یکی از این قابلیتهای به پروژه مارینر موسوم است که قرار است یک هوش مصنوعی باشد که میتواند مانند یک انسان در وب بگردد.
طبق اعلام گوگل، دستیار هوش مصنوعی توسعه یافته در پروژه مارینر ابتدا در اختیار گروه کوچکی از کاربران داوطلب و منتخب قرار خواهد گرفت. گوگل اعلام کرده که پروژه مارینر بخشی از یک تغییر اساسی در تجربه کاربری وب است. در این تغییر، کاربران بهجای تعامل مستقیم با وبسایتها، با سیستم هوش مصنوعی مولدی که وظایف را برای آنها انجام میدهد، در ارتباط خواهند بود.
چگونگی عملکرد پروژه مارینر
در یک دموی آزمایشی توسط جکلین کونزلمان، مدیر آزمایشگاههای گوگل منتشر منتشر شده، نحوه کار پروژه مارینر تشریح شده است. فرایند کار به این صورت است که پس از نصب یک افزونه در مرورگر کروم، یک پنجره چت در سمت راست مرورگر ظاهر میشود. سپس کاربر میتواند دستورات مختلفی به این دستیار بدهد. بهعنوان مثال میتوانید به دستیار خود بگویید: «یک سبد خرید برای این لیست از یک فروشگاه مواد غذایی ایجاد کن.»
در این مرحله دستیار هوش مصنوعی به وبسایت مورد اعتماد گوگل در این زمینه میرود و موارد مورد نظر را جستجو کرده و به سبد خرید اضافه میکند. هرچند در دموی منتشر شده، فرآیند کار عامل نسبتاً کند است؛ بین هر حرکت موس حدود ۵ ثانیه تأخیر وجود دارد و گاهی نیز این دستیار برای شفافسازی از طریق پنجره چت سوال میپرسد (مثلاً به شما میگوید «چند تا هویج نیاز دارید؟»).
محدودیتها و کنترلها
یکی از نکاتی که گوگل در رونمایی از دستیار پروژه مارینر خود مطرح کرده این است که در حال حاضر این سیاست اتخاذ شده که دستیار مذکور نتواند اطلاعات کارت اعتباری یا جزئیات صورتحساب را پر کند. مضاف بر آن دستیار AI مذکور از پذیرش کوکیها یا امضای شرایط استفاده خودداری میکند. بدیهی است که گوگل این محدودیتها را با هدف حفظ کنترل بیشتر برای کاربران اعمال کرده است.
همچنین به این نکته نیز اشاره شده که این دستیار، در پشت صحنه از صفحه نمایش مرورگر کاربر اسکرینشات گرفته و آنها را به سرورهای جمینی ارسال میکند. سپس Gemini دستورالعملهای لازم برای پیمایش وبسایت را به کامپیوتر کاربر بازمیگرداند.
یکی از نقاط ضعف این فناوری این است که پروژه مارینر تنها روی تب فعال مرورگر کروم کار میکند. به این معنا که کاربر نمیتواند همزمان از کامپیوتر برای کار دیگری استفاده کند و باید کار عامل را مشاهده کند. به گفته کورای کاووکاوغلو، مدیر ارشد فناوری دیپمایند، این تصمیم عمداً گرفته شده تا کاربران کاملاً از اقدامات عامل هوش مصنوعی آگاه باشند.
Kavukcuoglu در مصاحبه ای با TechCrunch در این زمینه میگوید:
از آنجایی که [Gemini] حالا از طرف یک کاربر اقداماتی را انجام می دهد، مهم است که این کار را گام به گام انجام دهیم. این پروژه در واقع یک فرایند تکاملی را طی میکند. شما بهعنوان یک فرد میتوانید از وبسایتها استفاده کنید و اکنون نماینده شما میتواند هر کاری که شما در یک وبسایت انجام میدهید نیز انجام دهد.
دیگر دستیارهای هوش مصنوعی معرفیشده توسط گوگل
علاوه بر پروژه مارینر، گوگل امروز از دستیارهای هوش مصنوعی دیگری نیز رونمایی کرده که عملکرد آنها به صورت زیر خواهد بود:
دستار محقق کامل Deep Research
یکی از عاملهای هوش مصنوعی گوگل با نام Deep Research طراحی شده تا به کاربران در کاوش موضوعات پیچیده کمک کند. این عامل با ایجاد برنامههای پژوهشی چندمرحلهای، فرایند بررسی و تحقیق را سازماندهی میکند. Deep Research به نظر میرسد رقیبی برای OpenAI o1 باشد که آن نیز توانایی استدلال چندمرحلهای را دارد. با این حال، سخنگوی گوگل توضیح داده است که این عامل برای حل مسائل ریاضی و منطقی، نوشتن کد یا تحلیل داده طراحی نشده است. این عامل هوش مصنوعی امروز در نسخه پیشرفته Gemini عرضه شده و در سال 2025 به اپلیکیشن Gemini اضافه خواهد شد.
هنگامی که کاربران سوالات دشوار یا گستردهای مطرح کنند، Deep Research یک برنامه اقدام چندمرحلهای برای پاسخگویی ایجاد میکند. پس از تأیید این برنامه توسط کاربر، این عامل چند دقیقه وقت میگیرد تا وب را جستجو کرده و سپس گزارشی مفصل از یافتههای خود ارائه دهد.
Jules: عامل هوش مصنوعی برای توسعهدهندگان
یکی دیگر از عاملهای جدید گوگل، Jules، برای کمک به توسعهدهندگان در انجام وظایف برنامهنویسی طراحی شده است. این عامل بهطور مستقیم با فرایندهای کاری GitHub یکپارچه شده و به Jules امکان میدهد کدهای موجود را بررسی و تغییرات را مستقیماً در GitHub اعمال کند. Jules از امروز برای گروهی از آزمایشکنندگان بتا عرضه شده و در سال 2025 در دسترس عموم قرار خواهد گرفت.
عامل هوش مصنوعی برای بازیهای ویدیویی
در نهایت، Google DeepMind اعلام کرده که در حال کار روی یک عامل هوش مصنوعی برای کمک به کاربران در هدایت بازیهای ویدیویی است. این پروژه بر اساس تجربه طولانی گوگل در ساخت هوش مصنوعی برای بازیها طراحی شده است. گوگل همچنین اعلام کرده که با توسعهدهندگانی مانند Supercell همکاری میکند تا توانایی Gemini در تفسیر دنیای بازیهایی مانند Clash of Clans را آزمایش کند.
هرچند گوگل هنوز تاریخ عرضهای برای این نمونه اولیه ارائه نکرده، اما اعلام کرده که این پروژه به آنها کمک میکند تا عاملهایی بسازند که بتوانند هم در دنیای واقعی و هم در دنیای مجازی کاربران را هدایت کنند.