دستیارهای هوشمند مجازی برای اولین بار و در سال ۲۰۱۱ بههمراه آیفون 4S معرفی شدند. سیری (Siri) نام دستیار صوتی اپل بود که پایه توسعه آن توسط موسسه تحقیقات هوش مصنوعی SRI بنا نهاده شده بود. سیری در زمانی که در فاز بتا قرار داشت، قادر به انجام دستورهای محدودی بود که میتوان بهموارد زیر اشاره کرد:
تماس با شخصی خاصتنظیم آلارم هشدارقیمت دلاروضعیت آبوهواپخش موسیقیتغییر تنظیمات گوشیاطلاعرسانی شرایط ترافیکیاما در حال حاضر دستیاران مجازی شامل سیری، گوگل اسیستنت و الکسا عملکرد بهمراتب هوشمندتری دارند و درکنار عملیاتهای روزمره، توانایی بسیار بیشتری در درک گفتار کاربران دارند. اما در این بین همواره جای دستیار صوتی هوشمندی با پشتیبانی از زبان فارسی و درک آن خالی بود.
دابی (DOBBY) نام اولین دستیار صوتی فارسیزبان است که توسط «شرکت فناوریهای هوشمند ققنوس» و با سرمایهگذاری گروه علیبابا توسعه یافته است. یکی از اهداف توسعه این دستیار صوتی استفاده از آن برای پاسخگویی در مرکز تماس و پشتیبانی علیبابا است. دابی بهعنوان یک دستاورد مهم تکنولوژیک در حوزه هوش مصنوعی کشور، میخواهد دستیار صوتی اصلی کاربران فارسی زبان باشد که بهگفته توسعهدهندگان دابی این امر تا یک سال آینده محقق خواهد شد. در ادامه نگاهی اولیه و کوتاه به این دستیار هوشمند خواهیم داشت.
نصب و فعالسازی
برای نصب دابی میتوانید به گوگل پلی یا مایکت مراجعه کنید. البته امکان دانلود مستقیم این اپلیکیشن از وبسایت سازنده نیز در دسترس است. پس از دانلود، نصب، طی مراحل ثبتنام و ارایه دسترسیهای مورد نظر، دابی آغاز بهکار خواهد کرد. محیط اپلیکیشن بسیار ساده طراحی شده است و تنها سه گزینه تایپ دستورات صوتی، فعال کردن میکروفن برای ارایه دستور مورد نظر و تنظیمات مشاهده میشود. در حال حاضر این دستیار صوتی تنها برای کاربران اندروید در دسترس است و امکان بهره بردن از آن در سایر سیستمهای عامل فراهم نیست.
با کلیک کردن روی گزینه منو، بخشی از تنظیمات دابی بهنمایش درمیآید که میتوان با فعال کردن گزینهای خاص، دابی را در پسزمینه سیستم عامل فعال نگه داشت و با دستور «هِی دابی» این دستیار را فعال کرد. پس از آغاز بهکار دابی در اولین مرحله، این دستیار صوتی فهرستی از قابلیتهای اجرایی خود را به نمایش میگذارد تا درک بهتری از نحوه ارائه دستور داشته باشید. افزودن مخاطب، خروج از حساب کاربری و اتصال به سایر دستگاههای هوشمند دیگر گزینههای قرار گرفته در این منو هستند.
عملکرد
سرعت عکسالعمل دابی در ارایه پاسخ از اولین نکاتی است که بهچشم میخورد. این موضوع بهخصوص در مواقعی که سوالی طولانی از آن بپرسید، بیش از پیش بهچشم میخورد و دابی برای پاسخ به آن به زمان محسوسی نیاز دارد. البته این موضوع تنها در صورتی که عادت به استفاده از دستیارهای صوتی مطرح جهان داشته باشید، بهچشم میخورد. این موضوع در نسخههای ابتدایی هر یک از دستیارهای صوتی محبوب جهان نیز بهچشم میخورد که امیدواریم دابی در این زمینه نیز پیشرفت کند.
درک گفتار مهمترین وظیفه دستیار صوتی است. الگوریتمهای بهکار رفته در آنها باید در وهله اول بهخوبی قادر به درک صحبت کاربر باشد و در ادامه بهترین عکسالعمل را نسبت به آن نشان دهد. دابی در این زمینه عملکرد خوبی دارد و بخش گستردهای از گفتههای کاربران را بهخوبی درک میکند. این دستیار صوتی علاوه بر صحبتهای عادی، توانایی درک نامها را نیز دارد؛ در صورتی که نامی تصادفی به دابی اعلام کنید، بهخوبی آن را درک میکند. همچنین با وجود توانایی زیاد دابی در درک گفتار، در نحوه پاسخدهی هم عملکرد نسبتا خوبی دارد.
این دستیار صوتی فارسی زبان از حالت گفتوگو محور (گفتوگوی بهاصطلاح پینگپونگی) پشتیبانی نمیکند که البته نمیتوان آن را ایراد دانست؛ نمونههای مطرح جهانی نیز همچنان از این قابلیت بیبهره هستند. این موضوع امری طبیعی برای یک دستیار صوتی است که در مراحل اولیه توسعه خود قرار دارد. با استفاده بیشتر کاربران و به لطف الگوریتمهای هوش مصنوعی و یادگیری ماشین، رفتهرفته دستیار صوتی عملکردی پیشرفتهتر از خود نشان میدهد و دایره پاسخها و چگونگی پاسخدهی آن نیز بهبود خواهد یافت.
در نظر داشته باشید برای کار کردن با دابی به اینترنت نیاز دارد. در صورتی که به اینترنت دسترسی نداشته باشید، دابی اقدام به گوش کردن به صحبتهای کاربر میکند، اما هیچ عملیاتی برای جستجو یا ارایه پاسخ صورت نمیگیرد.
اولین تفاوت بزرگ دابی در مقایسه با دستیارهای صوتی نامدار جهانی، ارایه پاسخ و اطلاعات مورد نیاز در درون خود اپلیکیشن است و هدف هم این است که کاربر از اپلیکیشن خارج نشود. بهعنوان مثال در صورت ارائه دستور پخش فیلم یا پادکست، دابی کاربر را به اپلیکیشنهای ثالث هدایت نخواهد کرد و درون خود محتوای مورد نظر را به نمایش میگذارد. تیم توسعه دابی دلیل این امر را رفع نیازهای کامل کاربران در همان محیط عنوان کردند. این موضوع در برخی مواقع مانند نمایش آبوهوا کاربردی است زیرا کاربر در سریعترین زمان ممکن بهپاسخ مورد نظر خود دست خواهد یافت. یا اگر از دابی تقاضای پخش فیلم داشته باشید، این دستیار صوتی اقدام به نمایش فهرستی از فیلمهای پیشفرض میکند تا کاربر در صورت تمایل اقدام به تماشای آنها درون خود اپلیکیشن کند.
خواندن اخبار فارسی، اعلام وضعیت آبوهوا، نرخ روز ارز، پخش فیلم و پادکست، مطالعه کتاب، تنظیم جلسه، ارسال پیامک، برقراری تماس تلفنی از ویژگیهای دابی است. با این حال در ادامه روند توسعه، قطعا این دستیار صوتی نیز قادر به انجام وظایف بیشتری خواهد بود تا بیش از پیش کاربردی شود. به گفته تیم توسعه دابی بهزودی سرویسهای درخواست تاکسی، خرید اینترنتی، کتابخوان صوتی و مسیریابی نیز به دابی اضافه میشود.
طبیعی بودن نحوه صبحت کردن دستیارهای هوشمند تاثیر بسیار زیادی روی تجربه کاربری آنها میگذارد. تا پیش از عرضه دستیارهای صوتی پیشرفته، انواع عادی عموما صدایی مانند ربات داشتند که انقلابی در این موضوع با پیدایش سیری، الکسا، کورتانا و گوگل اسیتسنت ایجاد شد. دابی نیز در این زمینه عملکرد بسیار خوبی دارد؛ این دستیار هوشمند، مانند سایر نمونههای موجود صدای شخصیتی مونث را دارد که طبیعی گفتوگو میکند و از این جهت امتیازی مثبت به دابی تعلق میگیرد. البته باید در نظر داشت با توجه به دایره محدودتر پاسخدهی دابی، امکان گفتوگویی طبیعی وجود دارد و در صورت افزایش گستره پاسخدهی، تلفظ طبیعی و گفتوگویی هوشمند بسیار پیچیده و دشوار میشود.
یکی از قابلیتهای جذاب دستیارهای صوتی مجازی، شوخی با کاربران یا انجام کارهایی خاص است. دابی در این زمینه توانایی گفتن لطیفه را دارد و برخی مواقع پاسخهای جذابی به سوالات میدهد؛ اما در این زمینه هنوز فضای زیادی تا پیشرفت پیشروی این دستیار صوتی است تا برای هر سوال پاسخی قابل تامل داشته باشد.
جمعبندی
توسعه دستیار صوتی هوشمند و توانمند امری بسیار پیچیده است؛ این پیچیدگی در حدی است که انواع مطرح موجود در دنیای فناوری هنوز هم از درک و انجام بسیاری از دستورات عاجز هستند. دابی شروعی بسیار خوب برای دستیار صوتی فارسیزبان است. در نظر داشته باشید که الگوریتمهای هوش مصنوعی در مرور زمان و با استفادهی کاربران از محصول پیشرفت میکنند و امکان توسعه الگوریتمی ایدهآل و فارغ از هرگونه مشکل در وهله اول، تقریبا امری محال است. دابی در حال حاضر توانایی بسیار خوبی در درک گفتار دارد. با این که هنوز درصد محسوسی از خطا در درک گفته کاربران وجود دارد، اما عملکرد آن در فاز اول کاملا قابل قبول است. در صورتی که تیم فناوریهای هوشمند ققنوس با همین سرعت به توسعه آن ادامه دهند و در برخی زمینهها اقدام به بازنگری شرایط عملکرد آن کنند، امیدوار هستیم در آیندهای نزدیک شاهد تکامل دستیاری فارسیزبان کاربردی در کشور باشیم.