هوش مصنوعی Voice Engine از شرکت OpenAI برای تقلید دقیق صدای شما تنها به یک نمونه 15 ثانیه‌ای نیاز دارد


هوش مصنوعی Voice Engine از شرکت OpenAI برای تقلید دقیق صدای شما تنها به یک نمونه 15 ثانیه‌ای نیاز دارد

شرکت OpenAI امروز از مدل هوش مصنوعی جدیدی با عنوان Voice Engine رونمایی کرد که قادر است با عملکردی خارق العاده صدای کاربران خود را تقلید کند. Voice Engine برای اینکه بتواند با موفقیت صدای مصنوعی کاربران را ایجاد کند تنها به یک نمونه 15 ثانیه‌ای...

شرکت OpenAI امروز از مدل هوش مصنوعی جدیدی با عنوان Voice Engine رونمایی کرد که قادر است با عملکردی خارق العاده صدای کاربران خود را تقلید کند. Voice Engine برای اینکه بتواند با موفقیت صدای مصنوعی کاربران را ایجاد کند تنها به یک نمونه 15 ثانیه‌ای از صدای واقعی آن‌ها نیاز دارد. پس از دریافت این صدای نمونه، این مدل هوش مصنوعی قادر است متون بلند را با همان لحن و تن صدا بخواند.

Voice Engine پلتفرم و مدل هوش مصنوعی جدید شرکت OpenAI است که می‌تواند در زمینه تبدیل متن به صدا انقلاب جدیدی ایجاد کند. شرکت سازنده این مدل اعلام کرده است که از سال 2022 مشغول کار بر روی آن بوده و قرار است از آن در قابلیت Read Aloud در چت‌بات هوش مصنوعی ChatGPT استفاده کند. خبر خوب این است که این مدل می‌تواند با حفظ لحن کاربران، برای خواندن متون مختلف به دیگر زبان‌ها نیز مورد استفاده قرار بگیرد.

براساس گزارش Theverge، مدل هوش مصنوعی Voice Engine قادر است با دریافت یک نمونه 15 ثانیه‌ای از صدای کاربران، لحن و تن صدای آن‌ها را شبیه‌سازی کند و سپس با استفاده از آن متون مختلف را بخواند. هنوز زمان مشخصی برای انتشار عمومی این مدل هوش مصنوعی اعلام نشده اما OpenAI عنوان کرده است که دسترسی تعداد محدودی از شرکت‌های آموزشی نظیر Age of Learning، پلتفرم قصه گوی HeyGen، دو شرکت سلامت محور Dimagi و Lifespan و همچنین شرکت Livox که در حوزه ارتباطات مبتنی بر هوش مصنوعی فعالیت دارد را به آن ممکن کرده است. گفته می‌شود Spotify نیز هم اکنون از این فناوری برای تولید بخشی از پادکست‌های خود به دیگر زبان‌ها استفاده می‌کند.

نمونه صداهای منتشر شده از سوی شرکت Age of Learning نشان می‌دهد که Voice Engine عملکرد بسیار خوبی دارد و قادر است با دریافت صدای 15 ثانیه‌ای به عنوان نمونه با استفاده از آن صداهای مشابه دیگری تولید کند. به عنوان مثال با ارائه این نمونه 15 ثانیه‌ای، از این مدل هوش مصنوعی درخواست شده است متون مختلفی را در حوزه عمومی، شیمی و طبیعت بخواند. همانطور که مشخص است این موتور هوش مصنوعی به خوبی قادر است لحن صدای موجود در نمونه را در تبدیل متون به صوت حفظ کند.

مطمئناً یکی از مشکلات بزرگ OpenAI در هنگام انتشار عمومی این مدل هوش مصنوعی، امکان استفاده نادرست گروهی از کاربران از آن است. OpenAI اعلام کرده است که پیش از انتشار این مدل باید از عملکرد مناسب و نحوه استفاده درست از آن اطمینان حاصل کرد؛ چرا که می‌داند این فناوری می‌تواند خطرناک باشد. OpenAI اعلام کرده است با شرکای خود بر سر قوانینی مشترک در هنگام استفاده از این مدل هوش مصنوعی به توافق رسیده است.

طبق این قوانین، نباید از هوش مصنوعی Voice Engine برای جعل هویت افراد و سازمان‌ها بدون رضایت آن‌ها استفاده کرد. شرکت‌هایی که به این مدل هوش مصنوعی دسترسی دارند همچنین باید پیش از استفاده از آن موافقت صریح گوینده اصلی صدا را جلب کرده باشند. همچنین کاربران نیز باید پیش از شنیدن صداهای تولید شده توسط این مدل از اینکه آن‌ها با استفاده از هوش مصنوعی ایجاد شده‌اند آگاهی لازم را کسب کنند. OpenAI همچنین قصد دارد از فناوری‌های Watermark برای شناسایی و ردیابی منبع صداهای تولید شده توسط Voice Engine استفاده کند.

مدل هوش مصنوعی Voice Engine در حالی از سوی OpenAI معرفی شده است که چندی پیش تقلید صدای جو بایدن ریاست جمهوری آمریکا برای برقراری تماس تلفنی با انبوهی از مردم آمریکا و درخواست از آن‌ها برای حضور پیدا نکردن پای صندوق‌های رای جنجال زیادی به راه انداخت. بررسی‌ها نشان داد که برای تقلید صدای بایدن از هوش مصنوعی استفاده شده است. این موضوع سبب شد که کمیسیون ارتباطات فدرال آمریکا (FCC)، تماس‌های تلفنی مبتنی بر هوش مصنوعی و ربات‌ها را در این کشور ممنوع اعلام کند. باید دید پاسخ این کمیسیون به این مدل هوش مصنوعی چه خواهد بود.

حتما بخوانید: سایر مطالب گروه فناوری

برای مشاهده فوری اخبار و مطالب در کانال تلگرام ما عضو شوید!


منتخب امروز

بیشترین بازدید یک ساعت گذشته


عکس همه زنان اوس موسی پایتخت / زن بازیگرش جذاب تر بود یا خانم مدل؟!