استفاده هوش مصنوعی از متن برای تولید موسیقی متا

مدل هوش مصنوعی متن باز متعلق به متا، از متن برای ایجاد ترکیبات ژانر‌های موسیقی استفاده می‌کند.

به گزارش راهبرد معاصر؛ تیم تحقیقاتی متا به تازگی یک مدل زبان یادگیری عمیق منبع باز به نام «MusicGen» را منتشر کرده، که می‌تواند موسیقی جدیدی را بر اساس پیام‌های متنی تولید کند و حتی با یک آهنگ موجود تراز شود.

با استفاده از این ابزار می‌توانید سبک موسیقی مورد نظر را توضیح داده و سپس روی گزینه «Generate» کلیک کنید؛ پس از مدتی یک قطعه کوتاه از موسیقی کاملاً جدید را بر اساس پیام‌های متن و ملودی درخواستی شما منتشر می‌کند. نسخه نمایشی به شما امکان می‌دهد موسیقی خود را توصیف کنید. سپس می‌توانید انتخاب کنید که آهنگ چقدر طول بکشد.

این تیم از ۲۰ هزار ساعت موسیقی برای آموزش مدل استفاده کرد که شامل ۱۰ هزار آهنگ موسیقی با کیفیت بالا از مجموعه داده‌های داخلی به همراه آهنگ‌های شرکت‌های شاتراستاک و Pond۵ بود. محققان برای سریع‌تر کردن آن، از واحدساز صوتی ۳۲ کیلوهرتزی «EnCodec» متا جهت تولید قطعات کوچک‌تر موسیقی که می‌توانند به صورت موازی پردازش شوند، استفاده کردند.

گوگل ماه گذشته، یک تولید کننده موسیقی مشابه به نام «MusicLM» منتشر کرد، اما به نظر می‌رسد MusicGen نتایج بهتری ایجاد می‌کند.

همانطور که گفته شد، MusicGen منبع باز است و حتی می‌توان از آن برای تولید موسیقی تجاری استفاده کرد. با این حال، این آخرین نمونه از سرعت خیره کننده توسعه هوش مصنوعی در نیم سال گذشته است. / انگجت

گوناگون

استفاده هوش مصنوعی از متن برای تولید موسیقی متا

بیشترین بازدید یک ساعت گذشته