ابزار جدید مایکروسافت چهرههای سخنگو میسازد+فیلم
ابزار هوش مصنوعی مایکروسافت میتواند عکس شخص را به ویدئوهای واقعی از صحبت کردن و آواز خواندن او تبدیل کند.
به گزارش گروه علم و پیشرفت خبرگزاری فارس به نقل از انگجت، آزمایشگاه مایکروسافت از یک ابزار آزمایشی هوش مصنوعی جدید به نام VASA-1 رونمایی کرده است. این ابزار تصویر ثابتی از یک شخص (یا نقاشی یک نفر) و یک فایل صوتی را پردازش کرده و یک چهره واقعی در حال صحبت کردن ایجاد میکند.
این ابزار توانایی ایجاد حالات چهره و حرکات سر برای یک تصویر ثابت و حرکات مناسب لب برای مطابقت با یک سخنرانی یا یک آهنگ را دارد. در حالی که حرکات لب و سر در نمونهها همچنان با بررسی دقیقتر ناهماهنگ به نظر می رسد، اما این فناوری میتواند مورد سوء استفاده قرار گیرد. محققان هنوز این هوش مصنوعی را دردسترس قرار نداده اند و اعلام نکرده اند که آیا تدابیر امنیتی خاصی برای جلوگیری از استفاده بازیگران بد اجرا می کنند یا خیر.این سیستم میتواند ویدیوهایی با وضوح بالا (512 در 512 پیکسل) و نرخ فریم بالا تولید کند. در حالت آفلاین، VASA-1 ویدیوهایی با سرعت 45 فریمدرثانیه تولید میکند و در حالت آنلاین این میزان به 40 فریمدرثانیه میرسد.
محققان بر این باورند که فناوری آنها علیرغم امکان استفاده نادرست مزایای زیادی دارد. آنها گفتند که می توان از آن برای بهبود دسترسی کسانی که دارای چالش های ارتباطی هستند، استفاده کرد. ابزار VASA-1 بر روی مجموعه داده VoxCeleb2 آموزش دیده است که حاوی بیش از 1 میلیون گفتار 6112 چهره مشهور استخراج شده از ویدئوهای یوتیوب است. اگرچه این ابزار بر روی چهرههای واقعی آموزش داده شده، اما روی عکسهای هنری مانند مونالیزا نیز اجرا می شود.در زیر نمونه ای از کار این ابزار را می بینید که با گرفتن تصویر این شخص فیلم زیر را از صحبت کردن او تولید می کند.
در زیر نمونه ای از کار این ابزار را می بینید که با گرفتن تصویر این شخص فیلم زیر را از صحبت کردن او تولید می کند.
#هوش_مصنوعی#مایکروسافت#چهره
14:59 - 1 اردیبهشت 1403