ابزار جدید مایکروسافت چهره‌های سخنگو می‌سازد+فیلم

ابزار هوش مصنوعی مایکروسافت می‌تواند عکس‌ شخص را به ویدئوهای واقعی از صحبت کردن و آواز خواندن او تبدیل کند.
به گزارش گروه علم و پیشرفت خبرگزاری فارس به نقل از انگجت، آزمایشگاه مایکروسافت از یک ابزار آزمایشی هوش مصنوعی جدید به نام VASA-1 رونمایی کرده است. این ابزار تصویر ثابتی از یک شخص (یا نقاشی یک نفر) و یک فایل صوتی را پردازش کرده و یک چهره واقعی در حال صحبت کردن ایجاد می‌کند.
این ابزار توانایی ایجاد حالات چهره و حرکات سر برای یک تصویر ثابت و حرکات مناسب لب برای مطابقت با یک سخنرانی یا یک آهنگ را دارد. در حالی که حرکات لب و سر در نمونه‌ها همچنان با بررسی دقیق‌تر ناهماهنگ به نظر می رسد، اما این فناوری می‌تواند مورد سوء استفاده قرار گیرد. محققان هنوز این هوش مصنوعی را دردسترس قرار نداده اند و اعلام نکرده اند که آیا تدابیر امنیتی خاصی برای جلوگیری از استفاده بازیگران بد اجرا می کنند یا خیر.این سیستم می‌تواند ویدیوهایی با وضوح بالا (512 در 512 پیکسل) و نرخ فریم بالا تولید کند. در حالت آفلاین، VASA-1 ویدیوهایی با سرعت 45 فریم‌درثانیه تولید می‌کند و در حالت آنلاین این میزان به 40 فریم‌در‌ثانیه می‌رسد.
محققان بر این باورند که فناوری آنها علیرغم امکان استفاده نادرست مزایای زیادی دارد. آنها گفتند که می توان از آن برای بهبود دسترسی کسانی که دارای چالش های ارتباطی هستند، استفاده کرد. ابزار VASA-1 بر روی مجموعه داده VoxCeleb2 آموزش دیده است که حاوی بیش از 1 میلیون گفتار 6112 چهره مشهور استخراج شده از ویدئوهای یوتیوب است. اگرچه این ابزار بر روی چهره‌های واقعی آموزش داده شده، اما روی عکس‌های هنری مانند مونالیزا نیز اجرا می شود.در زیر نمونه ای از کار این ابزار را می بینید که با گرفتن تصویر این شخص فیلم زیر را از صحبت کردن او تولید می کند.
در زیر نمونه ای از کار این ابزار را می بینید که با گرفتن تصویر این شخص فیلم زیر را از صحبت کردن او تولید می کند.
۲ MB
#هوش_مصنوعی#مایکروسافت#چهره
14:59 - 1 اردیبهشت 1403

3 بازنشر5 واکنش
10٫5k بازدید


1 پاسخ