HomeCanadaرپ مونالیزا توانایی های هوش مصنوعی را نشان می دهد

رپ مونالیزا توانایی های هوش مصنوعی را نشان می دهد


نیویورک –

مونالیزا اکنون می تواند بیش از لبخند زدن به لطف جدید انجام دهد هوش مصنوعی تکنولوژی از مایکروسافت

هفته گذشته، محققان مایکروسافت مدل جدیدی از هوش مصنوعی را که توسعه داده‌اند توضیح دادند که می‌تواند تصویر ثابتی از یک چهره و یک کلیپ صوتی از فردی که در حال صحبت است بگیرد و به طور خودکار یک ویدیوی واقعی از صحبت کردن آن شخص ایجاد کند. ویدیوها – که می توانند از چهره های فوتورئالیستی و همچنین کارتون یا آثار هنری ساخته شوند – با همگام سازی لب و حرکات طبیعی صورت و سر کامل می شوند.

در یک ویدیوی نمایشی، محققان نشان دادند که چگونه مونالیزا را برای خواندن یک رپ کمدی توسط بازیگر آن هاتاوی متحرک ساختند.

خروجی های مدل هوش مصنوعی نامیده می شود VASA-1، هم سرگرم کننده هستند و هم از نظر واقعی بودن. مایکروسافت گفت که این فناوری می‌تواند برای آموزش یا «بهبود دسترسی افراد با چالش‌های ارتباطی» یا به طور بالقوه برای ایجاد همراهان مجازی برای انسان‌ها استفاده شود. اما همچنین به راحتی می توان فهمید که چگونه می توان از این ابزار برای جعل هویت افراد واقعی سوء استفاده کرد.

این نگرانی فراتر از مایکروسافت است: با ظهور ابزارهای بیشتر برای ایجاد تصاویر، ویدیوها و صداهای تولید شده توسط هوش مصنوعی، کارشناسان نگران هستند که استفاده نادرست از آنها منجر به اشکال جدیدی از اطلاعات نادرست شود. برخی همچنین نگران هستند که این فناوری می تواند صنایع خلاق را از فیلم گرفته تا تبلیغات مختل کند.

در حال حاضر، مایکروسافت اعلام کرد که قصد ندارد مدل VASA-1 را فوراً برای عموم عرضه کند. این حرکت شبیه به نحوه رسیدگی به نگرانی‌های OpenAI شریک مایکروسافت در مورد ابزار ویدئویی تولید شده توسط هوش مصنوعی خود، Sora است: OpenAI در ماه فوریه Sora را مورد کنایه قرار داد، اما تاکنون آن را تنها برای اهداف آزمایشی در اختیار برخی از کاربران حرفه‌ای و اساتید امنیت سایبری قرار داده است.

محققان مایکروسافت در یک پست وبلاگی گفتند: “ما با هرگونه رفتاری برای ایجاد محتوای گمراه کننده یا مضر از افراد واقعی مخالفیم.” اما، آنها افزودند، این شرکت “هیچ برنامه ای برای عرضه عمومی” محصول ندارد “تا زمانی که مطمئن شویم که این فناوری به طور مسئولانه و مطابق با مقررات مناسب استفاده خواهد شد.”

حرکت دادن چهره ها

به گفته محققان، مدل جدید هوش مصنوعی مایکروسافت بر روی ویدئوهای متعددی از چهره افراد در حین صحبت آموزش داده شده است، و برای تشخیص حرکات طبیعی صورت و سر، از جمله “حرکت لب، بیان (غیر لب)، نگاه چشم و پلک زدن و غیره” طراحی شده است. هنگامی که VASA-1 یک عکس ثابت را متحرک می کند، نتیجه یک ویدیو واقعی تر است.

برای مثال، در یک ویدیوی نمایشی که روی یک کلیپ از فردی که ظاهراً در حال بازی‌های ویدیویی آشفته به نظر می‌رسد، چهره‌ای که صحبت می‌کند ابروهای درهم و لب‌های جمع شده دارد.

ابزار هوش مصنوعی همچنین می تواند برای تولید ویدیویی هدایت شود که در آن سوژه در جهت خاصی نگاه می کند یا احساس خاصی را بیان می کند.

هنگامی که به دقت نگاه می کنید، همچنان نشانه هایی وجود دارد که ویدیوها توسط ماشین تولید شده اند، مانند پلک زدن نادر و حرکت اغراق آمیز ابروها. اما مایکروسافت گفت که بر این باور است که مدلش «به طور قابل توجهی عملکرد بهتری» از سایر ابزارهای مشابه دارد و «راه را برای تعامل در زمان واقعی با آواتارهای واقعی که رفتارهای مکالمه انسان را شبیه‌سازی می‌کنند هموار می‌کند».



Source link

latest articles

explore more

LEAVE A REPLY

Please enter your comment!
Please enter your name here
Captcha verification failed!
CAPTCHA user score failed. Please contact us!
You have not selected any currencies to display