نیویورک –
مونالیزا اکنون می تواند بیش از لبخند زدن به لطف جدید انجام دهد هوش مصنوعی تکنولوژی از مایکروسافت
هفته گذشته، محققان مایکروسافت مدل جدیدی از هوش مصنوعی را که توسعه دادهاند توضیح دادند که میتواند تصویر ثابتی از یک چهره و یک کلیپ صوتی از فردی که در حال صحبت است بگیرد و به طور خودکار یک ویدیوی واقعی از صحبت کردن آن شخص ایجاد کند. ویدیوها – که می توانند از چهره های فوتورئالیستی و همچنین کارتون یا آثار هنری ساخته شوند – با همگام سازی لب و حرکات طبیعی صورت و سر کامل می شوند.
در یک ویدیوی نمایشی، محققان نشان دادند که چگونه مونالیزا را برای خواندن یک رپ کمدی توسط بازیگر آن هاتاوی متحرک ساختند.
خروجی های مدل هوش مصنوعی نامیده می شود VASA-1، هم سرگرم کننده هستند و هم از نظر واقعی بودن. مایکروسافت گفت که این فناوری میتواند برای آموزش یا «بهبود دسترسی افراد با چالشهای ارتباطی» یا به طور بالقوه برای ایجاد همراهان مجازی برای انسانها استفاده شود. اما همچنین به راحتی می توان فهمید که چگونه می توان از این ابزار برای جعل هویت افراد واقعی سوء استفاده کرد.
این نگرانی فراتر از مایکروسافت است: با ظهور ابزارهای بیشتر برای ایجاد تصاویر، ویدیوها و صداهای تولید شده توسط هوش مصنوعی، کارشناسان نگران هستند که استفاده نادرست از آنها منجر به اشکال جدیدی از اطلاعات نادرست شود. برخی همچنین نگران هستند که این فناوری می تواند صنایع خلاق را از فیلم گرفته تا تبلیغات مختل کند.
در حال حاضر، مایکروسافت اعلام کرد که قصد ندارد مدل VASA-1 را فوراً برای عموم عرضه کند. این حرکت شبیه به نحوه رسیدگی به نگرانیهای OpenAI شریک مایکروسافت در مورد ابزار ویدئویی تولید شده توسط هوش مصنوعی خود، Sora است: OpenAI در ماه فوریه Sora را مورد کنایه قرار داد، اما تاکنون آن را تنها برای اهداف آزمایشی در اختیار برخی از کاربران حرفهای و اساتید امنیت سایبری قرار داده است.
محققان مایکروسافت در یک پست وبلاگی گفتند: “ما با هرگونه رفتاری برای ایجاد محتوای گمراه کننده یا مضر از افراد واقعی مخالفیم.” اما، آنها افزودند، این شرکت “هیچ برنامه ای برای عرضه عمومی” محصول ندارد “تا زمانی که مطمئن شویم که این فناوری به طور مسئولانه و مطابق با مقررات مناسب استفاده خواهد شد.”
به گفته محققان، مدل جدید هوش مصنوعی مایکروسافت بر روی ویدئوهای متعددی از چهره افراد در حین صحبت آموزش داده شده است، و برای تشخیص حرکات طبیعی صورت و سر، از جمله “حرکت لب، بیان (غیر لب)، نگاه چشم و پلک زدن و غیره” طراحی شده است. هنگامی که VASA-1 یک عکس ثابت را متحرک می کند، نتیجه یک ویدیو واقعی تر است.
برای مثال، در یک ویدیوی نمایشی که روی یک کلیپ از فردی که ظاهراً در حال بازیهای ویدیویی آشفته به نظر میرسد، چهرهای که صحبت میکند ابروهای درهم و لبهای جمع شده دارد.
ابزار هوش مصنوعی همچنین می تواند برای تولید ویدیویی هدایت شود که در آن سوژه در جهت خاصی نگاه می کند یا احساس خاصی را بیان می کند.
هنگامی که به دقت نگاه می کنید، همچنان نشانه هایی وجود دارد که ویدیوها توسط ماشین تولید شده اند، مانند پلک زدن نادر و حرکت اغراق آمیز ابروها. اما مایکروسافت گفت که بر این باور است که مدلش «به طور قابل توجهی عملکرد بهتری» از سایر ابزارهای مشابه دارد و «راه را برای تعامل در زمان واقعی با آواتارهای واقعی که رفتارهای مکالمه انسان را شبیهسازی میکنند هموار میکند».
Bonds and the related ETFs did what they were supposed to do last year. They…
Listen to this article | 4 minsinfoIsraeli strikes have hit the southern suburbs of the Lebanese capital,…
The newest simplicity of red-colored otherwise black nonetheless allures one another the newest and you…
Federal Artificial Intelligence Minister Evan Solomon says the CEO of OpenAI has agreed to take several actions…
The family of a young man severely injured in the Lapu Lapu Festival tragedy says…
This weekly update tracks some of the largest cryptocurrencies by market share: bitcoin and ether.…