OpenAI می گوید قصد دارد استفاده از یکی از صداهای ChatGPT خود را پس از اینکه برخی از کاربران گفتند شبیه اسکارلت جوهانسون است، که صداپیشگی یک دستیار هوش مصنوعی تخیلی و در آن زمان آینده نگرانه در فیلم «Her» در سال 2013 بود، متوقف کند.
در پستی در پلتفرم رسانه اجتماعی X دوشنبه، OpenAI گفت که در حال “کار برای توقف” Sky – نام یکی از پنج صدایی است که کاربران ChatGPT می توانند با آن صحبت کنند. این شرکت گفت که درباره نحوه انتخاب گزینه های صوتی واقعی موجود برای چت ربات هوش مصنوعی پرچمدار خود، به ویژه Sky «سوالاتی شنیده است و می خواهد به آنها رسیدگی کند.
OpenAI همچنین به سرعت نظریه های اینترنت در مورد جوهانسون را در یک پست وبلاگ همراه با جزئیات نحوه انتخاب صداهای ChatGPT رد کرد.
این شرکت نوشت: “ما معتقدیم که صداهای هوش مصنوعی نباید عمداً صدای متمایز یک سلبریتی را تقلید کنند – صدای Sky تقلیدی از اسکارلت جوهانسون نیست بلکه متعلق به یک بازیگر حرفه ای متفاوت است که از صدای طبیعی خود استفاده می کند.” این شرکت اعلام کرد به دلایل حفظ حریم خصوصی نمی تواند نام صداپیشه های خود را به اشتراک بگذارد.
اما یوهانسون روز دوشنبه بیانیهای صادر کرد و گفت که سام آلتمن، مدیر عامل OpenAI در ماه سپتامبر به او مراجعه کرده و از او خواسته است که آیا صدایش را به سیستم قرض دهد و گفت که او احساس میکند که این امر باعث آرامش مردم خواهد شد که با این فناوری راحت نیستند. او گفت که این پیشنهاد را رد کرده است.
جوهانسون گفت: «وقتی دموی منتشر شده را شنیدم، شوکه شدم، عصبانی شدم و در ناباوری از اینکه آقای آلتمن صدایی را دنبال خواهد کرد که به طرز وحشتناکی شبیه صدای من است که نزدیکترین دوستانم و رسانه های خبری نمی توانند تفاوت را تشخیص دهند، شوکه شدم.
او گفت که OpenAI «با اکراه» موافقت کرد که صدای Sky را پس از استخدام وکلایی که نامههای آلتمن را در مورد فرآیند ارائه این صدا از شرکت مینوشتند، حذف کند.
OpenAI مستقر در سانفرانسیسکو توضیح بیشتری در مورد اینکه چرا همچنان تصمیم به توقف استفاده از Sky گرفته است، ارائه نکرد.
OpenAI برای اولین بار قابلیت های صوتی ChatGPT را در ماه سپتامبر ارائه کرد که شامل پنج صدای مختلف بود و به کاربران این امکان را می داد تا با دستیار هوش مصنوعی مکالمه پشت سر هم داشته باشند. «حالت صوتی» در ابتدا فقط برای مشترکین پولی در دسترس بود، اما در ماه نوامبر، OpenAI اعلام کرد که این ویژگی برای همه کاربران با اپلیکیشن موبایل رایگان خواهد شد.
و تعاملات ChatGPT روز به روز پیچیده تر می شود. هفته گذشته OpenAI گفت که آخرین بهروزرسانی مدل هوش مصنوعی مولد آن میتواند آهنگهای انسانی را در پاسخهای کلامی خود تقلید کند و حتی میتواند خلق و خوی افراد را تشخیص دهد.
OpenAI میگوید جدیدترین مدل با نام GPT-4o سریعتر از نسخههای قبلی کار میکند و میتواند متن، صدا و ویدیو را در زمان واقعی استدلال کند. در نمایشی در طی اعلامیه 13 مه OpenAI، ربات هوش مصنوعی در زمان واقعی چت کرد و بر حسب درخواست، احساسات – به ویژه “درام بیشتر” را به صدای خود اضافه کرد. همچنین در برون یابی وضعیت عاطفی یک فرد با تماشای یک ویدیوی سلفی از چهره آنها، کمک در ترجمه زبان، مسائل ریاضی گام به گام و موارد دیگر، تأثیر مثبتی داشت.
GPT-4o، مخفف “omni”، هنوز به طور گسترده در دسترس نیست. در هفته ها و ماه های آینده به تدریج راه خود را برای انتخاب کاربران باز خواهد کرد. قابلیتهای نوشتاری و تصویری این مدل در حال حاضر شروع به کار کرده است، و قرار است حتی به برخی از آنهایی که از سطح رایگان ChatGPT استفاده میکنند نیز برسد – اما حالت صوتی جدید فقط برای مشترکین پولی ChatGPT Plus در دسترس خواهد بود.
نقطه عطف: 40
اسکارلت جوهانسون
تولد: 22 نوامبر 1984
اسکارلت جوهانسون در فیلم آلبی ها، به میزبانی بنیاد کلونی برای عدالت، در کتابخانه عمومی نیویورک، پنجشنبه، 28 سپتامبر 2023، در نیویورک شرکت می کند. (عکس از ایوان آگوستینی/اینویژن/AP)
در حالی که بیشتر آنها هنوز به این ویژگیهای جدید اعلامشده دست پیدا نکردهاند، این قابلیتها مقایسههای بیشتری را با رمان عاشقانه دیستوپیایی Spike Jonze به نام «Her» به وجود آورده است که مردی درونگرا (واکین فینیکس) را دنبال میکند که عاشق یک عامل هوش مصنوعی میشود. سیستم (جوهانسون)، منجر به بسیاری از عوارض.
به نظر میرسد آلتمن نیز از این موضوع استفاده کرده است – به سادگی کلمه «او» را در پلتفرم رسانههای اجتماعی X در روز رونمایی GPT-4o پست کرد.
بسیاری از افراد در واکنش به دموهای این مدل در هفته گذشته دریافتند که برخی از تعاملات لحن عجیب و غریبی دارد. در یکی از ویدیوهای ارسال شده توسط OpenAI، یک ChatGPT با صدای زن از یک کارمند شرکت بابت «تکان دادن هودی OpenAI» تعریف میکند، و در ویدیوی دیگر چت ربات میگوید «اوه بس کن، تو باعث سرخی من میشوی» حیرت آور.
این موضوع باعث ایجاد گفتگوهایی در مورد روشهای جنسیتی شده است که منتقدان میگویند شرکتهای فناوری مدتهاست که برای توسعه و تعامل با دستیارهای صوتی استفاده میکردهاند، که قدمت آن قبل از اینکه آخرین موج هوش مصنوعی مولد تواناییهای چت رباتهای هوش مصنوعی را ارتقا دهد، بازمیگردد. در سال 2019، سازمان فرهنگ و علم سازمان ملل متحد، حتی در صورت مواجهه با توهینهای جنسی و آزار و اذیت جنسی، به «تعالی سختگیرانه» در دستیارهای پیشفرض با صدای زن (مانند سیری اپل تا الکسای آمازون) اشاره کرد.
دسی لیدیک، خبرنگار ارشد دیلی شو در مورد GPT-4o در هفته گذشته گفت: «این به وضوح برای تغذیه شخصیت افراد برنامه ریزی شده است. “شما واقعا می توانید بگویید که یک مرد این فناوری را ساخته است.”
