» کسب و کار » مولدهای ویدیوی هوش مصنوعی به یک نقطه اوج حیاتی نزدیک می شوند
کسب و کار

مولدهای ویدیوی هوش مصنوعی به یک نقطه اوج حیاتی نزدیک می شوند

فروردین 17, 1402 30116

شاید متوجه برخی از میم‌های ویدیویی چشمگیر ساخته‌شده با AI در هفته های اخیر. هری پاتر به عنوان یک تبلیغ تجاری Balenciaga و فیلم کابوس‌آمیز ویل اسمیت در حال خوردن اسپاگتی هر دو اخیراً ویروسی شدند. آنها به سرعت پیشرفت توانایی هوش مصنوعی برای ایجاد ویدیو و همچنین مشکل ساز بودن برخی از کاربردهای این فناوری را نشان می دهند.

این ویدیوها مرا به یاد لحظه ای می اندازد که ابزارهای تصویرسازی هوش مصنوعی تبدیل شدند. سال گذشته، زمانی که برنامه‌هایی مانند Craiyon (که قبلاً DALL-E Mini نامیده می‌شد) به هر کسی اجازه می‌داد که تصاویر قابل تشخیص، اگر خام و اغلب سورئال، مانند تصاویر نظارتی از سرقت نوزادان از پمپ بنزین، طرح‌های دادگاه دارث وادار و الون ماسک در حال خوردن مداد رنگی.

Craiyon یک منبع باز حذفی بود که در آن زمان با دقت محدود شده بود DALL-E 2 تولید کننده تصویر از OpenAI، شرکت پشت ChatGPT. این ابزار اولین ابزاری بود که توانایی هوش مصنوعی را در گرفتن یک پیام متنی و تبدیل آن به چیزی شبیه عکس های واقعی و تصاویری که توسط انسان طراحی شده بود را نشان داد. از آن زمان، DALL-E برای همه باز شد و برنامه‌هایی مانند Midjourney و Dream Studio ابزارهای مشابهی را توسعه داده و بهبود بخشیده است که آن را نسبتاً بی اهمیت ساخته است. برای ایجاد تصاویر پیچیده و واقعی با چند ضربه روی صفحه کلید.

همانطور که مهندسان دستگیره‌ها و اهرم‌های الگوریتمی پشت این تولیدکننده‌های تصویر را بهینه‌سازی کرده‌اند، داده‌های آموزشی بیشتری اضافه کرده‌اند و هزینه‌های بیشتری را پرداخت کرده‌اند تراشه‌های GPU برای اجرای همه چیز، این ابزارهای تصویرسازی در جعل واقعیت فوق‌العاده خوب شده‌اند. برای گرفتن چند نمونه از subreddit اختصاص داده شده به تصاویر هوش مصنوعی عجیب، به الکس جونز در رژه غرور همجنس گرایان یا تابوت عهد در حیاط فروشی.

دسترسی گسترده به این فناوری، و پیچیدگی آن، ما را مجبور می‌کند در نحوه مشاهده تصاویر آنلاین تجدید نظر کنیم، همانطور که پس از تصاویر ساخته شده توسط هوش مصنوعی که ظاهراً نشان می‌دهند دستگیری دونالد ترامپ ماه گذشته در فضای مجازی منتشر شد. این حادثه باعث شد که Midjourney اعلام کند که دیگر سرویس آزمایشی رایگان خود را ارائه نخواهد کرد – راه حلی که ممکن است برخی از بازیگران بد اسکیت را متوقف کند اما مشکل گسترده‌تر را دست نخورده باقی می‌گذارد.

به عنوان WIRED’s آماندا هوور این هفته می نویسد، الگوریتم ها هنوز برای تولید ویدیوی قانع کننده از یک اعلان ایجاد بسیاری از فریم‌های مجزا از نظر محاسباتی گران است، و همانطور که ویدیوهای تند و تیز و کندوپاش امروزی نشان می‌دهند، برای الگوریتم‌ها سخت است که انسجام کافی بین آن‌ها را برای تولید یک ویدیوی منطقی حفظ کنند. با این حال،

ابزارهای هوش مصنوعی در ویرایش ویدیوها بسیار ماهرتر می شوند. میم Balenciaga، به همراه نسخه‌های ارجاع‌دهنده به دوستان و شکستن بد، با ترکیب چند ابزار مختلف هوش مصنوعی، ابتدا برای تولید تصاویر ثابت و سپس اضافه کردن جلوه های انیمیشن ساده ساخته شدند. اما نتیجه نهایی هنوز هم چشمگیر است.

به این نوشته امتیاز بدهید!

افراد نیوز

افراد نیوز

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

  • ×