مولدهای ویدیوی هوش مصنوعی به یک نقطه اوج حیاتی نزدیک می شوند
شاید متوجه برخی از میمهای ویدیویی چشمگیر ساختهشده با AI در هفته های اخیر. هری پاتر به عنوان یک تبلیغ تجاری Balenciaga و فیلم کابوسآمیز ویل اسمیت در حال خوردن اسپاگتی هر دو اخیراً ویروسی شدند. آنها به سرعت پیشرفت توانایی هوش مصنوعی برای ایجاد ویدیو و همچنین مشکل ساز بودن برخی از کاربردهای این فناوری را نشان می دهند.
این ویدیوها مرا به یاد لحظه ای می اندازد که ابزارهای تصویرسازی هوش مصنوعی تبدیل شدند. سال گذشته، زمانی که برنامههایی مانند Craiyon (که قبلاً DALL-E Mini نامیده میشد) به هر کسی اجازه میداد که تصاویر قابل تشخیص، اگر خام و اغلب سورئال، مانند تصاویر نظارتی از سرقت نوزادان از پمپ بنزین، طرحهای دادگاه دارث وادار و الون ماسک در حال خوردن مداد رنگی.
Craiyon یک منبع باز حذفی بود که در آن زمان با دقت محدود شده بود DALL-E 2 تولید کننده تصویر از OpenAI، شرکت پشت ChatGPT. این ابزار اولین ابزاری بود که توانایی هوش مصنوعی را در گرفتن یک پیام متنی و تبدیل آن به چیزی شبیه عکس های واقعی و تصاویری که توسط انسان طراحی شده بود را نشان داد. از آن زمان، DALL-E برای همه باز شد و برنامههایی مانند Midjourney و Dream Studio ابزارهای مشابهی را توسعه داده و بهبود بخشیده است که آن را نسبتاً بی اهمیت ساخته است. برای ایجاد تصاویر پیچیده و واقعی با چند ضربه روی صفحه کلید.
همانطور که مهندسان دستگیرهها و اهرمهای الگوریتمی پشت این تولیدکنندههای تصویر را بهینهسازی کردهاند، دادههای آموزشی بیشتری اضافه کردهاند و هزینههای بیشتری را پرداخت کردهاند تراشههای GPU برای اجرای همه چیز، این ابزارهای تصویرسازی در جعل واقعیت فوقالعاده خوب شدهاند. برای گرفتن چند نمونه از subreddit اختصاص داده شده به تصاویر هوش مصنوعی عجیب، به الکس جونز در رژه غرور همجنس گرایان یا تابوت عهد در حیاط فروشی.
دسترسی گسترده به این فناوری، و پیچیدگی آن، ما را مجبور میکند در نحوه مشاهده تصاویر آنلاین تجدید نظر کنیم، همانطور که پس از تصاویر ساخته شده توسط هوش مصنوعی که ظاهراً نشان میدهند دستگیری دونالد ترامپ ماه گذشته در فضای مجازی منتشر شد. این حادثه باعث شد که Midjourney اعلام کند که دیگر سرویس آزمایشی رایگان خود را ارائه نخواهد کرد – راه حلی که ممکن است برخی از بازیگران بد اسکیت را متوقف کند اما مشکل گستردهتر را دست نخورده باقی میگذارد.
به عنوان WIRED’s آماندا هوور این هفته می نویسد، الگوریتم ها هنوز برای تولید ویدیوی قانع کننده از یک اعلان ایجاد بسیاری از فریمهای مجزا از نظر محاسباتی گران است، و همانطور که ویدیوهای تند و تیز و کندوپاش امروزی نشان میدهند، برای الگوریتمها سخت است که انسجام کافی بین آنها را برای تولید یک ویدیوی منطقی حفظ کنند. با این حال،
ابزارهای هوش مصنوعی در ویرایش ویدیوها بسیار ماهرتر می شوند. میم Balenciaga، به همراه نسخههای ارجاعدهنده به دوستان و شکستن بد، با ترکیب چند ابزار مختلف هوش مصنوعی، ابتدا برای تولید تصاویر ثابت و سپس اضافه کردن جلوه های انیمیشن ساده ساخته شدند. اما نتیجه نهایی هنوز هم چشمگیر است.