متا I-JEPA را راه اندازی کرد، مدلی شبیه به انسان برای ایجاد تصویر هوش مصنوعی
متا اخیراً برنامههایی را برای دسترسی دانشگاهیان به اجزای خاص I-JEPA، یک مدل پیشگامانه هوش مصنوعی (AI) اعلام کرده است. به گفته متا، I-JEPA یک پیشرفت قابل توجه در فناوری هوش مصنوعی است، زیرا دارای مهارت های انسانی است و در تفسیر صحیح و تکمیل عکس های ناقص از مدل های قبلی بهتر است. این اقدام متا قصد دارد تحقیقات و توسعه هوش مصنوعی آینده را با اجازه دادن به دانشمندان برای بررسی مستقیم احتمالات I-JEPA تشویق کند.
I-JEPA با استفاده از دانش پسزمینه درباره جهان برای پر کردن تکههای از دست رفته تصاویر کار میکند. این رویکرد با سایر مدلهای هوش مصنوعی مولد، که تنها به پیکسلهای نزدیک متکی هستند، متفاوت است. متا معتقد است که این رویکرد باعث میشود I-JEPA دقیقتر شود و احتمال خطاهایی مانند دستها با انگشتان اضافی کمتر شود.
متا قصد دارد I-JEPA را از طریق برنامه تحقیقاتی منبع باز خود در دسترس محققان قرار دهد. این به محققان اجازه می دهد تا از I-JEPA برای توسعه برنامه های کاربردی جدید برای بینایی کامپیوتر استفاده کنند. برخی از برنامه های بالقوه شامل بازیابی تصویر، ویرایش تصویر، و تولید تصویر هستند.
متا معتقد است که I-JEPA این پتانسیل را دارد که دید کامپیوتری را متحول کند و راه های جدیدی را برای کاربرد باز کند. این شرکت مشتاقانه منتظر است تا ببیند چگونه محققان از I-JEPA برای توسعه محصولات جدید و نوآورانه استفاده می کنند.
مفهوم پشت I-JEPA چیست؟
مشابه انسانها، I-JEPA (معماری پیشگوی تعبیهشده مشترک) اطلاعات پسزمینهای درباره جهان را با مشاهده بیصدا میآموزد. این اطلاعات در نمایش های دیجیتالی رمزگذاری می شوند که بعداً قابل دسترسی هستند. سپس مدل نمایش بخشی از یک ورودی، مانند یک متن یا تصویر را با استفاده از نمایش بخشهای دیگر همان ورودی پیشبینی میکند. این با سایر مدلهای هوش مصنوعی مولد متفاوت است، که با تغییر شکل یا حذف بخشهایی از ورودی یاد میگیرند.
رویکرد I-JEPA چندین مزیت دارد. اول، به مدل اجازه می دهد کارآمدتر یاد بگیرد، زیرا لازم نیست هر بار که ورودی جدیدی دریافت می کند، از ابتدا شروع کند. دوم، به مدل اجازه میدهد خروجیهای واقعیتر و دقیقتری تولید کند، زیرا محدود به اطلاعاتی نیست که به صراحت در ورودی وجود دارد.
I-JEPA پتانسیل استفاده برای طیف وسیعی از برنامهها، از جمله تکمیل تصویر، تولید متن، و ترجمه ماشینی را دارد.
چگونه مدل هوش مصنوعی متا بهتر از سایرین است؟
طبق گفته متا، مدلهای رقیب هوش مصنوعی تلاش میکنند تا تک تک اطلاعات گمشده در یک تصویر را پر کنند، حتی اگر نامربوط باشند. این ممکن است منجر به اشتباهاتی شود، مانند اضافه کردن انگشتان اضافی به دست.
I-JEPA، از طرف دیگر، تحت تأثیر این موضوع قرار نمی گیرد. با استفاده از «هدفهای پیشبینی انتزاعی» که «جزئیات سطح پیکسل» غیرضروری را حذف میکند، دادههای گمشده را حدس میزند. این به I-JEPA امکان میدهد اطلاعات «سطح بالاتر» را در مورد بخشهای دیده نشده در تصاویر به جای جزئیات سطح پیکسل پیشبینی کند.
به عنوان مثال، اگر تصویر تا حدی مبهم باشد، I-JEPA میتواند پیشبینی کند که شی پنهان چیست، حتی اگر مشخصات شیء قابل مشاهده نباشد. این به دلیل این واقعیت است که I-JEPA به اطلاعاتی که صریحاً در تصویر موجود است محدود نمی شود. همچنین می تواند از دانش جهانی خود برای پر کردن جاهای خالی استفاده کند.
ظرفیت I-JEPA برای پیشبینی اطلاعات سطح بالاتر، مزیت قابل توجهی را نسبت به سایر مدلهای هوش مصنوعی مولد به آن میدهد. دقت و واقع گرایی I-JEPA را بهبود می بخشد و امکان استفاده از آن را برای طیف وسیع تری از برنامه ها فراهم می کند.
همچنین نحوه نصب Meta AI Audiocraft برای نسل Text-to-Music را بخوانید.
I-JEPA چندین تست را پشت سر گذاشت
مدل بینایی کامپیوتر I-JEPA متا در معیارهای مختلف از سایر مدل ها بهتر عمل کرد و از نظر محاسباتی کارآمدتر است. I-JEPA همچنین به تنظیم دقیق کمتری نسبت به مدلهای دیگر نیاز دارد که آن را به ابزاری همهکارهتر و کارآمدتر برای کارهای بینایی رایانه تبدیل میکند.
پژوهش منبع باز Meta
متا به طور مداوم تعهد خود را به پیشرفت تحقیقات هوش مصنوعی (AI) با انتشار فعال پروژههای منبع باز از آزمایشگاه تحقیقاتی داخلی خود نشان داده است. مدیر عامل متا، مارک زاکربرگ، معتقد است که به اشتراک گذاری مدل های تحقیقاتی برای ایجاد نوآوری، بهبود اقدامات ایمنی و کاهش هزینه ها حیاتی است. با ترویج همکاری در صنعت هوش مصنوعی، Meta قصد دارد راه را در توسعه هوش مصنوعی رهبری کند و از پیشرفت های ایجاد شده توسط سایر سازمان ها استفاده کند.
محصولات مصرفی مبتنی بر هوش مصنوعی Meta
Meta نه تنها مدلهای هوش مصنوعی را گسترش میدهد، بلکه ویژگیهای مولد هوش مصنوعی را در محصولات مصرفی خود نیز پیادهسازی میکند. آنها ابزارهای تبلیغاتی را برای ایجاد پسزمینه تصویر و همچنین یک محصول اینستاگرامی راهاندازی کردهاند که میتواند عکسهای کاربران را بر اساس پیشنهادات متنی تغییر دهد. این برنامههای منحصربهفرد تعهد متا به بهبود تجربیات کاربر و به حداکثر رساندن وعده هوش مصنوعی در تعاملات روزمره را برجسته میکنند.
نتیجه گیری
انتشار مدل تولید تصویر هوش مصنوعی «مانند انسان» متا پلتفرم، I-JEPA، در عصر جدیدی از قابلیتهای بینایی کامپیوتری استقبال میکند. روش نوآورانه I-JEPA برای پر کردن عناصر تصویر از دست رفته و ارائه عملکرد عالی، نوید باز کردن امکانات بینهایت را در طیف وسیعی از بخشها میدهد. متا امیدوار است با به اشتراک گذاشتن یافتههای خود و تشویق همکاری، این صنعت را به پیش ببرد، در حالی که به نگرانیهای ایمنی رسیدگی میکند و تجربیات کاربران را در اولویت قرار میدهد. همانطور که متا به تلاش خود ادامه می دهد، آینده تولید تصویر مبتنی بر هوش مصنوعی روشن تر از همیشه است.