راهنمای مهندسی سریع پیشرفته
مهندسی سریع یک عنصر ضروری در توسعه، آموزش و استفاده از مدلهای زبان بزرگ (LLM) است و شامل طراحی ماهرانه دستورات ورودی برای بهبود عملکرد و دقت مدل است.
اعلام پیشرفته
در این مرحله باید واضح باشد که به تقویت اعلانها برای دستیابی به نتایج بهتر در فعالیتهای مختلف کمک میکند. این تمام هدف مهندسی سریع سریع است.
درخواست صفر شات
LLM هایی که بر روی حجم عظیمی از داده ها آموزش دیده اند و برای اطاعت از دستورالعمل ها تنظیم شده اند، اکنون می توانند کارهای خود را در پرواز انجام دهند. در قسمت آخر، چند نمونه صفر شات را امتحان کردیم. یکی از مثال هایی که استفاده کردیم به شرح زیر بود:
پست:
متن را به خنثی، منفی یا مثبت طبقه بندی کنید.
متن: فکر می کنم تعطیلات خوب است.
احساس:
خروجی:
خنثی
ما هیچ نمونهای برای مدل در اعلان بالا ارائه نکردیم، که قابلیتهای صفر شات مدل را نشان میدهد. هنگامی که صفر شات با شکست مواجه می شود، بهتر است دموها یا نمونه هایی را در اعلان قرار دهید. روشی که به عنوان دستور چند شات شناخته می شود در زیر بیشتر مورد بحث قرار گرفته است.
پیشنهاد چند شات
در حالی که مدلهای بزرگزبان از قبل قابلیتهای شات صفر قابلتوجهی دارند، در صورت استفاده از تنظیمات شات صفر، در انجام کارهای پیچیدهتر کوتاهی میکنند. برای بهبود این موضوع، از چند شات به عنوان یک استراتژی برای فعال کردن یادگیری درون متنی استفاده میکنیم، که در آن نسخههای نمایشی را در اعلان ارائه میکنیم تا مدل را به عملکرد بالاتر هدایت کنیم. مثالها به عنوان شرطی برای موارد بعدی که میخواهیم مدل پاسخ دهد، عمل میکنند.
پست:
"whatpu" حیوانی کوچک و پشمالو بومی تانزانیا است. مثالی از جمله ای که استفاده می کند
کلمه whatpu است:
ما در آفریقا سفر میکردیم و این عصارههای بسیار زیبا را دیدیم.
انجام "فردودل" به معنای بالا و پایین پریدن بسیار سریع است. مثالی از جمله ای که استفاده می کند
کلمه فردودل این است:
خروجی:
وقتی بازی را بردیم، همه شروع کردیم به جشن گرفتن.
ما میتوانیم مشاهده کنیم که مدل با ارائه تنها یک مثال (یعنی 1-shot) به نحوی نحوه انجام کار را یاد گرفته است. برای کارهای دشوارتر، میتوانیم با افزایش نمایشها (مانند 3 تیر، 5 تیر، 10 تیر، و غیره) آزمایش کنیم.
تغییر زنجیره ای
تشویق زنجیرهای فکر (CoT)، معرفی شده توسط وی و همکاران. (2022)، مهارت های استدلالی پیشرفته را از طریق مراحل استدلال میانی ارائه می دهد. میتوان آن را همراه با چند شات برای بهبود عملکرد در فعالیتهای دشوارتر که قبل از پاسخ دادن نیاز به تفکر دارند، استفاده کرد.
پست:
اعداد فرد در این گروه به عدد زوج می رسند: 4، 8، 9، 15، 12، 2، 1.
پاسخ: با جمع کردن تمام اعداد فرد (9، 15، 1) عدد 25 به دست می آید. پاسخ غلط است.
اعداد فرد در این گروه به یک عدد زوج می رسند: 15، 32، 5، 13، 82، 7، 1.
پاسخ:
خروجی:
با جمع کردن همه اعداد فرد (15، 5، 13، 7، 1) 41 به دست می آید. پاسخ نادرست است. .
به خاطر داشته باشید که نویسندگان پیشنهاد میکنند که این یک ظرفیت اضطراری است که زمانی ایجاد میشود که از مدلهای زبانی به اندازه کافی بزرگ استفاده شود.
Zero-Shot CoT
یکی از ایدههای اخیری که اخیراً مطرح شد، ایده CoT بدون شاتاست. > (Kojima et al. 2022) که اساساً شامل افزودن «بیایید قدم به قدم فکر کنیم» به درخواست اصلی است. بیایید یک مشکل ساده را امتحان کنیم و ببینیم مدل چگونه عمل می کند:
پست:
رفتم بازار و 10 تا سیب خریدم. 2 تا سیب به همسایه و 2 تا به تعمیرکار دادم. سپس رفتم و 5 سیب دیگر خریدم و 1 سیب را خوردم. با چند سیب ماندم؟
خروجی:
11 سیب
قابل توجه است که این دستور ساده در این کار موثر است. این به ویژه در مواردی مفید است که مثال های زیادی برای استفاده در مهندسی سریع ندارید.
ثبات خود
خود سازگاری یکی از استراتژی های پیشرفته تر برای مهندسی سریع است. خود سازگاری، همانطور که توسط وانگ و همکاران پیشنهاد شده است. (2022)، در نظر دارد “rرمزگشایی حریصانه ساده و بی تکلف مورد استفاده در تحریک زنجیره ای از فکر را جایگزین کند.” هدف این است که چندین مسیر استدلال مختلف را با استفاده از CoT چند شات نمونه برداری کنیم و سپس از نسل ها برای انتخاب سازگارترین راه حل استفاده کنیم. این کار باعث بهبود عملکرد درخواست CoT در آزمونهای استدلالی حسابی و عقلانی میشود.
پست:
سؤال: اولیویا 23 دلار دارد. او پنج شیرینی به قیمت هر کدام 3 دلار خرید. چقدر پول برای او باقی مانده است؟
ج: او 5 عدد نان شیرینی به قیمت 3 دلار خرید. این به این معنی است که او 5 هزینه کرده است
س: وقتی 6 ساله بودم خواهرم نصف سن من بود. الان من 70 سالمه خواهرم چند سالشه؟
پاسخ:
خروجی:
اگر شما 6 سال داشتید و خواهرتان نصف سن شما بود، در آن زمان 3 ساله بود. اختلاف سنی بین شما و خواهرتان همیشه 3 سال خواهد بود. از آنجایی که شما اکنون 70 ساله هستید، خواهر شما باید 70 - 3 = 67 ساله باشد. پاسخ 67 است.
اعلام دانش تولید شده
LLMها همیشه در حال بهبود هستند، و یک استراتژی محبوب، توانایی افزودن دانش یا اطلاعات به مدل برای کمک به ایجاد پیشبینیهای دقیقتر است.
آیا می توان از مدل برای ایجاد اطلاعات قبل از انجام پیش بینی با استفاده از مفهومی مشابه استفاده کرد؟ این چیزی است که لیو و همکاران. 2022 در مقاله خود تلاش می کنند: اطلاعاتی را توسعه دهند تا به عنوان بخشی از درخواست مورد استفاده قرار گیرند. این به ویژه برای کارهایی مانند استدلال عامیانه چقدر مفید است؟
پست:
ورودی: اندازه یک سنگ به اندازه یک سنگریزه است.
دانش: سنگریزه یک طبقه از سنگ با اندازه ذرات 4 تا 64 میلی متر بر اساس مقیاس رسوب شناسی Udden-Wentworth است. سنگریزه ها به طور کلی بزرگتر از دانه ها (قطر 2 تا 4 میلی متر) و کوچکتر از سنگفرش (قطر 64 تا 256 میلی متر) در نظر گرفته می شوند.
ورودی: بخشی از گلف در تلاش است تا مجموع امتیاز بالاتری نسبت به سایرین کسب کند.
دانش:
خروجی:
هدف گلف این است که مجموعه ای از سوراخ ها را با کمترین تعداد ضربه بازی کند. یک دور گلف معمولاً از 18 سوراخ تشکیل شده است. هر سوراخ یک بار در دور در یک زمین گلف استاندارد بازی می شود. هر ضربه به عنوان یک امتیاز محاسبه می شود و تعداد کل ضربه ها برای تعیین برنده بازی استفاده می شود.
مهندس اعلان خودکار (APE)
مهندس اعلان خودکار (APE) چارچوبی برای ایجاد و انتخاب دستورالعمل خودکار است که توسط Zhou et پیشنهاد شده است. al., (2022). مسئله تولید دستورالعمل به عنوان یک مسئله بهینه سازی جعبه سیاه شامل سنتز زبان طبیعی و استفاده از LLM برای تولید و جستجوی راه حل های ممکن توصیف می شود.
مرحله اول شامل تولید نامزدهای دستورالعمل برای یک کار با استفاده از یک مدل زبان بزرگ (به عنوان مدل استنتاج) با نمایش خروجی است. جستجو با این راه حل های آینده هدایت خواهد شد. دستورالعمل ها با استفاده از یک مدل هدف انجام می شوند و بهترین دستورالعمل بر اساس امتیازات ارزیابی محاسبه شده انتخاب می شود.
همچنین مهندسی اعلان اولیه.
این مقاله به شما کمک می کند تا در مورد مهندسی سریع پیشرفته بیاموزید. ما اطمینان داریم که برای شما مفید بوده است. لطفاً نظرات و بازخورد خود را در بخش نظرات زیر به اشتراک بگذارید.