breadcrumbs_delimiter هوش مصنوعی breadcrumbs_delimiter راهنمای مهندسی سریع پیشرفته
هوش مصنوعی

راهنمای مهندسی سریع پیشرفته

اردیبهشت 13, 1402 0011

مهندسی سریع یک عنصر ضروری در توسعه، آموزش و استفاده از مدل‌های زبان بزرگ (LLM) است و شامل طراحی ماهرانه دستورات ورودی برای بهبود عملکرد و دقت مدل است.

اعلام پیشرفته

در این مرحله باید واضح باشد که به تقویت اعلان‌ها برای دستیابی به نتایج بهتر در فعالیت‌های مختلف کمک می‌کند. این تمام هدف مهندسی سریع سریع است.

درخواست صفر شات

LLM هایی که بر روی حجم عظیمی از داده ها آموزش دیده اند و برای اطاعت از دستورالعمل ها تنظیم شده اند، اکنون می توانند کارهای خود را در پرواز انجام دهند. در قسمت آخر، چند نمونه صفر شات را امتحان کردیم. یکی از مثال هایی که استفاده کردیم به شرح زیر بود:

پست:

متن را به خنثی، منفی یا مثبت طبقه بندی کنید.

متن: فکر می کنم تعطیلات خوب است.
احساس:

خروجی:

خنثی

ما هیچ نمونه‌ای برای مدل در اعلان بالا ارائه نکردیم، که قابلیت‌های صفر شات مدل را نشان می‌دهد. هنگامی که صفر شات با شکست مواجه می شود، بهتر است دموها یا نمونه هایی را در اعلان قرار دهید. روشی که به عنوان دستور چند شات شناخته می شود در زیر بیشتر مورد بحث قرار گرفته است.

پیشنهاد چند شات

در حالی که مدل‌های بزرگ‌زبان از قبل قابلیت‌های شات صفر قابل‌توجهی دارند، در صورت استفاده از تنظیمات شات صفر، در انجام کارهای پیچیده‌تر کوتاهی می‌کنند. برای بهبود این موضوع، از چند شات به عنوان یک استراتژی برای فعال کردن یادگیری درون متنی استفاده می‌کنیم، که در آن نسخه‌های نمایشی را در اعلان ارائه می‌کنیم تا مدل را به عملکرد بالاتر هدایت کنیم. مثال‌ها به عنوان شرطی برای موارد بعدی که می‌خواهیم مدل پاسخ دهد، عمل می‌کنند.

پست:

"whatpu" حیوانی کوچک و پشمالو بومی تانزانیا است. مثالی از جمله ای که استفاده می کند
کلمه whatpu است:
ما در آفریقا سفر می‌کردیم و این عصاره‌های بسیار زیبا را دیدیم.
انجام "فردودل" به معنای بالا و پایین پریدن بسیار سریع است. مثالی از جمله ای که استفاده می کند
کلمه فردودل این است:

خروجی:

وقتی بازی را بردیم، همه شروع کردیم به جشن گرفتن.

ما می‌توانیم مشاهده کنیم که مدل با ارائه تنها یک مثال (یعنی 1-shot) به نحوی نحوه انجام کار را یاد گرفته است. برای کارهای دشوارتر، می‌توانیم با افزایش نمایش‌ها (مانند 3 تیر، 5 تیر، 10 تیر، و غیره) آزمایش کنیم.

تغییر زنجیره ای

تشویق زنجیره‌ای فکر (CoT)، معرفی شده توسط وی و همکاران. (2022)، مهارت های استدلالی پیشرفته را از طریق مراحل استدلال میانی ارائه می دهد. می‌توان آن را همراه با چند شات برای بهبود عملکرد در فعالیت‌های دشوارتر که قبل از پاسخ دادن نیاز به تفکر دارند، استفاده کرد.

پست:

اعداد فرد در این گروه به عدد زوج می رسند: 4، 8، 9، 15، 12، 2، 1.
پاسخ: با جمع کردن تمام اعداد فرد (9، 15، 1) عدد 25 به دست می آید. پاسخ غلط است.

اعداد فرد در این گروه به یک عدد زوج می رسند: 15، 32، 5، 13، 82، 7، 1.
پاسخ:

خروجی:

با جمع کردن همه اعداد فرد (15، 5، 13، 7، 1) 41 به دست می آید. پاسخ نادرست است. .

به خاطر داشته باشید که نویسندگان پیشنهاد می‌کنند که این یک ظرفیت اضطراری است که زمانی ایجاد می‌شود که از مدل‌های زبانی به اندازه کافی بزرگ استفاده شود.

Zero-Shot CoT

یکی از ایده‌های اخیری که اخیراً مطرح شد، ایده CoT بدون شاتاست. > (Kojima et al. 2022) که اساساً شامل افزودن «بیایید قدم به قدم فکر کنیم» به درخواست اصلی است. بیایید یک مشکل ساده را امتحان کنیم و ببینیم مدل چگونه عمل می کند:

پست:

رفتم بازار و 10 تا سیب خریدم. 2 تا سیب به همسایه و 2 تا به تعمیرکار دادم. سپس رفتم و 5 سیب دیگر خریدم و 1 سیب را خوردم. با چند سیب ماندم؟

خروجی:

11 سیب

قابل توجه است که این دستور ساده در این کار موثر است. این به ویژه در مواردی مفید است که مثال های زیادی برای استفاده در مهندسی سریع ندارید.

ثبات خود

خود سازگاری یکی از استراتژی های پیشرفته تر برای مهندسی سریع است. خود سازگاری، همانطور که توسط وانگ و همکاران پیشنهاد شده است. (2022)، در نظر دارد “rرمزگشایی حریصانه ساده و بی تکلف مورد استفاده در تحریک زنجیره ای از فکر را جایگزین کند.” هدف این است که چندین مسیر استدلال مختلف را با استفاده از CoT چند شات نمونه برداری کنیم و سپس از نسل ها برای انتخاب سازگارترین راه حل استفاده کنیم. این کار باعث بهبود عملکرد درخواست CoT در آزمون‌های استدلالی حسابی و عقلانی می‌شود.

پست:

سؤال: اولیویا 23 دلار دارد. او پنج شیرینی به قیمت هر کدام 3 دلار خرید. چقدر پول برای او باقی مانده است؟
ج: او 5 عدد نان شیرینی به قیمت 3 دلار خرید. این به این معنی است که او 5 هزینه کرده است

س: وقتی 6 ساله بودم خواهرم نصف سن من بود. الان من 70 سالمه خواهرم چند سالشه؟
پاسخ:

خروجی:

اگر شما 6 سال داشتید و خواهرتان نصف سن شما بود، در آن زمان 3 ساله بود. اختلاف سنی بین شما و خواهرتان همیشه 3 سال خواهد بود. از آنجایی که شما اکنون 70 ساله هستید، خواهر شما باید 70 - 3 = 67 ساله باشد. پاسخ 67 است.

اعلام دانش تولید شده

LLMها همیشه در حال بهبود هستند، و یک استراتژی محبوب، توانایی افزودن دانش یا اطلاعات به مدل برای کمک به ایجاد پیش‌بینی‌های دقیق‌تر است.

آیا می توان از مدل برای ایجاد اطلاعات قبل از انجام پیش بینی با استفاده از مفهومی مشابه استفاده کرد؟ این چیزی است که لیو و همکاران. 2022 در مقاله خود تلاش می کنند: اطلاعاتی را توسعه دهند تا به عنوان بخشی از درخواست مورد استفاده قرار گیرند. این به ویژه برای کارهایی مانند استدلال عامیانه چقدر مفید است؟

پست:

ورودی: اندازه یک سنگ به اندازه یک سنگریزه است.
دانش: سنگریزه یک طبقه از سنگ با اندازه ذرات 4 تا 64 میلی متر بر اساس مقیاس رسوب شناسی Udden-Wentworth است. سنگریزه ها به طور کلی بزرگتر از دانه ها (قطر 2 تا 4 میلی متر) و کوچکتر از سنگفرش (قطر 64 تا 256 میلی متر) در نظر گرفته می شوند.

ورودی: بخشی از گلف در تلاش است تا مجموع امتیاز بالاتری نسبت به سایرین کسب کند.
دانش:

خروجی:

هدف گلف این است که مجموعه ای از سوراخ ها را با کمترین تعداد ضربه بازی کند. یک دور گلف معمولاً از 18 سوراخ تشکیل شده است. هر سوراخ یک بار در دور در یک زمین گلف استاندارد بازی می شود. هر ضربه به عنوان یک امتیاز محاسبه می شود و تعداد کل ضربه ها برای تعیین برنده بازی استفاده می شود.

مهندس اعلان خودکار (APE)

Prompt

مهندس اعلان خودکار (APE) چارچوبی برای ایجاد و انتخاب دستورالعمل خودکار است که توسط Zhou et پیشنهاد شده است. al., (2022). مسئله تولید دستورالعمل به عنوان یک مسئله بهینه سازی جعبه سیاه شامل سنتز زبان طبیعی و استفاده از LLM برای تولید و جستجوی راه حل های ممکن توصیف می شود.

مرحله اول شامل تولید نامزدهای دستورالعمل برای یک کار با استفاده از یک مدل زبان بزرگ (به عنوان مدل استنتاج) با نمایش خروجی است. جستجو با این راه حل های آینده هدایت خواهد شد. دستورالعمل ها با استفاده از یک مدل هدف انجام می شوند و بهترین دستورالعمل بر اساس امتیازات ارزیابی محاسبه شده انتخاب می شود.

همچنین مهندسی اعلان اولیه.

این مقاله به شما کمک می کند تا در مورد مهندسی سریع پیشرفته بیاموزید. ما اطمینان داریم که برای شما مفید بوده است. لطفاً نظرات و بازخورد خود را در بخش نظرات زیر به اشتراک بگذارید.

به این نوشته امتیاز بدهید!

افراد نیوز

افراد نیوز

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

  • ×