راهنمای مهندسی مقدماتی اولیه
مهندسی سریع یک عنصر ضروری در توسعه، آموزش و استفاده از مدلهای زبان بزرگ (LLM) است و شامل طراحی ماهرانه دستورات ورودی برای بهبود عملکرد و دقت مدل است.
مهندسی سریع چیست؟
مهندسی سریع، تمرین توسعه و اصلاح ورودی مدلهای هوش مصنوعی مولد مانند ChatGPT، GPT-3، DALL-E، انتشار پایدار، Midjourney و دیگران. هدف نهایی مهندسی سریع بهبود عملکرد مدل زبان با ارائه ورودی های ساختار یافته، مختصر و متناسب با شغل یا برنامه ای است که مدل برای آن طراحی شده است.
مهندسی سریع اغلب شامل انتخاب دقیق کلمات و عبارات موجود در اعلان و همچنین ساختار کلی و سازماندهی ورودی برای دستیابی به این هدف است. این رویکرد سیستماتیک برای مهندسی سریع ضروری است، زیرا حتی اصلاحات کوچک در دستور سریع می تواند تأثیر عمده ای بر نتیجه داشته باشد.
مهندسی سریع مؤثر به درک عمیقی از قابلیتها و محدودیتهای مدلهای زبان بزرگ (LLM) و همچنین توانایی ساخت اعلانهای ورودی جذاب نیاز دارد. علاوه بر این، مهندسی سریع اغلب شامل فراهم کردن زمینه برای LLM است تا بتواند پاسخهای منسجمی را ایجاد کند، مانند استفاده از اسناد خارجی یا دادههای اختصاصی یا چارچوببندی ورودی بهگونهای که به مدل کمک میکند تا زمینه را درک کند.
همچنین مورد استفاده مهندسی سریع و مفاهیم کلیدی.
اعلام اولیه
خلاصه متن
یکی از وظایف استاندارد در تولید زبان طبیعی، خلاصه سازی متن است. خلاصه سازی متن می تواند شامل طعم ها و دامنه های مختلف باشد. یکی از امیدوارکننده ترین کاربردهای مدل های زبان، توانایی خلاصه کردن مقالات و مفاهیم به خلاصه های سریع و آسان برای خواندن است. بیایید یک کار خلاصه سازی اولیه را با استفاده از دستورات امتحان کنیم.
فرض کنید من علاقه مند به یادگیری در مورد هوش مصنوعی هستم، می توانم دستوری مانند این را امتحان کنم:
هوش مصنوعی را توضیح دهید.
خروجی:
هوش مصنوعی (AI) به توسعه سیستمهای رایانهای اشاره دارد که میتوانند وظایفی را انجام دهند که معمولاً به هوش انسانی نیاز دارند. انجام دهد. این وظایف ممکن است شامل تشخیص گفتار یا تصاویر، تصمیم گیری، ترجمه زبان و حتی رانندگی وسایل نقلیه باشد. دو رویکرد اصلی برای توسعه هوش مصنوعی وجود دارد: مبتنی بر قانون و یادگیری ماشین. در هوش مصنوعی مبتنی بر قانون، برنامه نویسان به صورت دستی قوانین و منطقی را رمزگذاری می کنند که سیستم از آنها برای تصمیم گیری استفاده می کند. در یادگیری ماشینی، سیستم از دادهها بدون برنامهریزی صریح، با استفاده از مدلها و الگوریتمهای آماری برای شناسایی الگوها و روابط در دادهها یاد میگیرد.
من از آن در اینجا استفاده کردم تا به مدل اطلاع دهم که مرحله بعدی مورد انتظار است. در این مثال مشخص نیست که چگونه این کار در مقابل استفاده نکردن از آن مفید است، اما ما آن را برای نمونههای دیگر رها میکنیم. فرض کنید این اطلاعات بیش از حد است و میخواهید بیشتر آن را خلاصه کنید. میتوانیم به مدل بگوییم که در یک عبارت خلاصه کند:
پست:
هوش مصنوعی (AI) به توسعه سیستمهای رایانهای اشاره دارد که میتوانند وظایفی را انجام دهند که معمولاً به هوش انسانی نیاز دارند. انجام دهد. این وظایف ممکن است شامل تشخیص گفتار یا تصاویر، تصمیم گیری، ترجمه زبان و حتی رانندگی وسایل نقلیه باشد. دو رویکرد اصلی برای توسعه هوش مصنوعی وجود دارد: مبتنی بر قانون و یادگیری ماشین. در هوش مصنوعی مبتنی بر قانون، برنامه نویسان به صورت دستی قوانین و منطقی را رمزگذاری می کنند که سیستم از آنها برای تصمیم گیری استفاده می کند. در یادگیری ماشینی، سیستم از دادهها بدون برنامهریزی صریح، با استفاده از مدلها و الگوریتمهای آماری برای شناسایی الگوها و روابط در دادهها، یاد میگیرد.
موارد فوق را در یک جمله توضیح دهید:
خروجی:
هوش مصنوعی شامل ایجاد سیستمهای رایانهای است که میتواند وظایفی شبیه به انسان را انجام دهد، با دو رویکرد اصلی برنامهنویسی مبتنی بر قانون. و یادگیری ماشینی.
بدون تمرکز بیش از حد بر روی دقت خروجی بالا، که در یک راهنمای بعدی به آن خواهیم پرداخت، مدل سعی کرد پاراگراف را در یک عبارت خلاصه کند. شما می توانید با دستورالعمل ها خلاق شوید، اما این برای فصل دیگری است. در اینجا مکث کنید و آزمایش کنید تا ببینید آیا نتایج بهتری به دست میآورید.
در حالی که مدلهای زبان برای انجام تولید زبان طبیعی و وظایف مرتبط آموزش میبینند، در طبقهبندی و انواع دیگر وظایف پردازش زبان طبیعی (NLP) نیز مهارت دارند.
در اینجا مثالی از درخواستی است که دادهها را از یک متن میگیرد.
پست:
اظهارات و قدردانیهای مؤلف در مقالههای پژوهشی باید بهطور واضح و مشخص بیان کند که آیا و تا چه حد نویسندگان از فناوریهای هوش مصنوعی مانند ChatGPT در تهیه نسخههای خطی و تجزیه و تحلیل خود استفاده کردند. آنها همچنین باید نشان دهند که کدام LLM استفاده شده است. این امر به ویراستاران و داوران هشدار میدهد تا نسخههای خطی را با دقت بیشتری از نظر سوگیریها، نادرستیها و اعتباردهی نامناسب منبع بررسی کنند. به همین ترتیب، مجلات علمی باید در مورد استفاده خود از LLM شفاف باشند، به عنوان مثال هنگام انتخاب نسخه های خطی ارسالی.
محصول بزرگ مبتنی بر مدل زبان که در پاراگراف بالا ذکر شده است را ذکر کنید:
خروجی:
محصول بزرگ مبتنی بر مدل زبان که در پاراگراف بالا ذکر شد ChatGPT است.
راههای دیگری برای تقویت یافتههای بالا وجود دارد، اما آنها در حال حاضر بسیار ارزشمند هستند.
اکنون باید واضح باشد که میتوانید از مدل بخواهید کارهای مختلف را به سادگی با گفتن اینکه چه کاری انجام دهد، انجام دهد. این یک قابلیت قدرتمند است که توسعه دهندگان محصولات هوش مصنوعی در حال حاضر از آن برای ایجاد محصولات و تجربیات قدرتمند استفاده می کنند.
پاسخ به سوال
بهبود ساختار سریع یکی از بهترین راهبردها برای تشویق مدل به پاسخگویی به پاسخ های خاص است. همانطور که قبلاً بحث شد، یک اعلان میتواند دستورالعملها، زمینه، نشانههای ورودی و خروجی را برای ارائه نتایج بهتر ادغام کند. در حالی که این مؤلفه ها مورد نیاز نیستند، اما تمرین خوبی هستند زیرا هرچه آموزش دقیق تر باشد، نتایج بهتری خواهد داشت. در اینجا نمونهای از نحوه ظاهر شدن این مورد پس از یک سؤال سازمانیافتهتر آمده است.
پست:
بر اساس زمینه زیر به سؤال پاسخ دهید. پاسخ را کوتاه نگه دارید. اگر در مورد پاسخ مطمئن نیستید، به «مطمئن در مورد پاسخ» پاسخ دهید.
زمینه: تپلیزوماب ریشه های خود را به یک شرکت دارویی در نیوجرسی به نام Ortho Pharmaceutical باز می گرداند. در آنجا، دانشمندان نسخه اولیه آنتی بادی به نام OKT3 را تولید کردند. این مولکول که در اصل از موش ها تهیه شده بود، می توانست به سطح سلول های T متصل شود و پتانسیل کشتن سلولی آنها را محدود کند. در سال 1986، برای کمک به جلوگیری از رد عضو پس از پیوند کلیه تایید شد و آن را به اولین آنتی بادی درمانی مجاز برای استفاده انسانی تبدیل کرد.
سوال: OKT3 در اصل از چه منبعی بود؟
پاسخ:
خروجی:
موش.
طبقه بندی متن
تا کنون، دستورالعملهای سادهای را برای تکمیل یک کار دنبال کردهایم. به عنوان یک مهندس سریع، باید توانایی خود را برای ارائه دستورالعمل های بهتر بهبود بخشید. اما صبر کنید، چیزهای بیشتری وجود دارد! همچنین متوجه خواهید شد که برای موارد استفاده دشوارتر، ارائه دستورالعمل ها کافی نیست. اینجاست که باید بیشتر در مورد زمینه و عناصر مختلف سریع فکر کنید. داده های ورودی و مثال ها دو جنبه دیگر هستند که می توانید ارائه دهید.
اجازه دهید سعی کنیم این را با استفاده از یک مثال دسته بندی متن توضیح دهیم.
پست:
متن را به خنثی، منفی یا مثبت طبقه بندی کنید.
متن: فکر کنم غذا درست بود.
احساس:
خروجی:
خنثی
مکالمه
یکی از جالبترین کارهایی که میتوانید با استفاده از مهندسی سریع انجام دهید، آموزش سیستم LLM در مورد نحوه عمل، هدف و هویت آن است. این برای توسعه سیستمهای مکالمه مانند رباتهای گفتگوی مراقبت از مشتری بسیار مفید است.
به عنوان مثال، سیستم مکالمه ای را تصور کنید که می تواند پاسخ های فنی و علمی بیشتری را به سوالات ارائه دهد. توجه داشته باشید که چگونه مستقیماً به آن می گوییم چگونه از طریق دستورالعمل عمل کند. ترغیب نقش یک اصطلاح دیگر برای این است.
پست:
مکالمه زیر با یک دستیار تحقیقاتی هوش مصنوعی است. پاسخهای دستیار باید حتی برای دانشآموزان دبستان به راحتی قابل درک باشد.
انسان: سلام، شما کی هستید؟
AI: درود! من دستیار تحقیق هوش مصنوعی هستم. امروز چطور می توانم به شما کمک کنم؟
انسان: می توانید در مورد ایجاد سیاهچاله ها به من بگویید؟
هوش مصنوعی:
خروجی:
مطمئنا! سیاهچاله ها زمانی ایجاد می شوند که سوخت یک ستاره بسیار پرجرم تمام می شود و در خود فرو می ریزد. گرانش ستاره آنقدر قوی است که هیچ چیز، حتی نور، نمی تواند از کشش آن فرار کند. این یک نقطه در فضا-زمان با نیروی گرانشی شدید به نام سیاهچاله ایجاد می کند.
تولید کد
ایجاد کد یکی از برنامههایی است که LLMها در آن عملکرد خوبی دارند. Copilot یک مثال عالی است. با اعلان های هوشمندانه، می توانید طیف گسترده ای از وظایف تولید کد را انجام دهید. موارد زیر را در نظر بگیرید.
بیایید با یک برنامه ابتدایی شروع کنیم که به کاربر خوشامد می گوید.
پست:
/*
از کاربر نام خود را بپرسید و بگویید "سلام"
*/
خروجی:
let name = prompt("نام شما چیست؟");
console.log(`سلام، ${name}!`);
استدلال
یکی از چالش برانگیزترین چیزها برای LLM امروزه ممکن است به سطحی از تفکر نیاز داشته باشد. به دلیل انواع برنامه های پیچیده ای که ممکن است از LLM به وجود بیاید، استدلال یکی از زمینه هایی است که بیشتر به آن علاقه دارم.
در کارهایی که نیاز به توانایی های ریاضی دارند پیشرفت هایی حاصل شده است. با این حال، مهم است که توجه داشته باشیم که LLM های فعلی با وظایف استدلالی دست و پنجه نرم می کنند، که نیاز به تکنیک های مهندسی سریع حتی پیشرفته تری دارد. این استراتژی های پیشرفته در کتاب راهنمای زیر پوشش داده خواهد شد. در حال حاضر، چند مثال اساسی را برای نشان دادن توانایی حسابی بررسی خواهیم کرد.
پست:
اعداد فرد در این گروه به عدد زوج می رسند: 15، 32، 5، 13، 82، 7، 1.
با تقسیم کردن مشکل به مراحل حل کنید. ابتدا اعداد فرد را شناسایی کنید، آنها را جمع کنید و زوج یا فرد بودن نتیجه را مشخص کنید.
خروجی:
اعداد فرد: 15، 5، 13، 7، 1
مجموع 41
41 یک عدد فرد است.
این مقاله به شما کمک می کند تا در مورد مهندسی سریع بیاموزید. ما اطمینان داریم که برای شما مفید بوده است. لطفاً نظرات و انتقادات خود را در بخش نظرات زیر به اشتراک بگذارید.