نحوه اجرای Stable Diffusion به صورت محلی و ایجاد تصاویر خیره کننده از متن
تولید تصویر یک کار جذاب و چالش برانگیز در یادگیری ماشینی است که کاربردهای بالقوه زیادی مانند هنر، سرگرمی، آموزش و افزایش داده دارد. با این حال، اکثر روشهای موجود برای تولید تصویر دارای معایبی هستند، مانند آموزش ناپایدار، فروپاشی حالت، سرعت سنتز پایین، یا وفاداری کم.
در این مقاله، ما به شما نشان خواهیم داد که چگونه پخش پایدار را به صورت محلی، یک نسل تصویر از مدلهای انتشار، به صورت محلی بر روی رایانه شخصی خود نصب و اجرا کنید.
نحوه نصب و اجرای stable diffusion به صورت محلی در رایانه شما
Stable Diffusion یک تولید کننده تصویر قدرتمند هوش مصنوعی است که می تواند به صورت محلی روی رایانه شما اجرا شود. در این آموزش، ما مراحل مورد نیاز برای نصب Stable Diffusion در رایانه شما را بررسی خواهیم کرد.
پیش نیازها
- یک سیستم Linux یا MacOS با Python 3.8 یا بالاتر
- یک GPU با پشتیبانی از CUDA و حداقل 16 گیگابایت حافظه
برای نصب Stable Diffusion، این مراحل را دنبال کنید:
پایتون به روز شده را نصب کنید
بیایید با دیدن اینکه آیا پایتون قبلاً روی رایانه شخصی شما نصب شده است یا نه شروع می کنیم. برای انجام این کار، یک ترمینال راه اندازی کنید و دستور زیر را وارد کنید:
python --version
اگر نسخه پایتون برگردانده شد، به مرحله بعد ادامه دهید. در غیر این صورت پایتون را با دستورات زیر نصب کنید:
بهروزرسانی sudo apt-get
sudo apt-get نصب python3.8
Miniconda را نصب کنید
در مرحله بعد، باید مطمئن شویم conda مدیر بسته/محیط نصب شده است. conda --version
را در ترمینال وارد کنید. اگر نسخه کوندا برگردانده شد، به مرحله بعدی بروید. در غیر این صورت، به وب سایت conda بروید و نصب کننده Miniconda مناسب برای نسخه پایتون و سیستم عامل خود را دانلود و اجرا کنید.
برای Python3.8، می توانید نصب کننده را با دستورات زیر دانلود و اجرا کنید:
wget https://repo.anaconda.com/miniconda/ Miniconda3-py38_4.12.0-Linux-x86_64.sh
bash Miniconda3-py38_4.12.0-Linux-x86_64.sh
برای ادامه مجوز، Enter را فشار دهید، سپس در صورت درخواست ادامه، “بله” را تایپ کنید. در مرحله بعد، روی Enter کلیک کنید تا محل نصب را تأیید کنید، و سپس وقتی از شما خواسته شد تا Miniconda را مجددا راه اندازی کنید، “yes” را تایپ کنید.
مخزن stable-diffusion را کلون کنید و دایرکتوری را وارد کنید
پس از کلون سازی مخزن، باید وابستگی های انتشار پایدار را نصب کنیم. برای انجام این کار دستور زیر را در ترمینال خود اجرا کنید:
git clone https://github.com/CompVis/stable -diffusion.git
سی دی stable-diffusion
با این کار تمام وابستگیهای پایتون مورد نیاز برای اجرای Stable Diffusion به صورت محلی نصب میشود. اگر git ندارید، sudo apt install git
را اجرا کنید تا آن را دریافت کنید. قبل از شبیه سازی مخزن، مجوز انتشار پایدار را بخوانید و بپذیرید.
محیط کوندا طراحی کنید
اکنون که مخزن Stable Diffusion را شبیه سازی کردیم، باید یک محیط Conda راه اندازی کنیم تا همه بسته های مورد نیاز برای اجرای Stable Diffusion را در خود جای دهد.
برای انجام این کار از دستورات زیر استفاده خواهیم کرد:
conda env create -f environment.yaml
conda activate ldm
اولین دستور یک محیط جدید Conda به نام ldm ایجاد می کند. این محیط توسط خط فرمان دوم فعال می شود.
هنگامی که محیط فعال شد، میتوانیم وابستگیهای انتشار پایدار را نصب کنیم.
دانلود Stable Diffusion
برای دانلود Stable Diffusion checkpoint نسخه 1.4، میتوانید دستورالعملهای زیر را دنبال کنید:
مطمئن شوید که مجوز انتشار پایدار را خوانده اید و پذیرفته اید.
وزن ها را با دستور زیر دانلود کنید:
curl https://f004.backblazeb2.com/file/ aai-blog-files/sd-v1-4.ckpt > sd-v1-4.ckpt
چند نسخه از Stable Diffusion آزاد شده است. اعداد نسخه های بالاتر بر روی داده های بیشتر آموزش داده شده اند و در نتیجه عملکرد بهتری نسبت به نسخه های پایین تر دارند.
اکنون شما آماده هستید تا انتشار پایدار را به صورت محلی اجرا کنید و تصاویر را از نویز یا متن تولید کنید.
تولید تصویر با انتشار پایدار
یک ترمینال را باز کنید و به فهرست انتشار پایدار بروید. با اجرای دستور conda activate ldm
مطمئن شوید که در محیط مناسب هستید.
برای تولید یک تصویر، دستور زیر را اجرا کنید:
اسکریپتهای پایتون/txt2img.py --پست "توافق شما" -HERE" --plms --ckpt sd-v1-4.ckpt --skip_grid --n_samples 1
حداقل اندازه تصویر 256×256 است. این یک دایرکتوری ایجاد می کند و تصاویر تولید شده را به عنوان فایل های PNG ذخیره می کند. جایی که YOU-PROMPT-HERE با عنوانی که میخواهید برای آن تصویر ایجاد کنید (بدون علامت نقل قول) جایگزین میشود. اجرای این دستور با ورودی “تصویر واقعی از یک پنگوئن که سوار بر فضا می شود” به تصویر زیر منجر می شود:
پیشنهاد: یک تصویر واقعی از یک پنگوئن که سوار بر Scatting در فضا است
پیشنهاد: تصویر موج بخار فوتورالیستی از مردانی که سوار بر اسنوبرد در فضا هستند


همانطور که می بینید، تصاویر تولید شده واقع گرایانه و متنوع هستند و طیف وسیعی از مناظر و اشیاء طبیعی را پوشش می دهند.
همچنین میتوانید وبلاگ ما را بررسی کنید، نحوه استفاده از Stable Diffusion XL 0.9 در Clipdrop برای ایجاد تصاویر خیره کننده برای نکات و آموزش های بیشتر در مورد نحوه ایجاد تصویر با استفاده از انتشار پایدار.
سؤالات متداول
چگونه می توانم تصاویری از سبک ها یا دامنه های مختلف با انتشار پایدار تولید کنم؟
برای تولید تصاویر سبکها یا دامنههای مختلف با انتشار پایدار، میتوانید موارد زیر را امتحان کنید: از یک نقطه بازرسی مدل انتشار متفاوت استفاده کنید یا مدل انتشار خود را بر روی مجموعه دادههای متفاوتی از تصاویر که با سبک یا دامنه مورد نظر شما مطابقت دارد، آموزش دهید.
چگونه می توانم تصاویر را از انواع ورودی های دیگر به غیر از متن با انتشار پایدار تولید کنم؟
برای تولید تصاویر از انواع ورودیهای دیگر به غیر از متن با انتشار پایدار، میتوانید موارد زیر را امتحان کنید: از یک مدل رمزگذار متفاوت استفاده کنید که میتواند نوع ورودی شما را در یک بردار با طول ثابت رمزگذاری کند، مانند یک رمزگذار تصویر برای تصویر به -ترجمه تصویر یا یک رمزگذار گفتار برای سنتز گفتار به تصویر.
نتیجه گیری
در این مقاله، مدلهای انتشار را معرفی کردهایم، یک رویکرد جدید برای تولید تصویر که میتواند تصاویری با کیفیت بالا از نویز خالص، بدون قید و شرط یا مشروط بر روی برخی ورودیها مانند متن تولید کند. ما همچنین به شما نشان دادهایم که چگونه پخش پایدار و تولید تصویر مدلهای انتشار را به صورت محلی روی رایانه شخصی خود نصب و اجرا کنید.
لطفاً نظرات و بازخورد خود را در بخش نظرات زیر به اشتراک بگذارید.