LaWGPT: ابزار هوش مصنوعی جدید برای حرفه حقوقی
LawGPT یک مدل زبان بزرگ (LLM) است که برای بخش حقوقی تنظیم شده است. این بدان معناست که در طیف وسیعی از ادبیات حقوقی آموزش دیده است و به آن امکان می دهد زبان حقوقی را بفهمد و تولید کند.
LaWGPT چیست؟
LaWGPT یک مدل زبان بزرگ (LLM) است که برای حوزه حقوقی بهخوبی تنظیم شده است. این کار Stability AI است، شرکتی که مدل های زبانی عظیمی را برای طیف گسترده ای از برنامه ها ایجاد و به کار می گیرد.
LaWGPT بر روی طیف گسترده ای از متن قانونی آموزش دیده است که به آن امکان می دهد زبان حقوقی را درک کرده و تولید کند. در حرفه حقوقی برای طیف وسیعی از فعالیت ها از جمله:
استفاده می شود
LawGPT را می توان برای وظایف مختلفی در حرفه حقوقی استفاده کرد، از جمله:
- تحقیقات حقوقی: LawGPT میتواند به شما کمک کند اطلاعات حقوقی ضروری را سریع و راحت به دست آورید.
- نوشتن حقوقی: LawGPT میتواند اسناد حقوقی از جمله قراردادها و دادخواستها را ایجاد کند.
- تحلیل حقوقی: LawGPT ممکن است برای بررسی استدلالهای حقوقی و یافتن نقصها استفاده شود.
- آموزش حقوقی: LawGPT می تواند برای کمک به دانشجویان حقوق در یادگیری قانون استفاده شود.
- رویه حقوقی: وکلا ممکن است از LawGPT برای ارائه خدمات بهتر به مشتریان خود استفاده کنند.
LawGPT هنوز در حال کار است، اما این پتانسیل را دارد که حرفه حقوقی را متحول کند. LawGPT می تواند وکلا را آزاد کند تا با خودکارسازی فرآیندهایی که اکنون توسط انسان انجام می شود، روی کارهای پیچیده تر و استراتژیک تمرکز کنند. علاوه بر این، LawGPT میتواند به وکلای دادگستری در ارائه خدمات بهتر به مشتریان خود با دسترسی به اطلاعات بیشتر و کمک به آنها در تجزیه و تحلیل مؤثرتر استدلالهای قانونی کمک کند.
قانون GPT یک ابزار جدید قدرتمند با پتانسیل تغییر قابل توجه حرفه حقوقی است. قانون GPT نقش مهم تری در نحوه اجرای قانون با توسعه آن خواهد داشت.
نصب
برای شروع سریع پروژه LaW GPT، این مراحل را برای تهیه کد و ایجاد محیط دنبال کنید:
1. دانلود کد:
کلون git [ایمیل محافظت شده]:pengxiao-song/LaWGPT.git
سی دی LaWGPT
2. ایجاد محیط:
conda create -n lawgpt python=3.10 -y
conda activate lawgpt
pip install -r requires.txt
3. رابط کاربری وب را راه اندازی کنید (اختیاری، برای تنظیم آسان پارامتر):
- اسکریپت راه اندازی سرویس را اجرا کنید:
اسکریپت های bash/webui.sh

4. استنتاج خط فرمان (اختیاری، آزمایش دسته ای پشتیبانی می شود)
- ابتدا، مجموعه نمونه آزمایشی را با اشاره به محتوای فایل بسازید؛
resources/example_infer_data.json
- دوم، اسکریپت استنتاج را اجرا کنید: . که در آن پارامتر مسیر مجموعه نمونه آزمایشی است و اگر خالی باشد یا مسیر اشتباه باشد، در حالت تعاملی اجرا میشود.
bash scripts/infer.sh
--infer_data_path
ساختار فهرست راهنمای پروژه LaWGPT
LaWGPT
├── دارایی # منابع ثابت
├── منابع # منابع پروژه
├── مدل های # مدل های پایه و وزنه های لورا
│ ├── base_models
│ └── lora_weights
خروجیهای ├── # خروجیهای دستورالعمل با تنظیم دقیق
├── داده # داده های تجربی
├── اسکریپت # دایرکتوری اسکریپت
│ ├── finetune.sh # اسکریپت تنظیم دقیق دستورالعمل
│ └── webui.sh # اسکریپت راه اندازی سرویس
الگوهای ├── # الگوهای اعلان
├── ابزار # جعبه ابزار
├── Utils
├── train_clm.py # آموزش ثانویه
├── finetune.py # دستورالعمل تنظیم دقیق
├── webui.py # راه اندازی سرویس
├── README.md
└── الزامات.txt
در اینجا توضیح مختصری از فهرستها و فایلهای اصلی آمده است:
داراییها
: این فهرست شامل منابع استاتیک پروژه است.منابع
: حاوی منابع خاص پروژه است.models
: این فهرست شامل مدلهای پایه و وزنهای Lora است.خروجیها
: وزنهای خروجی را از دستورالعملهای تنظیم دقیق ذخیره میکند.داده
: دادههای آزمایشی در این فهرست ذخیره میشوند.اسکریپتها
: حاوی اسکریپتهای مختلفی است، از جملهfinetune.sh
برای تنظیم دقیق دستورالعمل وwebui.sh
برای راهاندازی سرویس..الگوها
: الگوهای درخواستی در اینجا ذخیره می شوند.ابزار
: جعبه ابزار مورد نیاز برای پروژه در این فهرست قرار دارند.utils
: توابع یا ماژول های ابزار را می توانید در اینجا پیدا کنید.train_clm.py
: این اسکریپت برای آموزش ثانویه استفاده می شود.finetune.py
: برای دستورالعملهای تنظیم دقیق استفاده میشود.webui.py
: این اسکریپت برای راه اندازی سرویس استفاده می شود.README.md
: یک فایل علامت گذاری حاوی اطلاعات مربوط به پروژه.requirements.txt
: فایلی که بستههای پایتون مورد نیاز پروژه را فهرست میکند.
ساخت داده
این پروژه بر اساس مجموعه دادههایی مانند دادههای اسناد حقوقی و دادههای بررسی قضایی منتشر شده توسط شبکه اسناد قضاوت چین است. برای اطلاعات بیشتر، لطفاً خلاصه دادههای حقوقی چین را ببینید.
- تولید داده اولیه: با استفاده از Stanford_alpaca و خودآموز، تولید دادههای پرسش و پاسخ مکالمه .
- تولید داده مبتنی بر دانش: با استفاده از تکنیک خودآموزی مبتنی بر دانش، دادهها را بر اساس دانش ساختار یافته حقوقی چین تولید کنید.
- ChatGPT را برای پاک کردن داده ها و کمک به ایجاد مجموعه داده های با کیفیت بالا معرفی کنید.
آموزش مدل
فرایند آموزش مدل های سری Law GPT به دو مرحله تقسیم می شود:
- مرحله 1: واژگان حقوقی را گسترش دهید و چینی-LLaMA را برای ابزارهای حقوقی در مقیاس بزرگ و دادههای کدکس آماده کنید.
- مرحله دوم: یک مجموعه پرسش و پاسخ مکالمه حقوقی ایجاد کنید، سپس دستورالعمل ها را بر اساس مدل از پیش آموزش دیده تنظیم کنید.
فرایند آموزش متوسطه
- به ساخت مجموعه داده آموزشی ثانویه مراجعه کنید
resources/example_instruction_train.json
scripts/train_clm.sh
را اجرا کنید
دستورالعمل ها مراحل را به دقت تنظیم کنید.
- به ایجاد یک دستورالعمل تنظیم دقیق مجموعه داده مراجعه کنید
resources/example_instruction_tune.json
scripts/finetune.sh
را اجرا کنید
محدودیتها
با توجه به محدودیتهای منابع محاسباتی، مقیاس داده و سایر عوامل، قانون GPT در این مرحله محدودیتهای زیادی دارد:
- حافظه مدل و مهارت های زبانی به دلیل منابع داده محدود و ظرفیت مدل محدود است. در نتیجه، هنگامی که با آزمون های دانش واقعی ارائه می شود، ممکن است نتایج نادرستی به دست آید.
- مدلهای این سری فقط یک همسویی اساسی با هدف انسانی دارند. در نتیجه، اطلاعات و محتوای بالقوه خطرناکی که به ترجیحات و ارزشهای انسانی پایبند نیستند، ممکن است تولید شوند.
- مشکلاتی در زمینه خودآگاهی وجود دارد و درک چینی ممکن است بهبود یابد.
همچنین بخوانید: Flowise: A Drag-and-Drop UI for Building LLM Flows
این مقاله برای کمک به یادگیری LaWGPT است. ما اطمینان داریم که برای شما مفید بوده است. لطفاً نظرات و انتقادات خود را در بخش نظرات زیر به اشتراک بگذارید.
ادامه خواندن