تسلط به تیونینگ مدل زبانی بزرگ - مبانی تا پیشرفته و استقرار ابری
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- استفاده از آداپتورهای LoRA و QLoRA برای تیونینگ BERT ،GPT ،Llama ،Mistral و DeepSeek با حداقل حافظه GPU
- اجرای گردش کارهای بهنیهسازی ترجیحات مستقیم RLHF برای همراستاسازی خروجیهای مدل با بازخورد انسانی
- انجام تیونینگ دستورالعمل تحت نظارت برای ساخت مجموعه دادههای دامنه و بروزرسانی وزنها به منظور بهبود دقت وظایف خاص
- فشردهسازی مدرسان بزرگ مدرس به دانشجویان از طریق تقطیر دانش و انتقال سیگنالهای ویژگی پنهان و اهداف نرم
پیشنیازهای دوره
- پایتون
- مبانی Generative AI
توضیحات دوره
با جامعترین دوره عملی موجود به طیف کامل تیونینگ مدل زبانی بزرگ مسلط شوید. این برنامه فشرده شما را از مفاهیم اساسی تا استقرار در سطح سازمانی هدایت میکند و تکنیکهای پیشرفته را در معماریها و پلتفرمهای ابری مختلف پوشش میدهد.
آنچه یاد خواهید گرفت:
متدولوژیهای پیشرفته تیونینگ:
- به LoRA (Low-Rank Adaptation) برای آموزش کارآمد از نظر پارامتر مسلط شوید که هزینههای رایانش را در عین حفظ عملکرد مدل کاهش میدهد.
- پیادهسازی QLoRA (Quantized LoRA) برای تیونینگ مصرف حافظه بهینه در محیطهای محدود از نظر منابع
- استقرار RLHF (یادگیری تقویتی) برای ایجاد سیستمهای هوش مصنوعی همراستا که ترجیحات انسان را دنبال میکنند.
- بهکارگیری DPO (بهینهسازی ترجیحات مستقیم) برای بهبود رفتار مدل بدون نیاز به پایپلاینهای پیچیده یادگیری تقویتی
- بهکارگیری تقطیر دانش برای انتقال دانش از یک مدل بزرگ به مدل کوچکتر
آموزش مدل با معماری چندگانه:
- تیونینگ BERT برای وظایف تخصصی درک و دستهبندی متن
- سفارشیسازی Mistral برای کاربردهای خاص حوزه نیازمند به عملکرد بالا
- تطبیق GPT برای سیستمهای تولید متن در هوش مصنوعی مکالمهای
- بهینهسازی مدلهای LLaMA برای اپلیکیشنهای حرفهای
- پیکربندی مدلهای Cohere برای گردش کارهای پردازش زبان طبیعی آمده تولید
- استقرار در Hugging Face Hub: تسلط به آپلود، نسخهبندی و اشتراکگذاری مدل با قابلیت ()push_to_hub برای توزیع یکنواخت مدل
تسلط به پلتفرم ابری سازمانی:
- Azure AI Foundry: ساخت، استقرار و مدیریت اپلیکیشنهای هوش مصنوعی سازمانی با محیطهای توسعه یکپارچه
- AWS Bedrock: پیادهسازی گردش کارهای تیونینگ مقیاسپذیر با S3 ،Lambda و API Gateway برای اپلیکیشنهای مبتنی بر هوش مصنوعی
- GCP Vertex AI: استفاده از رویکردهای تیونینگ کارآمد از نظر پارامتر و تیونینگ کامل با متدولوژیهای یادگیری تحت نظارت
نتایج کلیدی یادگیری
تخصص هوش مصنوعی خود را از طریق پروژههای عملی که سناریوهای سازمانی واقعی را شبیهسازی میکند، متحول کنید. آمادهسازی کامل مجموعه داده، از داده خام تا فرمتهای آموزش آماده تولید را تجربه کنید. به تکنیکهای بهینهسازی عملکرد، از جمله تیونینگ هایپرپارامتر، معیارهای ارزیابی مدل و استراتژیهای مدیریت هزینه در پلتفرمهای ابری مسلط شوید. پایپلاینهای استقرار end-to-end بسازید که از پروتوتایپ تا محیطهای تولید سازمانی مقیاسپذیر هستند.
سفر دوره
با اصول معماری ترنسفورمر شروع کنید و پس از آن به سمت متدولوژیهای آموزش کارآمد از نظر پارامتر پیش بروید. هر تکنیک از طریق جلسات کدنویسی عملی با مجموعه دادههای استاندارد صنعت و موارد استفاده واقعی تقویت میشود. یکپارچهسازی کامل پلتفرم ابری در اکوسیستمهای AWS ،GCP و آژور را تجربه کنید و استراتژیهای بهینهسازی خاص هر پلتفرم و تکنیکهای مهاجرت بین پلتفرم را یاد بگیرید.
چه کسانی باید در این دوره شرکت کنند؟
این دوره برای متخصصان هوش مصنوعی در سطح متوسط تا پیشرفته، از جمله مهندسان یادگیری ماشین، دانشمندان داده، محققان هوش مصنوعی و توسعهدهندگان نرمافزار که به دنبال تخصص در سفارشیسازی مدل زبانی بزرگ هستند، طراحی شده است. دانش اولیه پایتون و آشنایی با مفاهیم یادگیری ماشین توصیه میشود.
این دوره برای چه کسانی مناسب است؟
علاقهمندان به تیونینگ مدلهای زبانی بزرگ
تسلط به تیونینگ مدل زبانی بزرگ - مبانی تا پیشرفته و استقرار ابری
-
مقدمه 03:16
-
بررسی تیونینگ مدل Bert 02:30
-
آشنایی با تیونینگ شبکه عصبی 05:23
-
کد کتابخانه تیونینگ Bert 06:29
-
بررسی مجموعه داده NER 04:03
-
کد بخشبندی داده Bert NER 01:58
-
تئوری توکنسازی 02:38
-
کد داده توکنسازی 06:19
-
کد تابع برچسب همترازی و توکنسازی 09:18
-
تست دقت نمونه 08:02
-
آموزش مدل Bert 07:18
-
ارزیابی مدل تیونینگ شده 07:13
-
مدل خود را در Hugging face منتشر کنید 04:00
-
آشنایی با تیونینگ Lora 04:12
-
آشنایی با تیونینگ QLORA 04:50
-
ایجاد Hugging face API 01:25
-
آشنایی با کتابخانه و مجموعه داده - Samsum Mistral 06:09
-
بارگذاری مجموعه داده Samsum 08:19
-
کد مدل QLORA 07:06
-
کد پیکربندی مدل LORA 02:22
-
آموزش و انتشار مدل 06:19
-
استنتاج مدل 05:37
-
تست مدل تیونینگ شده 08:46
-
بررسی تیونینگ GPT 04:13
-
آموزش مدل GPT 11:01
-
استنتاج مدل GPT 09:18
-
آمادهسازی داده برای تیونینگ 04:09
-
بررسی یادگیری تقویتی 05:13
-
کد بررسی SFT DPO 09:58
-
کد بررسی RLHF DPO 05:56
-
کد آموزش SFT 07:40
-
بررسی DPO 09:06
-
کد مجموعه داده Tatsu lab alpaca 06:50
-
آموزش SFT و ذخیره مدل 05:29
-
بررسی پیکربندی DPO 02:40
-
آموزش DPO با داده ترجیحی 09:38
-
آموزش و ذخیره مدل در Hugging face 02:36
-
تیونینگ DPO - استنتاج مدل 04:32
-
آشنایی با تقطیر مدل 01:45
-
تقطیر مدلهای زبانی بزرگ چیست؟ 02:03
-
معماری تقطیر دانش 04:34
-
نصب کتابخانه برای تقطیر 02:33
-
کد فیلتر داده 04:20
-
کد پرامپت 02:16
-
قیمت توکن در تیونینگ 02:25
-
فرمت پاسخ تکمیل چت 03:34
-
پردازش موازی 04:39
-
پردازش داده GPT 03:49
-
آموزش GPT 02:01
-
تیونینگ تقطیر مدل 02:36
-
بررسی وضعیت تیونینگ به صورت خودکار 01:30
-
داشبورد تیونینگ 01:36
-
تست مدل تقطیر شده 06:16
-
آشنایی با مدل Deepseek 05:04
-
تیونینگ تحت نظارت 04:33
-
آشنایی با مجموعه داده 01:09
-
کد SFT - قسمت 1 03:09
-
کد SFT - قسمت 2 10:12
-
بارگذاری مجموعه داده مدل SFT 07:08
-
آموزش SFT 05:11
-
مجموعه داده آموزش SFT 06:03
-
مجموعه داده مدل SFT 02:11
-
استنتاج SFT 05:19
-
استنتاج و ذخیره مدل سفارشی 05:13
-
باز کردن حساب رایگان آژور 02:28
-
ایجاد اشتراک آژور (اختیاری) 01:50
-
منابع Azure AI Foundry 05:17
-
مدیریت هزینه آژور 03:22
-
آشنایی با تیونینگ آژور 04:11
-
بررسی AI Foundry 02:43
-
بررسی مجموعه داده گردشگری 01:49
-
آپلود مجموعه داده BLOB آژور 04:35
-
تیونینگ تحت نظارت 06:10
-
بررسی تکمیل SFT 01:42
-
استقرار مدل تیونینگ شده 03:15
-
دمو: مدل گردشگری تیونینگ شده آژور 05:56
-
حذف منابع استفاده نشده 05:56
-
ایجاد حساب AWS 03:13
-
بررسی مجموعه داده 02:06
-
بارگذاری مجموعه داده S3 02:19
-
دسترسی به مدل 01:36
-
AWS Bedrock - تیونینگ مدل 04:32
-
وضعیت اعتبارسنجی 01:07
-
اعتبارسنجی تیونینگ 02:27
-
حذف منابع استفاده نشده 01:21
-
ایجاد حساب GCP رایگان 02:07
-
بررسی Vertex AI 03:04
-
بررسی مجموعه داده 01:50
-
تیونینگ Vertex AI 03:20
-
جزئیات آموزش 04:25
-
تست مدل تیونینگ شده 02:23
-
حذف منابع استفاده نشده 01:48
-
معماری پایتون 02:21
-
فرمانهای Print و Comment 03:03
-
متغیرها 05:48
-
نوع داده - عدد 08:28
-
نوع داده - رشته 05:53
-
نوع داده - بولی 01:39
-
عملگر در پایتون 02:24
-
لیست کالکشن 05:14
-
مجموعه کالکشن 07:03
-
دیکشنری کالکشن 04:33
-
شرط If else 12:00
-
حلقه While 08:54
-
حلقه For 03:50
-
آشنایی با تابع 03:32
-
کد تابع 10:09
-
تاپل کالکشن 05:18
-
لامبدا در پایتون 02:50
-
تابع آرایه 05:30
-
بلوپرینت کلاس 03:17
-
init در پایتون 08:08
-
str کلاس 04:41
-
تابع کلاس 05:30
-
آشنایی با وراثت 02:00
-
وراثت با init 05:11
-
Iterator در پایتون 03:44
-
پلیمورفیسم 05:11
-
اسکوپ 04:44
-
ماژولها 05:07
-
تاریخها 03:42
-
ماژولهای ریاضی 04:20
-
عبارت منظم 02:37
-
شی JSON 04:45
-
پکیج PIP 01:30
-
مدیریت استثنا 14:11
-
ورودی کاربر 01:06
-
فرمت رشته 06:55
-
خواندن فایل 04:21
-
نوشتن فایل 03:27
مشخصات آموزش
تسلط به تیونینگ مدل زبانی بزرگ - مبانی تا پیشرفته و استقرار ابری
- تاریخ به روز رسانی: 1404/09/07
- سطح دوره:متوسط
- تعداد درس:130
- مدت زمان :10:02:54
- حجم :4.68GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy