دوره آموزشی
آموزش های یودمی
دوبله زبان فارسی

ارزیابی و اتوماسیون تست RAG-LLM برای مبتدیان

ارزیابی و اتوماسیون تست RAG-LLM برای مبتدیان

✅ سرفصل و جزئیات آموزش

آنچه یاد خواهید گرفت:

  • چگونه مدل‌های زبانی بزرگ (LLM) سفارشی با استفاده از معماری بازیابی نسل افزوده (RAG) طراحی می‌شوند؟
  • متریک‌ها و بنچ‌مارک‌های رایج مورد استفاده در ارزیابی LLMs مبتنی بر RAG
  • آشنایی با فریمورک ارزیابی RAGAS برای ارزیابی و تست LLMs
  • تولید اسکریپت‌های کاربردی برای اتوماسیون و تأیید امتیاز متریک‌های LLMs
  • اتوماسیون سناریوهایی مانند تعاملات یک‌باره و تعاملات چندباره با LLMs با استفاده از فریمورک RAGAS
  • تولید داده‌ تست برای ارزیابی متریک‌های LLM با استفاده از فریمورک RAGAS
  • ایجاد فریمورک ارزیابی RAGAS Pytest برای تأیید متریک‌های RAG (سفارشی) LLMs

پیش‌نیازهای دوره

  • مبانی پایتون و PyTest الزامی است. اما صبر کنید! ما 2 بخش اختصاصی در انتهای این دوره داریم که دانش لازم درباره پایتون و Pytest را برای پیگیری دوره ارائه می‌دهد.
  • دانش اولیه درباره تست API

توضیحات دوره

مدل‌های زبانی بزرگ (LLMs) در همه جا وجود دارند. هر کسب‌وکاری در حال ساخت LLMs سفارشی مبتنی بر هوش مصنوعی خود برای بهبود خدمات مشتری است. اما مهندسان چگونه آنها را تست می‌کنند؟ بر خلاف تست سنتی نرم‌افزار، سیستم‌های مبتنی بر هوش مصنوعی نیاز به متدولوژی خاصی برای ارزیابی دارند.

این دوره از ابتدا شروع می‌شود و معماری نحوه کارکرد سیستم‌های هوش مصنوعی (LLMs) در پس‌زمینه را توضیح می‌دهد. سپس به‌طور عمیق به متریک‌های ارزیابی LLM می‌پردازد.

این دوره به شما نشان می‌دهد که چگونه به‌طور موثر از کتابخانه فریمورک RAGAS برای ارزیابی متریک‌های LLM از طریق مثال‌های اسکریپت شده استفاده کنید. این کار به شما اجازه می‌دهد تا از Pytest assertions برای چک کردن امتیازات بنچ‌مارک متریک و طراحی فریمورک قدرتمند اتوماسیون تست و ارزیابی LLM استفاده کنید.

از دوره چه مواردی یاد خواهید گرفت؟

  • بررسی سطح بالاروی مدل‌های زبانی بزرگ (LLM)
  • درک نحوه ساخت LLMs سفارشی با استفاده از معماری بازیابی نسل افزوده (RAG)
  • متریک‌ها و بنچ‌مارک‌های رایج مورد استفاده در ارزیابی LLMs مبتنی بر RAG
  • آشنایی با فریمورک ارزیابی RAGAS برای ارزیابی و تست LLMs
  • تولید اسکریپت‌های کاربردی برای اتوماسیون و تأیید امتیاز متریک‌های LLMs
  • اتوماسیون سناریوهایی مانند تعاملات یک‌باره و تعاملات چندباره با LLMs با استفاده از فریمورک RAGAS
  • تولید داده‌ تست برای ارزیابی متریک‌های LLM با استفاده از فریمورک RAGAS

در پایان دوره، قادر خواهید بود تا فریمورک ارزیابی RAGAS Pytest را برای تأیید متریک‌های RAG (سفارشی) LLMs ایجاد کنید.

نکته مهم:

این دوره به بررسی 7 متریک برتر می‌پردازد که معمولاً برای ارزیابی و تست LLMs استفاده می‌شود. همین منطق می‌تواند برای سایر ارزیابی‌های متریک نیز به کار رود.

تجربه عملی:

این دوره LLM عملی RAG را برای شما فراهم می‌کند، اما در مرحله اسکریپت‌نویسی، شما به یک اشتراک اولیه در Open AI نیاز دارید تا به APIs آنها دسترسی پیدا کنید.

این دوره برای چه کسانی مناسب است؟

  • مهندسان نرم‌افزار
  • مهندسان تضمین کیفیت
  • متخصصان تست نرم‌افزار

ارزیابی و اتوماسیون تست RAG-LLM برای مبتدیان

  • این دوره چه مواردی را ارائه می‌دهد؟ سوالات متداول - حتماً تماشا کنید 09:12
  • آشنایی با هوش مصنوعی و LLMs - آنها چگونه کار می‌کنند؟ 06:17
  • بررسی LLMs محبوب و چالش‌های این LLMs عمومی 06:15
  • بازیابی نسل افزوده (RAG) چیست؟ درک معماری آن 11:00
  • جریان End to end در معماری RAG و مزایای کلیدی آن؟ 10:32
  • برداشت‌های نادرست - چرا RAG LLMs؟ - آیا نمی‌توانیم با متدهای سنتی مشکل را حل کنیم؟ 05:26
  • اگر اطلاعات در RAG موجود نیست، آیا باید از داده‌ LLM استفاده کنیم؟ - بهترین شیوه‌ها 07:09
  • دموی RAG LLMs تمرین برای ارزیابی و نوشتن اسکریپت‌های اتوماسیون تست 06:51
  • درک بخش پیاده‌سازی RAG LLM's تمرینی برای درک کانتکس 08:36
  • درک سناریوهای LLM مکالمه‌ای و اینکه چگونه در معماری RAG اعمال می‌شوند؟ 05:47
  • درک بنچ‌مارک‌های متریک برای سیستم بازیابی مستندات در LLM 08:12
  • نصب و تنظیم مسیر پایتون در سیستم‌ عامل ویندوز 10:16
  • نصب و تنظیم مسیر پایتون در سیستم‌ عامل مک 10:26
  • نصب پکیج‌های فریمورک RAGAS و راه‌اندازی پروژه تست LLM 09:35
  • ایجاد ارتباط با OpenAI با استفاده از فریمورک Langchain برای RAGAS 15:49
  • End to end - ارزیابی LLM برای متریک ContextPrecision با داده‌ تست SingleTurn 20:38
  • ارتباط با LLMs با استفاده از فراخوانی API Post برای به‌دست آوردن پاسخ‌ها به‌طور پویا 09:51
  • ارزیابی LLM برای متریک یادآوری کانتکس با مثال تست RAGAS Pytest 13:22
  • ساخت فیکسچرهای Pytest برای جداسازی utils مشترک OpenAI و LLM Wrapper از تست 07:56
  • آشنایی با فیکسچرهای پارامترسازی Pytest برای هدایت داده‌ تست به‌صورت خارجی 10:13
  • utils قابل استفاده مجدد برای جداسازی فراخوانی‌های API متعلق به LLM و انجام تست تنها روی منطق متریک 13:18
  • درک وفاداری LLMs و متریک‌های مربوط بودن پاسخ به‌طور مفهومی 04:56
  • ساخت اسکریپت ارزیابی LLM برای تست بنچ‌مارک‌های وفاداری با استفاده از RAGAS 09:42
  • خواندن داده‌ تست از فایل جی‌سان خارجی به اسکریپت‌های ارزیابی LLM 09:58
  • درک نحوه استفاده از متریک‌ها در مکان‌های مختلف معماری RAG LLM 10:34
  • درستی واقعی - ساخت تست واحد برای ارزیابی چندین متریک LLM 12:02
  • درک EvaluationDataSet و اینکه چگونه به ارزیابی چندین متریک کمک می‌کند 09:41
  • آپلود نتایج ارزیابی متریک‌های LLM به‌صورت ویژوال در پورتال داشبورد RAGAS 08:21
  • چگونه RAG LLM را با چت تاریخچه چند مکالمه‌ای ارزیابی کنیم؟ 07:59
  • ساخت تست ارزیابی LLM که می‌تواند مکالمات چندگانه را ارزیابی کند - مثال 17:42
  • چگونه با استفاده از فریمورک RAGAS، داده‌ تست برای ارزیابی LLM ایجاد کنیم؟ 15:02
  • بارگذاری مستندات خارجی در Langchain utils برای تحلیل و استخراج داده‌ تست 08:52
  • نصب و پیکربندی پکیج NLTK برای اسکن مستندات LLM و تولید تست‌ها 20:11
  • تولید امتیازات مبتنی بر معیارهای Rubrics برای ارزیابی کیفیت پاسخ‌های LLM 11:46
  • یک اسلاید جمع‌بندی از مفاهیم آموخته شده در دوره 04:29
  • برنامه Hello World در پایتون با مبانی 08:35
  • تایپ‌های داده پایتون و چگونه تایپ را در ران‌تایم به‌دست آوریم؟ 05:17
  • تایپ داده لیست و عملیات‌های آن برای دستکاری 12:47
  • تایپ‌های داده تاپل و دیکشنری در پایتون با مثال‌ها 08:28
  • دستور شرطی if else در پایتون با مثال‌های کاربردی 03:10
  • چگونه در ران‌تایم دیکشنری‌ها را ایجاد کرده و به آن داده‌ اضافه کنیم؟ 07:55
  • حلقه‌ها در پایتون چگونه کار می‌کنند و اهمیت شناسایی کد چیست؟ 08:58
  • مثال‌های برنامه‌نویسی با استفاده از حلقه for 04:17
  • مثال‌های برنامه‌نویسی با استفاده از حلقه While 10:27
  • تابع چیست؟ چگونه می‌توان از آنها در پایتون استفاده کرد؟ 10:46
  • اصول OOPS - کلاس‌ها و آبجکت‌ها در پایتون 07:38
  • Constructor چیست و نقش آن در برنامه‌نویسی شی‌گرا چیست؟ 13:38
  • مفاهیم وراثت با مثال‌ در پایتون 12:12
  • رشته‌ها و توابع رشته در پایتون 09:53
  • فیکسچرهای pytest چه هستند و چگونه به بهبود تست‌ها کمک می‌کنند؟ 10:29
  • درک اسکوپ‌ها در فیکسچرهای Pytest با مثال‌ها 11:59
  • راه‌اندازی و حذف راه‌اندازی با استفاده از فیکسچرهای پایتون و کلیدواژه yield 09:04

3,436,000 687,200 تومان

مشخصات آموزش

ارزیابی و اتوماسیون تست RAG-LLM برای مبتدیان

  • تاریخ به روز رسانی: 1404/06/14
  • سطح دوره:متخصص
  • تعداد درس:52
  • مدت زمان :08:42:58
  • حجم :4.0GB
  • زبان:دوبله زبان فارسی
  • دوره آموزشی:AI Academy

آموزش های مرتبط

The Great Courses
651,500 130,300 تومان
  • زمان: 01:39:55
  • تعداد درس: 6
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,889,000 377,800 تومان
  • زمان: 04:47:39
  • تعداد درس: 30
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,501,000 300,200 تومان
  • زمان: 03:48:11
  • تعداد درس: 47
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
10,289,500 2,057,900 تومان
  • زمان: 26:03:06
  • تعداد درس: 121
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
490,000 98,000 تومان
  • زمان: 54:55
  • تعداد درس: 18
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,797,000 359,400 تومان
  • زمان: 04:33:59
  • تعداد درس: 86
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,474,500 294,900 تومان
  • زمان: 03:44:14
  • تعداد درس: 45
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
7,827,500 1,565,500 تومان
  • زمان: 19:49:53
  • تعداد درس: 83
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
9,249,500 1,849,900 تومان
  • زمان: 23:25:23
  • تعداد درس: 78
  • سطح دوره:
  • زبان: دوبله فارسی

آیا سوالی دارید؟

ما به شما کمک خواهیم کرد تا شغل و رشد خود را افزایش دهید.
امروز با ما تماس بگیرید