جستجوی هوش مصنوعی و یادگیری ماشین با اوپنسرچ (الاستیکسرچ + AI/ML)
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- جستجوی سنتی، جستجوی عصبی و جستجوی ترکیبی را با استفاده از اوپنسرچ آمازون، که یک پلتفرم متنباز با مجوز آپاچی است، درک و پیادهسازی کنید.
- جستجوی معنایی و تولید افزوده با بازیابی (RAG) را با استفاده از مدلهای میزبانیشده محلی یا ارائهدهندگان LLM خارجی مانند OpenAI، پیادهسازی کنید.
- پروژههای واقعی را به طور کامل روی یک ماشین محلی یا یک ماشین مجازی ابری با استفاده از VS Code، اسکریپتهای شل، پایتون و تمپلیتهای yaml، پیادهسازی کنید.
- گزارشگیری، هشداردهی، داشبوردها و الگوهای لاگ برای قابلیت مشاهده را ضمن درک نقاط یکپارچهسازی با سرویسهای ابری، پیادهسازی کنید.
- چندین مطالعه موردی، از جمله مهاجرت داده پروداکشن از الاستیکسرچ به اوپنسرچ را، تکمیل کنید.
- گردشکارهای عاملی را که شامل معماریهای RAG بر روی LLMهای محلی و خارجی هستند، درک و پیادهسازی کنید.
پیشنیازهای دوره
- آشنایی با مبانی اجرای کانتینر داکر، اصول اولیه برنامهنویسی پایتون و اشتیاق برای درک و تحلیل چگونگی کارکرد جستجو
- لپتاپ شخصی با حداقل 4 گیگابایت رم (ترجیحاً 8 گیگابایت) و 2 هسته پردازنده (ترجیحاً 4 هسته). آمادگی برای صرف هزینهای حدود 5 دلار یا کمتر برای استفاده از یک سرویس LLM عمومی مانند Open AI
توضیحات دوره
الاستیکسرچ یک پلتفرم جستجوی شناختهشده است که توسط شرکتها، کسبوکارهای کوچک و متوسط و استارتاپها استفاده میشود. الاستیکسرچ در موارد استفاده از جستجوی واژگانی با استفاده از الگوریتم BM25 که بر پایه Lucene ساخته شده، عملکرد فوقالعادهای دارد. با این حال، با ظهور هوش مصنوعی و مدلهای زبان بزرگ (LLM)، مفاهیمی مانند جستجوی معنایی، جستجوی ترکیبی، جستجوی عصبی و جستجوی چندوجهی دیگر مفاهیمی نادر نیستند و به یک استاندارد تبدیل شدهاند.
اوپنسرچ (که در اصل یک فورک از الاستیکسرچ است و در سال 2021 شروع به کار کرد) با مجوز متنباز آپاچی و به عنوان یک پروژه بنیاد لینوکس، محبوبیت و پذیرش گستردهای در جوامع متنباز و سازمانی به دست آورده است. اوپنسرچ ضمن حفظ تمام قابلیتهای جستجوی واژگانی الاستیکسرچ، با مدلهای LLM (مانند sentence transformers) و ارائهدهندگانی چون OpenAI ،Cohere و Anthropic یکپارچه میشود و گردشکارهای عاملی را تعریف میکند. به عنوان یک موفقیت بزرگ، شرکت اوراکل برای قابلیتهای جستجوی PeopleSoft خود به اوپنسرچ روی آورد. همچنین AWS سرویس مدیریتشده اوپنسرچ را بر روی پلتفرم ابری خود ارائه میدهد که خود گویای آمادگی این پلتفرم برای محیط پروداکشن است.
دوره «جستجوی مبتنی بر هوش مصنوعی و یادگیری ماشین با اوپنسرچ» یک آموزش کامل در زمینه نصب، پیکربندی و درک اوپنسرچ ارائه میدهد و همزمان موارد استفاده واقعی مانند تولید افزوده با بازیابی (RAG)، گردشکارهای عاملی و مهاجرت از الاستیکسرچ به اوپنسرچ را پیادهسازی میکند. تمرکز اصلی بیشتر روی کاربردهای هوش مصنوعی و یادگیری ماشین است تا مفاهیم سنتی و واژگانی، هرچند که این مفاهیم سنتی هم برای حفظ پیشینه تاریخی بررسی شدهاند.
برای مقایسه الاستیکسرچ (ELK stack) و اوپنسرچ، میتوان تقریباً معادلهای زیر را در نظر گرفت:
- Elasticsearch ~ OpenSearch
- Logstash ~ Data Prepper
- Kibana ~ OpenSearch Dashboards
اوپنسرچ از نظر نسخهها و ویژگیها یک پلتفرم در حال رشد سریع است. ما از نسخه 2.17 که تا سپتامبر 2024 نسخهای آماده برای محیط پروداکشن است، استفاده خواهیم کرد. در این دوره به طور گسترده از داکر استفاده شده تا از تکرارپذیری اجرای تمام کدهای دوره اطمینان حاصل شود.
این دوره برای چه کسانی مناسب است؟
- دانشجویان کارشناسی بدون تجربه پروژه در دنیای واقعی
- متخصصان با تجربه کاری در حوزههای غیر از جستجو (یا حتی حوزه جستجو)
- توسعهدهنده نرمافزار
- مهندس DevOps / مدیر SysOps / مهندس قابلیت اطمینان سایت (SRE)
- دانشمند داده / تحلیلگر داده / مهندس داده
- مهندسانی که قصد تغییر مسیر شغلی خود را دارند. (به سمت جستجو و هوش مصنوعی/یادگیری ماشین)
- مهندسان پلیگلات (مسلط به چند زبان) که مشتاق کاهش هزینهها و بهبود عملکرد پلتفرمهای جستجوی موجود هستند.
جستجوی هوش مصنوعی و یادگیری ماشین با اوپنسرچ (الاستیکسرچ + AI/ML)
-
معرفی ما | نکات اجرایی | منابع سیستمی مورد نیاز 06:51
-
پیشنیازها | چرا الاستیکسرچ | انگیزه | محیط دوره 09:34
-
دمو: پوشهها | مروری کلی بر دوره در یک نگاه 08:31
-
دمو: مجموعه داده | پروژهها | دانلود مطالب دوره 06:59
-
الزامات سیستم و شبکه | پیکربندی 09:35
-
پلاگینها | ارتقاء 06:13
-
کتابخانههای کلاینت اوپنسرچ (OS) 04:57
-
دمو: راهاندازی، نصب، پیکربندی و دسترسی به اوپنسرچ روی اینستنس AWS EC2 10:01
-
ادامه دمو: راهاندازی، نصب، پیکربندی و دسترسی به اوپنسرچ روی AWS EC2 12:52
-
دمو: راهاندازی، نصب، پیکربندی و دسترسی به اوپنسرچ روی ماشین محلی 11:15
-
جستجو چیست - قیاس 10:43
-
OpenSearch چیست | تاریخچه | قابلیتها | پروژههای مرتبط 04:02
-
انواع جستجوها 09:38
-
انواع جستجوی پیشرفته 05:38
-
موارد استفاده بر اساس صنعت | موارد استفاده بر اساس حوزه شغلی 05:21
-
تحلیل رقابتی | اوپنسرچ در مقابل الاستیکسرچ 09:16
-
معماری اوپنسرچ | شاردها | ایندکس معکوس | الگوریتم TF-IDF | الگوریتم BM25 11:22
-
دمو: حداقل امکانات الاستیکسرچ 09:32
-
ادامه دمو: حداقل امکانات الاستیکسرچ و اوپنسرچ 22:11
-
پایپلاین تحلیل متن 04:09
-
تحلیلگر | اجزا | موارد استفاده | داخلی در برابر سفارشی 09:53
-
تکنیکهای نرمالسازی | توکنایزرها | فیلترهای توکن 09:04
-
ادامه دمو: حداقل امکانات الاستیکسرچ و اوپنسرچ 11:21
-
دمو: مپینگها 24:42
-
ادامه دمو: مپینگها 26:26
-
دمو: تحلیل متن 07:32
-
متدهای جستجو | زبانهای کوئری جستجو | عملکرد جستجو | ارتباط نتایج جستجو 05:48
-
نتایج جستجو | هایلایت | صفحهبندی | مرتبسازی | جمعکردن نتایج | تکمیل خودکار 16:52
-
بازیابی فیلدهای خاص | جستجوی کلیدواژهای 10:00
-
دمو: جستجوی داده 25:13
-
ادامه دمو: جستجوی داده 15:04
-
جستجوی kNN | ایندکس kNN 07:34
-
جستجوی عصبی 15:15
-
هوش مصنوعی | یادگیری ماشین | LLM - درک شهودی و قیاسها 23:08
-
دمو: ترنسفورمرهای جمله 24:27
-
دمو: RAG | جستجوی چندوجهی 20:02
-
ایندکسگذاری برداری 15:06
-
دمو: جستجوی kNN 11:38
-
دمو: جستجوی عصبی 21:27
-
ادامه دمو: جستجوی عصبی 16:21
-
دمو: Edge Ngrams 06:53
-
پلاگین ML Commons | الگوریتمها | انتخاب و استفاده از مدلهای LLM بر اساس اصطلاحات اوپنسرچ 22:48
-
دمو: مدل از پیش آموزشدیده اوپنسرچ: msmarco distilbert 17:51
-
دمو: مدل از پیش آموزشدیده محلی اوپنسرچ با فرمت ONNX 17:51
-
دمو: مدل از پیش آموزشدیده محلی اوپنسرچ با فرمت TORCH 08:37
-
دمو: ترنسفورمرهای جمله اوپنسرچ که به صورت محلی و با فرمت ONNX ثبت نشدهاند 05:47
-
دمو: انکودینگ اسپارس از پیش آموزشدیده و پشتیبانیشده در اوپنسرچ 09:05
-
دمو: کراس انکودر از پیش آموزشدیده و پشتیبانیشده در اوپنسرچ 06:37
-
مدل خارجی | فراخوانی مدل ریموت | OpenAI | دموها 24:22
-
طرحهای کانکتور | پیشپردازش و پسپردازش | دموها 20:14
-
گاردریلها | کلمات توقف | دموها 12:06
-
بررسی | انواع ایجنتها | دمو ایجنت جریانی (Flow Agent) برای RAG 29:07
-
دمو: RAG با ترنسفورمرهای جملهای که پشتیبانی نمیشوند 10:11
-
دمو: RAG با دیتاست کارآموزان 19:07
-
ابزارها | رتبهبندی مجدد 02:59
-
دمو: رتبهبندی مجدد با کراس انکودینگ 18:40
-
دمو: ایجنت جریانی محاورهای RAG با حافظه 21:24
-
دمو: ایجنت جریانی محاورهای RAG با چندین پایگاه دانش (ایندکس) 07:00
-
دمو: RAG با انتخاب دینامیک ایندکس 11:08
-
دمو: ایجنت محاورهای چتبات RAG 19:23
-
شروع به کار | زبانهای کوئری | اجزاء 20:20
-
دمو: بررسی کامل و جامع داشبوردها 15:26
-
دمو: تحلیل داده 14:15
-
دمو: ساخت داشبورد 08:34
-
دمو: برندسازی سفارشی 03:29
-
دمو: DQL (زبان کوئری داشبورد) 14:43
-
دمو: قابلیت مشاهده | یکپارچهسازیها | نوتبوکها | گزارشگیری | ارتباط نتایج جستجو 13:40
-
Data Prepper | موارد استفاده | مفاهیم 08:41
-
Data Prepper | در مقابل Logstash | منابع | پردازشگرها | سینکها 07:52
-
دمو: دریافت و پردازش لاگهای آپاچی 13:05
-
دمو: دریافت و پردازش لاگهای Open Telemetry 08:46
-
پروژه 1: بارگذاری، ایجاد و بازیابی در OpenSearch 34:31
-
پروژه 2: مهاجرت از ElasticSearch به OpenSearch 27:50
-
پروژه 3: تحلیل داده مکانی 18:01
مشخصات آموزش
جستجوی هوش مصنوعی و یادگیری ماشین با اوپنسرچ (الاستیکسرچ + AI/ML)
- تاریخ به روز رسانی: 1404/06/21
- سطح دوره:همه سطوح
- تعداد درس:74
- مدت زمان :16:35:56
- حجم :9.98GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy