پردازش زبان طبیعی در پایتون (دوره جدید 2025)
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت
- مرور تاریخچه و تکامل تکنیکها و کاربردهای NLP، از مدلهای سنتی یادگیری ماشین تا رویکردهای مدرن LLM
- مرور پایپ لاین پیشپردازش متن NLP، شامل پاکسازی، نرمالسازی، تحلیل زبانشناختی و بردارسازی
- استفاده از تکنیکهای سنتی یادگیری ماشین برای انجام تحلیل احساسات، طبقهبندی متن و مدلسازی موضوع
- درک نظریه شبکههای عصبی و یادگیری عمیق، اجزای پایه تکنیکهای مدرن NLP
- تفکیک بخشهای اصلی معماری ترنسفورمرها، شامل embeddings، مکانیزم توجه و شبکههای عصبی پیشخور (FFNs)
- استفاده از LLMهای پیشآموزشدادهشده با Hugging Face برای انجام تحلیل احساسات، NER، طبقهبندی بدون نمونه (zero-shot)، شباهت اسناد، و خلاصهسازی و تولید متن
پیش نیازهای دوره
- ما به شدت توصیه میکنیم ابتدا دوره آماده سازی داده و EDA با پایتون را بگذرانید.
- Jupyter Notebooks (دانلود رایگان، در نصب همراه شما هستیم)
- آشنایی با اصول پایتون و پانداس توصیه میشود، اما الزامی نیست.
توضیحات دوره
آموزش پیش رو یک دوره عملی و کاربردی است که به گونهای طراحی شده که مروری جامع بر تمام مفاهیم اساسی پردازش زبان طبیعی مدرن (NLP) در پایتون ارائه دهد.
ما این دوره را با مرور تاریخچه و تکامل NLP در 70 سال گذشته شروع میکنیم، که شامل محبوبترین معماری فعلی، یعنی ترنسفورمرها است. همچنین مراحل اولیه پیشپردازش متن برای مدلسازی را مرور میکنیم، در این بخش یاد میگیرید چگونه داده را با پانداس و spaCy پاکسازی و نرمالسازی کرده و سپس آن رابا استفاده از تعداد کلمات و نمرات TF-IDF به صورت برداری در یک ماتریس Document-Term قرار دهید.
سپس، دوره به دو بخش تقسیم میشود:
- نیمه اول تکنیکهای سنتی یادگیری ماشین را پوشش میدهد.
- نیمه دوم رویکردهای یادگیری عمیق مدرن و LLM (مدل زبانی بزرگ) را پوشش میدهد.
برای کابردهای سنتی NLP، ابتدا با تحلیل احساسات برای تعیین مثبت یا منفی بودن متن با کتابخانه VADER شروع میکنیم. سپس با Naïve Bayes طبقهبندی متن بر روی دادههای برچسبدار و همچنین مدلسازی موضوع بر روی دادههای بدون برچسب با استفاده از Non-Negative Matrix Factorization را پوشش میدهیم، همه این کارها با کتابخانه scikit-learn انجام می گیرد.
هنگامیکه درک جامعی از مفاهیم پایه NLP داشتید، به بخش دوم دوره درباره تکنیکهای NLP مدرن میپردازیم که پیشرفتهای عمده NLP و تغییر ذهنیت علم داده در دهه گذشته را پوشش میدهد.
ما با اجزای پایه تکنیکهای NLP مدرن، که شبکههای عصبی هستند، شروع میکنیم. در ادامه یاد میگیرید چگونه شبکههای عصبی آموزش میبینند، با اصطلاحاتی مانند لایهها، نودها، وزن و توابع فعالسازی آشنا میشوید، سپس معماریهای محبوب یادگیری عمیق و کاربردهای عملی آنها را می آموزید.
همچنین درباره ترنسفورمرها، معماری LLMهای محبوب مانند ChatGPT ،Gemini و Claude صحبت میکنیم. نحوه عملکرد لایههای اصلی و نقش آنها، از جمله embeddings، مکانیزم توجه و شبکههای عصبی پیشخور را پوشش میدهیم. بعلاوه تفاوتهای بین مدلهای encoder-only ،decoder-only و encoder-decoder را مرور میکنیم و انواع LLMهای مرتبط با هر دسته را معرفی میکنیم.
آخرین اما نه کماهمیتترین مفاهیم یاد گرفتهشده را با پایتون به کار می بریم. ما از کتابخانه Hugging Face Transformers و Model Hub آنها برای نمایش شش کاربرد عملی NLP، از جمله تحلیل احساسات، تشخیص موجودیتهای اسمی، طبقهبندی Zero-Shot، خلاصهسازی متن، تولید متن و شباهت اسناد، استفاده خواهیم کرد.
طرح دوره:
- نصب و راهاندازی
- نصب Anaconda، شروع به نوشتن کد پایتون در Jupyter Notebook و یادگیری نحوه ایجاد محیط جدید conda برای راهاندازی این دوره
- راهنمای پردازش زبان طبیعی
- مرور مبانی پردازش زبان طبیعی (NLP)، شامل مفاهیم کلیدی، تکامل NLP در طول سالها و کاربردها و کتابخانههای پایتون
- پیشپردازش متن
- مرور مراحل پیشپردازش متن قبل از اعمال الگوریتمهای یادگیری ماشین، شامل پاکسازی، نرمالسازی، بردارسازی و سایر موارد
- NLP با یادگیری ماشین
- انجام تحلیل احساسات، طبقهبندی متن و مدلسازی موضوع با استفاده از روشهای سنتی NLP، شامل روشهای مبتنی بر قانون، تکنیک های نظارتشده و بدون نظارت یادگیری ماشین
- شبکههای عصبی و یادگیری عمیق
- تفکیک بصری مفاهیم شبکههای عصبی و یادگیری عمیق، اجزای پایه تکنیکهای مدرن NLP
- ترنسفورمرها و LLMs
- بررسی عمیق بخشهای اصلی معماری ترنسفورمر شامل embeddings، مکانیزم توجه، FFNها و همچنین LLMهای محبوب برای تسک های NLP مانند BERT ،GPT و غیره
- ترنسفورمرهای Hugging Face
- معرفی کتابخانه Transformers از Hugging Face در پایتون و مرور مثالهایی از نحوه استفاده از LLMهای پیشآموزشدادهشده برای انجام تسک های NLP، شامل تحلیل احساسات، شناسایی موجودیت نامدار (NER)، طبقهبندی zero-shot، خلاصهسازی متن، تولید متن و شباهت اسناد
- مرور NLP و گامهای بعدی
- تکنیکهای NLP که در این دوره پوشش داده میشوند را مرور کنید، زمان استفاده از آنها را بررسی کنید و نحوه بررسی پیشرفته تر و بهروز ماندن را بیاموزید.
برای شروع آماده هستید؟ همین امروز در این دوره شرکت کنید و دسترسی فوری و مادامالعمر به موارد زیر را دریافت کنید:
- 12.5 ساعت ویدئو با کیفیت بالا
- 13 تکلیف
- 4 تمرین تعاملی
- کتاب الکترونیکی پردازش زبان طبیعی در پایتون (با بیش از 200 صفحه)
- فایلهای پروژه قابل دانلود و راهحلها
- پشتیبانی متخصص و انجمن پرسش و پاسخ
- ضمانت رضایت 30 روزه Udemy
اگر شما هم یک دانشمند داده مشتاق یا باتجربه هستید که به دنبال مرور کلی عملی از تکنیکهای سنتی و مدرن پردازش زبان طبیعی در پایتون هستید، این دوره برای شما مناسب است.
این دوره برای چه کسانی مناسب است؟
- دانشمندان داده مشتاق که میخواهند نمای کلی عملی از تکنیکهای پردازش زبان طبیعی در پایتون را بدست آورند.
- دانشمندان داده باتجربهای که به دنبال یادگیری جدیدترین تکنیکهای NLP، مانند ترنسفورمرها، LLMها و Hugging Face هستند.
پردازش زبان طبیعی در پایتون (دوره جدید 2025)
-
معرفی دوره 03:35
-
درباره این مجموعه 00:43
-
ساختار و خلاصه دوره 04:23
-
تکالیف دوره 01:01
-
مقدمه بخش 01:19
-
مروری بر Anaconda 02:21
-
نصب Anaconda 02:37
-
راهاندازی Jupyter Notebook 05:48
-
محیطهای Conda 04:27
-
جریان کار Conda 02:55
-
فرمان های Conda 02:30
-
دمو: ایجاد محیط Conda 05:45
-
محیطها در این دوره 01:22
-
مقدمه بخش 00:32
-
مقدمهای بر NLP 02:10
-
تاریخچه NLP 05:41
-
کاربردها و تکنیکهای NLP 01:47
-
کتابخانههای NLP در پایتون 02:31
-
نکات کلیدی 01:56
-
مقدمه بخش 00:59
-
پایپ لاین NLP 02:43
-
مروری بر پیشپردازش متن 02:35
-
تکلیف: ایجاد محیط جدید 01:28
-
راهحل: ایجاد محیط جدید 03:20
-
پیشپردازش متن با پانداس 04:19
-
دمو: تنظیم پیشپردازش متن 06:04
-
دمو: پیشپردازش متن با پانداس 08:14
-
نکته حرفهای: ایجاد تابع 04:25
-
تکلیف: پیشپردازش متن با پانداس 03:22
-
راهحل: پیشپردازش متن با پانداس 08:12
-
پیشپردازش متن با spaCy 01:38
-
توکنسازی 02:05
-
لماتیزیشن 02:42
-
کلمات غیرضروری 01:17
-
برچسبگذاری بخش گفتار 02:01
-
دمو: توکنها، کلمات پایه یا لماها و کلمات غیرضروری 08:00
-
نکته حرفهای: استفاده از متد Apply 05:59
-
دمو: برچسبگذاری بخش گفتار 09:27
-
دمو: ایجاد پایپ لاین NLP 06:15
-
تکلیف: پیشپردازش متن با spaCy 00:41
-
راهحل: پیشپردازش متن با spaCy 07:57
-
بردارسازی 04:45
-
Count Vectorizer در پایتون 08:04
-
دمو: Count Vectorizer 05:48
-
دمو: پارامترهای Count Vectorizer 05:05
-
نکته حرفهای: تحلیل اکتشافی داده 02:13
-
تکلیف: بررسی Count Vectorizer 01:16
-
راهحل: بررسی Count Vectorizer 07:36
-
TF-IDF 06:30
-
TF-IDF Vectorizer در پایتون 05:08
-
دمو: TF-IDF Vectorizer 04:52
-
تکلیف: TF-IDF Vectorizer 01:07
-
راهحل: TF-IDF Vectorizer 07:38
-
نکات کلیدی 04:13
-
مقدمه بخش 01:20
-
یادگیری ماشین چیست؟ 02:55
-
الگوریتمهای رایج یادگیری ماشین برای NLP 02:51
-
مروری بر NLP سنتی 02:31
-
NLP سنتی در مقابل مدرن 01:55
-
دمو: ایجاد محیط جدید 04:09
-
تحلیل احساسات 01:28
-
تحلیل احساسات در پایتون 02:46
-
دمو: تحلیل احساسات در پایتون 06:11
-
تکلیف: تحلیل احساسات 00:58
-
راهحل: تحلیل احساسات 08:50
-
مبانی طبقهبندی متن 01:51
-
الگوریتمهای طبقهبندی متن 02:06
-
Naïve Bayes 08:04
-
Naïve Bayes در پایتون 03:08
-
دمو: راهاندازی Naïve Bayes 09:19
-
دمو: گردش کار Naïve Bayes 08:33
-
دمو: پیشبینی Naïve Bayes 03:08
-
نکته حرفهای: مقایسه مدلهای یادگیری ماشین 08:56
-
گامهای بعدی طبقهبندی متن 03:11
-
تکلیف: طبقهبندی متن 00:41
-
راهحل: طبقهبندی متن 14:03
-
مبانی مدلسازی موضوع 02:16
-
الگوریتمهای مدلسازی موضوع 01:42
-
تفکیک ماتریس Non-Negative (NMF) 04:22
-
NMF در پایتون 02:28
-
دمو: برازش مدل NMF 05:01
-
نکته حرفهای: تابع نمایش تاپیک ها 09:30
-
دمو: تیون کردن مدل NMF 08:51
-
گامهای بعدی مدلسازی تاپیک 01:56
-
نکته حرفهای: ترکیب الگوریتمهای یادگیری ماشین 05:03
-
تکلیف: مدلسازی تاپیک 01:45
-
راهحل: مدلسازی تاپیک 13:05
-
نکات کلیدی 02:57
-
مقدمه بخش 01:47
-
مروری بر NLP مدرن 04:41
-
مقدمهای بر شبکههای عصبی 02:02
-
بروزرسانی لجستیک رگرسیون 10:36
-
لجستیک رگرسیون: توضیح بصری 07:03
-
شبکههای عصبی: توضیح بصری 05:42
-
خلاصه شبکه عصبی 03:20
-
تمرین: اجزای شبکه عصبی 00:31
-
راهحل: اجزای شبکه عصبی 05:01
-
شبکههای عصبی در پایتون 06:12
-
دمو: شبکههای عصبی در پایتون 06:30
-
دمو: ماتریسهای شبکه عصبی 04:16
-
نکته حرفهای: نمادگذاری و ماتریسهای شبکه عصبی 06:12
-
شبکه عصبی چگونه آموزش میبیند؟ 03:59
-
آموزش شبکه عصبی: توضیح بصری 16:21
-
تمرین: آموزش شبکه عصبی 00:22
-
راهحل: آموزش شبکه عصبی 08:17
-
مقدمهای بر یادگیری عمیق 02:22
-
معماریهای یادگیری عمیق 10:34
-
یادگیری عمیق در عمل 07:50
-
مدلهای یادگیری عمیق پیشآموزشدادهشده 05:21
-
تمرین: مفاهیم یادگیری عمیق 00:16
-
راهحل: مفاهیم یادگیری عمیق 03:18
-
نکات کلیدی 05:22
-
مقدمه بخش 02:20
-
خلاصه NLP مدرن 00:59
-
مروری بر ترنسفورمرها و LLMs 02:41
-
معماری ترنسفورمر 02:59
-
معماری ترنسفورمر و Embeddings 09:08
-
معماری ترنسفورمر و مکانیزم توجه 11:52
-
معماری ترنسفورمر و شبکه عصبی پیشخور 04:21
-
خلاصه ترنسفورمرها 05:54
-
تجزیه نمودار ترنسفورمر 03:03
-
Encoder ها و Decoder ها 05:36
-
مدلهای زبانی بزرگ (LLMs) 09:28
-
تمرین: مفاهیم ترنسفورمرها و LLMs 00:22
-
راهحل: مفاهیم ترنسفورمرها و LLMs 05:51
-
نکات کلیدی 03:30
-
مقدمه بخش 02:33
-
مروری بر Hugging Face 05:03
-
دمو: ایجاد محیط جدید 02:48
-
تحلیل احساسات با LLMs 05:15
-
دمو: پایپ لاین پایه تحلیل احساسات 08:21
-
دمو: زمانبندی، لاگینگ و تنظیم دستگاه 04:33
-
دمو: مقایسه نمرات احساسات 07:07
-
نکته حرفهای: تسریع کد ترنسفورمر 05:31
-
تکلیف: تحلیل احساسات با LLMs 01:32
-
راهحل: تحلیل احساسات با LLMs 09:09
-
شناسایی موجودیت نامدار 05:02
-
دمو: پایپ لاین پایه NER 03:08
-
دمو: هاب مدل Hugging Face 02:23
-
دمو: پاکسازی خروجی NER 07:35
-
تکلیف: شناسایی موجودیت نامدار 00:51
-
راهحل: شناسایی موجودیت نامدار 14:53
-
طبقهبندی Zero-Shot 04:16
-
دمو: طبقهبندی Zero-Shot 07:07
-
تکلیف: طبقهبندی Zero-Shot 00:32
-
راهحل: طبقهبندی Zero-Shot 05:00
-
خلاصهسازی متن 03:00
-
دمو: پایپ لاین پایه خلاصهسازی متن 03:22
-
دمو: چندین پایپ لاین 07:26
-
تکلیف: خلاصهسازی متن 00:27
-
راهحل: خلاصهسازی متن 04:50
-
نکته حرفهای: تولید متن 03:38
-
Embedding های سند 02:59
-
شباهت کسینوسی 05:05
-
شباهت اسناد با Embedding ها 02:00
-
دمو: استخراج ویژگی و Embedding ها 10:17
-
دمو: کسینوس و شباهت اسناد 05:58
-
نکته حرفهای: تابع توصیهگر 12:55
-
تکلیف: شباهت اسناد 00:48
-
راهحل: شباهت اسناد 06:10
-
نکات کلیدی 02:52
-
مرور NLP و نمودار جریان 05:26
-
گامهای بعدی NLP 08:55
مشخصات آموزش
پردازش زبان طبیعی در پایتون (دوره جدید 2025)
- تاریخ به روز رسانی: 1404/09/07
- سطح دوره:متوسط
- تعداد درس:163
- مدت زمان :12:38:25
- حجم :4.84GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy