غلبه بر مشکلات رایج عملکرد در Apache Spark
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- سه دلیل اصلی مشکلات عملکرد در Apache Spark
- چگونه مشکلات عملکرد ناشی از Shuffle در Apache Spark را رفع کنیم؟
- چگونه مشکلات عملکرد ناشی از Skew در Apache Spark را رفع کنیم؟
- چگونه مشکلات عملکرد ناشی از Spill در Apache Spark را رفع کنیم؟
پیشنیازهای دوره
- برنامهنویسی Apache Spark
توضیحات دوره
Spark یک فریمورک قدرتمند برای پردازش موازی مجموعه دادههای بزرگ است. اما، با معماری پیچیده، مشکلات عملکردی مکرر نیز به وجود میآید.
بر اساس تجربه مدرس، گشتن به دنبال منبعی آنلاین که با کلماتی بیان شده باشد که شما به طور کامل کارکردهای داخلی Spark و چگونگی رسیدگی به این مسائل را درک کنید، میتواند خستهکننده باشد. بنابراین، او این دوره را ایجاد کرد!
این یک دوره کدنویسی همزمان نیست. این دوره فرض میکند که شما از قبل میدانید چگونه در Spark کدنویسی کنید. در اینجا، در مورد چگونگی حل مشکلات عملکردی که در طول مسیر توسعه خود با آنها مواجه میشوید صحبت میشود! تمام تئوریها بررسی خواهند شد و شما گامهای عملی برای حل مشکلات عملکرد خود خواهید داشت.
در این دوره، موارد زیر پوشش داده خواهند شد:
- معماری Apache Spark
- انواع حالتهای استقرار در Apache Spark
- ساختار Jobها در Apache Spark
- چگونگی مدیریت سه دغدغه اصلی عملکرد در Spark
اگر هنوز نمیدانید چگونه در Spark کدنویسی کنید، میتوانید به دوره فشرده 60 دقیقهای مدرس در PySpark، در Udemy بپیوندید.
بیایید شروع به درک این موضوع کنیم که چرا اسکریپتهای شما آنطور که انتظار دارید عمل نمیکنند و مشکلات عملکرد را با هم حل کنیم. Shuffle، Skew و Spill پس از این دوره، دغدغههای گذشته خواهند بود!
این دوره برای چه کسانی مناسب است؟
- توسعهدهندگان Spark که به دنبال بهبود عملکرد اسکریپتهای خود هستند.
غلبه بر مشکلات رایج عملکرد در Apache Spark
-
مقدمه 01:01
-
معماری Spark 02:33
-
حالتهای استقرار در Spark 02:55
-
بررسی حالتهای استقرار Cluster در مقابل Client 00:56
-
Jobs ،Stages و Tasks در Spark 03:56
-
مقدمهای بر دغدغههای عملکرد در Spark 01:09
-
Shuffle چیست؟ 01:47
-
نگاهی عمیقتر به Shuffle 02:11
-
چگونه Shuffle را شناسایی کنیم؟ 01:19
-
رفع Shuffle: استفاده از Broadcast Joins 01:19
-
رفع Shuffle: استفاده از ()ReduceBy 02:58
-
رفع Shuffle: از طریق پیکربندی 01:35
-
Skew چیست؟ 01:55
-
اطلاعات بیشتر درباره Skew 01:26
-
چگونه Skew را شناسایی کنیم؟ 01:44
-
چگونه Skew را رفع کنیم؟ 04:13
-
Spill چیست؟ 01:29
-
چگونه از Spill جلوگیری کنیم؟ 01:29
-
جمعبندی! 01:01
مشخصات آموزش
غلبه بر مشکلات رایج عملکرد در Apache Spark
- تاریخ به روز رسانی: 1404/10/04
- سطح دوره:مقدماتی
- تعداد درس:19
- مدت زمان :39:58
- حجم :227.0MB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy