اسپارک 3 روی پلتفرم گوگل کلود - سطح مبتدی تا پیشرفته
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- درک اصول آپاچی اسپارک 3، شامل معماری و کامپوننتها
- توسعه و استقرار PySpark Jobs در Dataproc روی GCP شامل راهاندازی خوشه و مدیریت منابع
- کسب تجربه عملی در استفاده از اسپارک 3 برای پردازش داده دستهای پیشرفته، یادگیری ماشین و تحلیلهای بلادرنگ
- بهترین شیوهها برای بهینهسازی عملکرد اسپارک 3 روی GCP شامل مقیاسبندی خودکار، تیونینگ دقیق و یکپارچهسازی با دیگر کامپوننتهای GCP
توضیحات دوره
آیا به دنبال ورود به پردازش و تحلیل کلان داده با آپاچی اسپارک و گوگل کلود هستید؟ این دوره به شما کمک میکند تا PySpark 3.3 را به خوبی یاد بگیرید و از تمام پتانسیل آن برای پردازش حجمهای زیاد داده در یک محیط توزیع شده استفاده کنید. شما یاد خواهید گرفت که چگونه job های پردازش داده کارآمد، مقیاسپذیر و مقاوم بسازید و چگونه آنها را در موارد زیر اعمال کنید:
- تبدیلات دیتافریم با APIs دیتافریم
- SparkSQL
- استقرار Jobs اسپارک همانطور که در سناریوهای واقعی انجام میشود.
- یکپارچهسازی Jobs اسپارک با دیگر کامپوننتها در GCP
- پیادهسازی یوزکیسهای یادگیری ماشین بلادرنگ با ساخت سیستم پیشنهاد محصول
این دوره برای مهندسان داده، تحلیلگران داده، دانشمندان داده و کسی که به پردازش کلان داده با آپاچی اسپارک و گوگل کلود علاقهمند است طراحی شده است. همچنین مناسب برای دانشجویان و حرفهایهایی است که میخواهند مهارتهای خود را در پردازش کلان داده و تحلیلها با استفاده از PySpark و فناوریهای گوگل کلود تقویت کنند.
چرا این دوره را انتخاب کنید؟
در این دوره، شما تجربه عملی در طراحی، ساخت و استقرار پایپلاینهای پردازش کلان داده با استفاده از PySpark روی گوگل کلود خواهید داشت. شما یاد خواهید گرفت که چگونه مجموعه دادههای بزرگ را به صورت موازی به موثرترین شکل پردازش کنید بدون اینکه نیاز به نصب یا اجرای چیزی روی کامپیوتر محلی خود داشته باشید.
در پایان دوره، شما مهارتها و اعتمادبهنفس لازم برای رسیدگی به مشکلات واقعی پردازش کلان داده و ارائه راهحلهای با کیفیت بالا با استفاده از PySpark و دیگر فناوریهای گوگل کلود را خواهید داشت.
چه شما مهندس داده، تحلیلگر داده یا دانشمند داده باشید که به دنبال پیشرفت مهارتهایتان هستید، این دوره جامع شما را با مهارتها و دانش مورد نیاز برای پردازش حجمهای زیاد داده با استفاده از PySpark و گوگل کلود تجهیز خواهد کرد.
علاوه بر این، با بخشی پایانی اختصاصی به سوالات و نکات مصاحبه، شما برای موفقیت در مصاحبههای بعدی خود در حوزه مهندسی داده یا کلان داده بهخوبی آماده خواهید بود.
این دوره برای چه کسانی مناسب است؟
- مهندسان داده یا تحلیلگران داده که میخواهند یاد بگیرند چگونه از اسپارک 3 در پلتفرم گوگل کلود (GCP) برای پردازش و تحلیل کلان داده استفاده کنند.
- توسعهدهندگان نرمافزار که میخواهند اسپارک 3 را با اپلیکیشنها یا گردشکارهای خود در GCP یکپارچه کنند.
- دانشمندان داده که میخواهند از قابلیتهای یادگیری ماشین اسپارک 3 در GCP برای ساخت و استقرار مدلهای پیشبینانه استفاده کنند.
- کسی که میخواهد سفر خود را با اسپارک 3 آغاز کند.
اسپارک 3 روی پلتفرم گوگل کلود - سطح مبتدی تا پیشرفته
-
مقدمه و بررسی دوره 02:35
-
راهاندازی حساب GCP آزمایشی 02:24
-
نصب و راهاندازی Gcloud SDK 03:09
-
آشنایی با Dataproc در GCP 02:58
-
بررسی معماری اسپارک 02:44
-
دریاچه داده در مقابل انبار داده 02:39
-
نقش اسپارک در اکوسیستم کلان داده 04:39
-
بررسی APIs اسپارک 04:02
-
چه ویژگی جدیدی در اسپارک 3 وجود دارد؟ 01:31
-
آیا باید اسپارک 2023 را یاد بگیریم؟ 01:30
-
مقدمه بخش 00:59
-
لابراتوار - ایجاد خوشه Dataproc 06:10
-
لابراتوار - بررسی Jupyter Notebook و کامپوننتهای مختلف 02:55
-
لابراتوار - عملیاتهای اولیه دیتافریم در PySpark 15:32
-
لابراتوار - Typecasting و استخراج ستون timestamp 13:20
-
لابراتوارها - تجمیعهای دیتافریم 10:00
-
تکلیف درباره تجمیعهای دیتافریم None
-
تبدیلات و اکشنها در اسپارک 02:40
-
لابراتوار - تبدیلات پیشرفته با استفاده از توابع Window 17:40
-
لابراتوار - عملیاتهای پنجره کشویی 10:41
-
لابراتوار - نوشتن داده تبدیل شده به یک سینک - GCS و BigQuery 09:42
-
لابراتوار - استفاده از Spark-Submit برای ارسال jobs به خوشههای Dataproc 06:34
-
آشنایی با SparkSql 03:07
-
انواع مختلف جداول در اسپارک 01:49
-
لابراتوار - ایجاد جداول برای SparkSql 08:35
-
لابراتوار - توابع Window تحلیلی و ایجاد جداول دائمی 16:27
-
لابراتوار - انجام جوینها روی دیتافریمها 13:25
-
پارتیشنها در دیتافریمهای اسپارک چه هستند؟ 02:45
-
لابراتوار - انجام پارتیشنبندی مجدد دیتافریمها 05:35
-
شافلینگ داده در جوینها 02:33
-
لابراتوار - توابع تعریف شده توسط کاربر در اسپارک 08:36
-
catalyst optimizer در اسپارک چیست؟ 02:58
-
کش و پایداری داده در اسپارک 04:01
-
مقیاسبندی خودکار در اسپارک و Dataproc چیست؟ 01:54
-
لابراتوار - اعمال سیاستهای مقیاسبندی خودکار در خوشههای Dataproc 05:24
-
آشنایی با گردشکارهای Dataproc 01:39
-
لابراتوار - اجرای گردشکارهای GCP 04:51
-
لابراتوار - زمانبندی ابری برای خودکارسازی اجرای گردشکار 08:49
-
چکپوینت کردن در اسپارک چیست؟ 01:22
-
جوین برودکست چیست؟ 03:05
-
لابراتوار - راهاندازی سیاستهای هشداردهی برای Jobs اسپارک 04:21
-
مقدمه پروژه 01:28
-
لابراتوار - راهاندازی نمونه و پایگاه داده MySql روی GCP 03:51
-
لابراتوار - جذب داده به MySql 03:46
-
کارگاه - راهاندازی Dataproc با مقداردهی اولیه اکشنها 02:53
-
لابراتوار تکلیف - راهاندازی اتصالپذیری از PySpark به پایگاه داده MySql 06:33
-
لابراتوار تکلیف - انجام تبدیلات با استفاده از PySpark 05:47
-
لابراتوار - راهاندازی گردشکارها برای اجرای پایپلاین end-to-end 05:52
-
مقدمه بخش 00:36
-
بررسی PubSub Lite 01:52
-
Tumbling Windows چیست؟ 02:49
-
واترمارک کردن چیست؟ 03:47
-
پنجرههای کشویی چه هستند؟ 02:50
-
لابراتوار - ایجاد رزرو PubSub Lite 03:32
-
لابراتوار - انتشار داده در PubSub و تست با استفاده از PySpark 06:45
-
لابراتوار - پیادهسازی Tumbling Windows 04:59
-
لابراتوار - پیادهسازی Tumbling Windows با واترمارک کردن 03:31
-
لابراتوار - پیادهسازی پنجرههای کشویی 03:31
-
بررسی جوین کردن دیتافریم استریمینگ 03:12
-
لابراتوار - جوین کردن دیتافریم استریمینگ با دیتافریم استاتیک 03:37
-
لابراتوار - جوین کردن دو دیتافریم استریمینگ 05:24
-
لابراتوار - استفاده از واترمارک کردن در جوینهای استریمینگ 03:39
-
بررسی یوزکیس آن 02:54
-
لابراتوار - آموزش مدل با استفاده از کتابخانه یادگیری ماشین و بررسی کد 06:28
-
لابراتوار - بررسی کد و انتشار داده 04:13
-
لابراتوار - مدل پیشنهاد محصول بلادرنگ در عمل 02:03
-
مقدمه و نکات 01:11
-
سوالات مصاحبه پردازش داده دستهای - بخش 1 03:21
-
سوالات مصاحبه پردازش داده دستهای - بخش 2 03:26
-
سوالات مصاحبه پردازش داده دستهای - بخش 3 02:46
-
سوالات مصاحبه پردازش داده بلادرنگ - بخش 1 01:37
-
سوالات مصاحبه پردازش داده بلادرنگ - بخش 2 02:36
مشخصات آموزش
اسپارک 3 روی پلتفرم گوگل کلود - سطح مبتدی تا پیشرفته
- تاریخ به روز رسانی: 1404/06/21
- سطح دوره:مقدماتی
- تعداد درس:72
- مدت زمان :05:36:29
- حجم :2.27GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy