دوره آموزشی
آموزش های یودمی
دوبله زبان فارسی

اسپارک 3 روی پلتفرم گوگل کلود - سطح مبتدی تا پیشرفته

اسپارک 3 روی پلتفرم گوگل کلود - سطح مبتدی تا پیشرفته

✅ سرفصل و جزئیات آموزش

آنچه یاد خواهید گرفت:

  • درک اصول آپاچی اسپارک 3، شامل معماری و کامپوننت‌ها
  • توسعه و استقرار PySpark Jobs در Dataproc روی GCP شامل راه‌اندازی خوشه و مدیریت منابع
  • کسب تجربه عملی در استفاده از اسپارک 3 برای پردازش داده‌ دسته‌ای پیشرفته، یادگیری ماشین و تحلیل‌های بلادرنگ
  • بهترین شیوه‌ها برای بهینه‌سازی عملکرد اسپارک 3 روی GCP شامل مقیاس‌بندی خودکار، تیونینگ دقیق و یکپارچه‌سازی با دیگر کامپوننت‌های GCP

توضیحات دوره

آیا به دنبال ورود به پردازش و تحلیل کلان داده‌ با آپاچی اسپارک و گوگل کلود هستید؟ این دوره به شما کمک می‌کند تا PySpark 3.3 را به‌ خوبی یاد بگیرید و از تمام پتانسیل آن برای پردازش حجم‌های زیاد داده‌ در یک محیط توزیع‌ شده استفاده کنید. شما یاد خواهید گرفت که چگونه job های پردازش داده کارآمد، مقیاس‌پذیر و مقاوم بسازید و چگونه آنها را در موارد زیر اعمال کنید:

  • تبدیلات دیتافریم با API‌s دیتافریم
  • SparkSQL
  • استقرار Jobs اسپارک همانطور که در سناریوهای واقعی انجام می‌شود.
  • یکپارچه‌سازی Jobs اسپارک با دیگر کامپوننت‌ها در GCP
  • پیاده‌سازی یوزکیس‌های یادگیری ماشین بلادرنگ با ساخت سیستم پیشنهاد محصول

این دوره برای مهندسان داده، تحلیلگران داده، دانشمندان داده و کسی که به پردازش کلان داده‌ با آپاچی اسپارک و گوگل کلود علاقه‌مند است طراحی شده است. همچنین مناسب برای دانشجویان و حرفه‌ای‌هایی است که می‌خواهند مهارت‌های خود را در پردازش کلان داده‌ و تحلیل‌ها با استفاده از PySpark و فناوری‌های گوگل کلود تقویت کنند.

چرا این دوره را انتخاب کنید؟

در این دوره، شما تجربه عملی در طراحی، ساخت و استقرار پایپ‌لاین‌های پردازش کلان داده‌ با استفاده از PySpark روی گوگل کلود خواهید داشت. شما یاد خواهید گرفت که چگونه مجموعه داده‌های بزرگ را به‌ صورت موازی به موثرترین شکل پردازش کنید بدون اینکه نیاز به نصب یا اجرای چیزی روی کامپیوتر محلی خود داشته باشید.

در پایان دوره، شما مهارت‌ها و اعتمادبه‌نفس لازم برای رسیدگی به مشکلات واقعی پردازش کلان داده‌ و ارائه راه‌حل‌های با کیفیت بالا با استفاده از PySpark و دیگر فناوری‌های گوگل کلود را خواهید داشت.

چه شما مهندس داده، تحلیلگر داده یا دانشمند داده‌ باشید که به دنبال پیشرفت مهارت‌هایتان هستید، این دوره جامع شما را با مهارت‌ها و دانش مورد نیاز برای پردازش حجم‌های زیاد داده‌ با استفاده از PySpark و گوگل کلود تجهیز خواهد کرد.

علاوه بر این، با بخشی پایانی اختصاصی به سوالات و نکات مصاحبه، شما برای موفقیت در مصاحبه‌های بعدی خود در حوزه مهندسی داده یا کلان داده‌ به‌خوبی آماده خواهید بود.

این دوره برای چه کسانی مناسب است؟

  • مهندسان داده یا تحلیلگران داده که می‌خواهند یاد بگیرند چگونه از اسپارک 3 در پلتفرم گوگل کلود (GCP) برای پردازش و تحلیل کلان داده‌ استفاده کنند.
  • توسعه‌دهندگان نرم‌افزار که می‌خواهند اسپارک 3 را با اپلیکیشن‌ها یا گردش‌کارهای خود در GCP یکپارچه کنند.
  • دانشمندان داده که می‌خواهند از قابلیت‌های یادگیری ماشین اسپارک 3 در GCP برای ساخت و استقرار مدل‌های پیش‌بینانه استفاده کنند.
  • کسی که می‌خواهد سفر خود را با اسپارک 3 آغاز کند.

اسپارک 3 روی پلتفرم گوگل کلود - سطح مبتدی تا پیشرفته

  • مقدمه و بررسی دوره 02:35
  • راه‌اندازی حساب GCP آزمایشی 02:24
  • نصب و راه‌اندازی Gcloud SDK 03:09
  • آشنایی با Dataproc در GCP 02:58
  • بررسی معماری اسپارک 02:44
  • دریاچه داده‌ در مقابل انبار داده‌ 02:39
  • نقش اسپارک در اکوسیستم کلان داده 04:39
  • بررسی APIs اسپارک 04:02
  • چه ویژگی جدیدی در اسپارک 3 وجود دارد؟ 01:31
  • آیا باید اسپارک 2023 را یاد بگیریم؟ 01:30
  • مقدمه بخش 00:59
  • لابراتوار - ایجاد خوشه Dataproc 06:10
  • لابراتوار - بررسی Jupyter Notebook و کامپوننت‌های مختلف 02:55
  • لابراتوار - عملیات‌های اولیه دیتافریم در PySpark 15:32
  • لابراتوار - Typecasting و استخراج ستون timestamp 13:20
  • لابراتوارها - تجمیع‌های دیتافریم 10:00
  • تکلیف درباره تجمیع‌های دیتافریم None
  • تبدیلات و اکشن‌ها در اسپارک 02:40
  • لابراتوار - تبدیلات پیشرفته با استفاده از توابع Window 17:40
  • لابراتوار - عملیات‌های پنجره کشویی 10:41
  • لابراتوار - نوشتن داده‌ تبدیل‌ شده به یک سینک - GCS و BigQuery 09:42
  • لابراتوار - استفاده از Spark-Submit برای ارسال jobs به خوشه‌های Dataproc 06:34
  • آشنایی با SparkSql 03:07
  • انواع مختلف جداول در اسپارک 01:49
  • لابراتوار - ایجاد جداول برای SparkSql 08:35
  • لابراتوار - توابع Window تحلیلی و ایجاد جداول دائمی 16:27
  • لابراتوار - انجام جوین‌ها روی دیتافریم‌ها 13:25
  • پارتیشن‌ها در دیتافریم‌های اسپارک چه هستند؟ 02:45
  • لابراتوار - انجام پارتیشن‌بندی مجدد دیتافریم‌ها 05:35
  • شافلینگ داده‌ در جوین‌ها 02:33
  • لابراتوار - توابع تعریف شده توسط کاربر در اسپارک 08:36
  • catalyst optimizer در اسپارک چیست؟ 02:58
  • کش و پایداری داده در اسپارک 04:01
  • مقیاس‌بندی خودکار در اسپارک و Dataproc چیست؟ 01:54
  • لابراتوار - اعمال سیاست‌های مقیاس‌بندی خودکار در خوشه‌های Dataproc 05:24
  • آشنایی با گردش‌کارهای Dataproc 01:39
  • لابراتوار - اجرای گردش‌کارهای GCP 04:51
  • لابراتوار - زمانبندی ابری برای خودکارسازی اجرای گردش‌کار 08:49
  • چک‌پوینت کردن در اسپارک چیست؟ 01:22
  • جوین‌ برودکست چیست؟ 03:05
  • لابراتوار - راه‌اندازی سیاست‌های هشداردهی برای Jobs اسپارک 04:21
  • مقدمه پروژه 01:28
  • لابراتوار - راه‌اندازی نمونه و پایگاه داده MySql روی GCP 03:51
  • لابراتوار - جذب داده‌ به MySql 03:46
  • کارگاه - راه‌اندازی Dataproc با مقداردهی اولیه اکشن‌ها 02:53
  • لابراتوار تکلیف - راه‌اندازی اتصال‌پذیری از PySpark به پایگاه داده MySql 06:33
  • لابراتوار تکلیف - انجام تبدیلات با استفاده از PySpark 05:47
  • لابراتوار - راه‌اندازی گردش‌کارها برای اجرای پایپ‌لاین end-to-end 05:52
  • مقدمه بخش 00:36
  • بررسی PubSub Lite 01:52
  • Tumbling Windows چیست؟ 02:49
  • واترمارک کردن چیست؟ 03:47
  • پنجره‌های کشویی چه هستند؟ 02:50
  • لابراتوار - ایجاد رزرو PubSub Lite 03:32
  • لابراتوار - انتشار داده‌ در PubSub و تست با استفاده از PySpark 06:45
  • لابراتوار - پیاده‌سازی Tumbling Windows 04:59
  • لابراتوار - پیاده‌سازی Tumbling Windows با واترمارک کردن 03:31
  • لابراتوار - پیاده‌سازی پنجره‌های کشویی 03:31
  • بررسی جوین کردن دیتافریم استریمینگ 03:12
  • لابراتوار - جوین کردن دیتافریم استریمینگ با دیتافریم استاتیک 03:37
  • لابراتوار - جوین کردن دو دیتافریم استریمینگ 05:24
  • لابراتوار - استفاده از واترمارک کردن در جوین‌های استریمینگ 03:39
  • بررسی یوزکیس آن 02:54
  • لابراتوار - آموزش مدل با استفاده از کتابخانه یادگیری ماشین و بررسی کد 06:28
  • لابراتوار - بررسی کد و انتشار داده‌ 04:13
  • لابراتوار - مدل پیشنهاد محصول بلادرنگ در عمل 02:03
  • مقدمه و نکات 01:11
  • سوالات مصاحبه پردازش داده دسته‌ای - بخش 1 03:21
  • سوالات مصاحبه پردازش داده‌ دسته‌ای - بخش 2 03:26
  • سوالات مصاحبه پردازش داده دسته‌ای - بخش 3 02:46
  • سوالات مصاحبه پردازش داده‌ بلادرنگ - بخش 1 01:37
  • سوالات مصاحبه پردازش داده‌ بلادرنگ - بخش 2 02:36

2,212,000 442,400 تومان

مشخصات آموزش

اسپارک 3 روی پلتفرم گوگل کلود - سطح مبتدی تا پیشرفته

  • تاریخ به روز رسانی: 1404/06/21
  • سطح دوره:مقدماتی
  • تعداد درس:72
  • مدت زمان :05:36:29
  • حجم :2.27GB
  • زبان:دوبله زبان فارسی
  • دوره آموزشی:AI Academy

آموزش های مرتبط

The Great Courses
1,415,000 283,000 تومان
  • زمان: 03:35:08
  • تعداد درس: 36
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,560,000 312,000 تومان
  • زمان: 03:57:22
  • تعداد درس: 18
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
5,404,500 1,080,900 تومان
  • زمان: 13:41:56
  • تعداد درس: 80
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,099,000 219,800 تومان
  • زمان: 02:47:05
  • تعداد درس: 28
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
490,000 98,000 تومان
  • زمان: 39:58
  • تعداد درس: 19
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
4,345,000 869,000 تومان
  • زمان: 11:00:35
  • تعداد درس: 21
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
7,373,000 1,474,600 تومان
  • زمان: 18:40:29
  • تعداد درس: 154
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
697,500 139,500 تومان
  • زمان: 01:46:47
  • تعداد درس: 28
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
822,500 164,500 تومان
  • زمان: 02:05:25
  • تعداد درس: 12
  • سطح دوره:
  • زبان: دوبله فارسی

آیا سوالی دارید؟

ما به شما کمک خواهیم کرد تا شغل و رشد خود را افزایش دهید.
امروز با ما تماس بگیرید