اسپارک، هدوپ و Snowflake برای مهندسی داده
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- ایجاد پایپلاینهای داده مقیاسپذیر (هدوپ، اسپارک، Snowflake و Databricks) برای مدیریت کارآمد داده
- بهینهسازی مهندسی داده با خوشهبندی و مقیاسبندی برای بهبود عملکرد و استفاده از منابع
- ساخت راهحلهای یادگیری ماشین (PySpark و MLFlow) در Databricks برای توسعه و استقرار یکنواخت مدل
- پیادهسازی شیوههای DataOps و DevOps برای یکپارچهسازی و استقرار مداوم (CI و CD) اپلیکیشنهای دادهمحور، از جمله اتوماسیون فرآیندها
توضیحات دوره
این دوره عمدتاً برای دانشجویان سالهای اول و دوم رشتههای مهندسی یا علوم، به همراه دانشآموزان دبیرستان و متخصصانی طراحی شده است که به برنامهنویسی علاقهمند هستند. مهارتهای لازم برای ساخت پایپلاینهای داده کارآمد و مقیاسپذیر را کسب کنید. به بررسی پلتفرمهای اساسی مهندسی داده (هدوپ، اسپارک و Snowflake) بپردازید و یاد بگیرید چگونه آنها را بهینهسازی و مدیریت کنید. با Databricks، یک پلتفرم قدرتمند برای اجرای تحلیل داده و تسکهای یادگیری ماشین، آشنا شوید و مهارتهای علم داده پایتون خود را با PySpark تقویت کنید. در نهایت، با مفاهیم کلیدی MLflow، یک پلتفرم متن باز برای مدیریت چرخه عمر end-to-end یادگیری ماشین، آشنا شوید و یاد بگیرید چگونه آن را با Databricks یکپارچهسازی کنید.
این دوره برای دانشجویانی که میخواهند در زمینه علم داده یا مهندسی داده پیشرفت کنند یا شغلی را در این زمینهها دنبال کنند یا برای توسعهدهندگان نرمافزار یا مهندسانی که میخواهند مجموعه مهارتهای مدیریت داده خود را گسترش دهند، طراحی شده است،. علاوه بر فناوریهایی که یاد میگیرید، متدولوژیهایی را نیز یاد خواهید گرفت که به شما در تقویت مهارتهای مدیریت پروژه و گردشکار برای مهندسی داده کمک خواهند کرد که شامل اعمال متدولوژیها و بهترین شیوههای کایزن، DevOps و DataOps است.
این دوره جامع با آزمونهایی برای محک زدن دانش شما در طول دوره، شما را در مسیر یادگیری برای تبدیل شدن به یک مهندس داده توانمند و آماده شدن برای مواجهه با چالشهای دنیای داده محور امروزی کمک و راهنمایی خواهد کرد.
اسپارک، هدوپ و Snowflake برای مهندسی داده
-
با هممدرس خود آشنا شوید: کندی بیهارمن 0:35
-
با هممدرس خود آشنا شوید: نوح گیفت 1:16
-
بررسی پلتفرمهای کلانداده 1:55
-
شروع کار با هدوپ 1:15
-
شروع کار با اسپارک 1:37
-
آشنایی با مجموعههای داده توزیعشده انعطافپذیر (RDD) 2:19
-
دموی مجموعههای توزیعشده انعطافپذیر (RDD) 4:08
-
آشنایی با اسپارک اس کیوال 1:53
-
دموی داده PySpark: قسمت 1 3:05
-
دموی داده PySpark: قسمت 2 7:08
-
به پلتفرمهای مهندسی داده با پایتون خوش آمدید! None
-
هدوپ آپاچی چیست؟ None
-
اسپارک آپاچی چیست؟ None
-
استفاده از اسپارک آپاچی در Azure Databricks (اختیاری) None
-
انتخاب بین هدوپ و اسپارک None
-
RDDها چه هستند؟ None
-
شروع کار: ایجاد RDDها با PySpark None
-
اسپارک اس کیوال، دیتافریمها و مجموعههای داده None
-
PySpark و اسپارک اس کیوال None
-
اسنوفلک چیست؟ 2:29
-
لایههای Snowflake 2:04
-
رابط کاربری وب Snowflake 3:47
-
ناوبری Snowflake 3:33
-
ایجاد یک جدول در Snowflake 5:28
-
انبارهای Snowflake 3:45
-
نوشتن در Snowflake 3:24
-
خواندن از Snowflake 2:36
-
دسترسی به Snowflake None
-
View دقیق در Snowflake None
-
Snowsight: رابط وب Snowflake None
-
کار با انبارها None
-
مستندات کانکتور پایتون None
-
دسترسی به Databricks 0:32
-
نوتبوکهای اسپارک با Databricks 4:44
-
استفاده از داده با Databricks 4:58
-
کار با فضاهای کاری در Databricks 3:19
-
قابلیتهای پیشرفته Databricks 1:51
-
آشنایی با PySpark در Databricks 7:08
-
بررسی ویژگیهای Azure Databricks 3:33
-
استفاده از DBFS برای گردش کار AutoML 4:28
-
بارگذاری، رجیستر و استقرار مدلهای یادگیری ماشین 2:37
-
رجیستری مدل Databricks 2:43
-
ارائه مدل در Databricks 2:22
-
MLOps چیست؟ 12:52
-
بررسی فریمورکهای متن باز MLFlow 5:47
-
اجرای MLFlow با Databricks 6:20
-
End to End Databricks MLFlow 4:14
-
لاگ کردن خودکار Databricks با MLFlow 4:02
-
Azure Databricks چیست؟ None
-
آشنایی با یادگیری ماشین در Databricks None
-
DBFS (سیستم فایل Databricks) چیست؟ None
-
رایانش بدون سرور با Databricks None
-
فرآیند MLOps در Azure Databricks None
-
اجرای پروژههای MLFlow در Azure Databricks None
-
لاگ کردن خودکار Databricks None
-
متدولوژی کایزن برای داده 4:06
-
معرفی GitHub CodeSpaces 9:13
-
کامپایل پایتون در GitHub CodeSpaces 18:12
-
بررسی Sagemaker Studio Lab 28:59
-
مسترکلاس Pytest (اختیاری) 2:46:23
-
DevOps چیست؟ 2:28
-
مفاهیم کلیدی DevOps 35:47
-
بررسی یکپارچهسازی مداوم 32:14
-
ساخت یک NLP با پایتون در Cloud9 43:13
-
ساخت یک میکروسرویس FastAPI کانتینری با استقرار مداوم 43:39
-
استقرار مداوم هوگو در AWS 18:57
-
تحویل مداوم مبتنی بر کانتینر 8:49
-
DataOps چیست؟ 1:23
-
DataOps و MLOps با Snowflake 1:01:45
-
ساخت پایپلاینهای ابری با توابع پلهای و لامبدا 16:46
-
Data Lake چیست؟ 2:18
-
انبار داده در مقابل فروشگاه ویژگی 2:22
-
چالشهای کلانداده 1:05
-
انواع پردازش کلانداده 1:21
-
پایپلاین مهندسی داده واقعی 2:09
-
حلقه بازخورد داده 0:57
-
بررسی GitHub Codespaces None
-
شروع کار با Amazon SageMaker Studio Lab None
-
آموزش MLOps در مقیاس با گیت هاب (اختیاری) None
-
شروع کار با DevOps و رایانش ابری None
-
مزایای فناوریهای ETL بدون سرور None
-
گامهای بعدی None
مشخصات آموزش
اسپارک، هدوپ و Snowflake برای مهندسی داده
- تاریخ به روز رسانی: 1404/06/14
- سطح دوره:پیشرفته
- تعداد درس:82
- مدت زمان :10:25:53
- حجم :1.34GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy