گواهینامه Databricks Certified Data Engineer Associate - بوت‌کمپ

معرفی
سرفصل

✅ سرفصل و جزئیات آموزش

آنچه یاد خواهید گرفت:

همه مباحث مهم برای قبولی در آزمون گواهینامه - همراه با تمرینات عملی عمیق
درک مفاهیم کلیدی مانند Lakehouse Federation و Lakeflow Connect و معماری Medallion
تمرین‌های قدرتمند با Unity Catalog و Volumes و Metastore و Catalog UDFs و utils
دوره‌ فشرده کلان داده PySpark - از مبانی تا یوزکیس‌های واقعی
تسلط به استریمینگ ساختاریافته اسپارک با استفاده از Auto Loader برای جذب داده‌ بلادرنگ به صورت افزایشی
درک معماری کامل دریاچه دلتا، مزایا و نحوه پیاده‌سازی و تیونینگ آن برای عملکرد بهتر
استقرار و مدیریت انبارهای SQL در Databricks با کوئری‌های پارامتری، هشدارها و کش کردن کوئری‌ها
ساخت پایپ‌لاین‌های استریمینگ با استفاده از جداول استریمینگ، Materialized Views و پایپ‌لاین‌های اعلامی Lakeflow
پیاده‌سازی SCDs (تغییر آهسته ابعاد) و افزودن کنترل‌های کیفیت داده با جداول لایو دلتا
تسلط به Lakeflow Jobs برای ارکستراسیون حرفه‌ای پایپ‌لاین‌های ETL
درک و اعمال امنیت سطح سطر، ماسک کردن داده‌ و اشتراک‌گذاری دلتا برای دسترسی ایمن به داده‌
یادگیری نسخه‌‌سازی داده، Time Travel و ZORDERING، کلون‌سازی و خوشه‌بندی Liquid

پیش‌نیازهای دوره

آشنایی اولیه با SQL الزامی است.
آشنایی اولیه با برنامه‌نویسی پایتون الزامی است.
هیچ آشنایی قبلی با DATABRICKS نیاز نیست - همه مطالب از ابتدا آموزش داده می‌شود.

توضیحات دوره

آیا آماده‌اید که تبدیل به مهندس داده در DATABRICKS شوید؟

چه شما مبتدی باشید یا یک حرفه‌ای فعال که می‌خواهد سطح مهارت‌های خود را ارتقا دهد، این دوره با رویکردی عملی، کاربردی و جذاب شما را گام‌به‌گام راهنمایی می‌کند.

با تمرکز روی بخش‌های زیر مهارت‌های عملی قوی کسب می‌کنید:

معماری Lakehouse و Lakehouse Federation و Lakeflow Connect - درک نحوه مدیریت داده‌ ساختاریافته و غیرساختاریافته در Databricks و نحوه برقراری ارتباط بی‌وقفه با منابع خارجی از طریق Lakehouse Federation
Unity Catalog و Metastore و Volumes و UDFs - یادگیری نحوه مدیریت داده‌، مجوزها و کاتالوگ‌ها به صورت کارآمد با استفاده از ویژگی‌های داخلی حاکمیت Databricks
PySpark برای کلان داده - تسلط به PySpark با یوزکیس‌های واقعی، تبدیل‌ها، اکشن‌ها، جوین‌ها و موارد دیگر، از دیدگاه مهندس داده
استریمینگ ساختاریافته + Autoloader - ساخت پایپ‌لاین‌های بلادرنگ با استفاده از استریمینگ اسپارک و یادگیری نحوه عملکرد Autoloader در مدیریت فایل‌ها در ذخیره‌سازی ابری
معماری دریاچه دلتا - بررسی عمیق ویژگی‌های دلتا مانند تراکنش‌های ACID، مفهوم time travel، تکامل اسکیما و پرفورمنس تیونینگ
انبارهای SQL در Databricks - یادگیری نحوه نوشتن کوئری‌های پارامتری، زمانبندی داشبوردها و تنظیم هشدارها با استفاده از انبارهای SQL
پایپ‌لاین‌های اعلامی LakeFlow - کار با جداول استریمینگ، Materialized Views و ساخت پایپ‌لاین‌های کم‌ کد داده
جداول لایو دلتا (DLT) - ساخت پایپ‌لاین‌های مقاوم با پیاده‌سازی SCD، کنترل کیفیت داده، انتظارات و نظارت
مدیریت ETL با LakeFlow Jobs - زمانبندی، نظارت و مدیریت کامل پایپ‌لاین‌ها با LakeFlow Jobs
امنیت و اشتراک‌گذاری - اعمال امنیت سطح سطر، ماسک کردن داده و بررسی اشتراک‌گذاری دلتا برای همکاری ایمن و مقیاس‌پذیر

آنچه این دوره را متمایز می‌کند؟

دروس جذاب - شما جلسات خسته‌کننده و نظری نخواهید داشت. ما هر مفهوم را به زبان ساده و مناسب برای مبتدیان، با مثال‌های عملی و ویژوال‌ها توضیح می‌دهیم.
ما صرفا سطحی شرح نمی‌دهیم، بلکه دلیل و نحوه هر ویژگی را توضیح می‌دهیم.
تمرکز عملی قوی - از مرحله ساخت پایپ‌لاین‌ها تا نوت‌بوک‌ها و انبار داده‌، راه‌حل‌های واقعی را گام‌به‌گام می‌سازید، همان‌طور که مهندس داده در Databricks انجام می‌دهد.

سلب مسئولیت - این دوره به صورت مستقل ساخته شده و توسط شرکت Databricks تایید نمی‌شود. تمام محتوا، شامل توضیحات و مباحث تمرین، اصلی و صرفاً برای آموزش است و سوالات آزمون گواهینامه واقعی در آن قرار ندارد. منابع بر اساس مستندات عمومی، سناریوهای واقعی و تجربیات شخصی تهیه شده است.

این دوره برای چه کسانی مناسب است؟