آموزش dbt روی Databricks
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- تجربه عملی با dbt Cloud و dbt Core، شامل راهاندازی، ارکستراسیون و استقرار در سناریوهای واقعی
- درک و پیادهسازی مدلها، منابع و seed های dbt در محیط Databricks برای تبدیلات کارآمد داده
- یادگیری استفاده از توابع و ماکروهای Jinja برای ایجاد کد SQL پویا و قابل استفاده مجدد در پروژههای dbt
- تسلط به متریالسازی جداول و بارگذاری داده افزایشی برای بهینهسازی گردشکارها و عملکرد داده
- توسعه شیوههای جامع تست و مستندسازی برای اطمینان از کیفیت داده و شفافیت پروژه در dbt
پیشنیازهای دوره
- درک قوی از Databricks، شامل معماری Lakehouse
- آشنایی با SQL
- دانش رایانش ابری (حداقل یکی از آژور، GCP یا AWS)
- دسترسی به حساب پلتفرم ابری (حداقل یکی از آژور، GCP یا AWS)
- آگاهی از کنترل نسخه (اختیاری)
توضیحات دوره
آیا آمادهاید تا تمام پتانسیل پایپلاینهای تحلیل داده خود را کشف کنید؟ دوره «dbt روی Databricks» یک دوره کامل است که برای حرفهایهای داده طراحی شده تا مهارتهای خود را در تبدیل داده با استفاده از dbt (ابزار بیلد داده) در پلتفرم Databricks تقویت کنند و از قدرت آپاچی اسپارک برای گردشکارهای مقیاسپذیر و کارآمد بهره ببرند.
در حالی که Databricks قابلیتهای قوی پردازش داده را ارائه میدهد، dbt این تجربه را با فراهم کردن یک فریمورک برای تبدیلات SQL مبتنی بر کنترل نسخه، ماژولار و قابل تست تقویت میکند. این ترکیب از قدرت آپاچی اسپارک برای گردشکارهای مقیاسپذیر استفاده میکند و در عین حال کدها را تمیزتر، قابل نگهداری و قابل استفاده مجدد نگه میدارد.
این دوره هم dbt Cloud و هم dbt Core را پوشش میدهد و مهارتهای چندمنظورهای را برای هر محیط به یادگیرندگان میآموزد.
این دوره چه مواردی را پوشش میدهد:
- آشنایی با dbt و مفاهیم کلیدی - شروع با یک بررسی عمیق از dbt، قالبهای Jinja و YAML برای پیکربندی - درک میکنید که چگونه این ابزارها در کنار هم برای سادهسازی تبدیل داده به کار میروند.
- راهاندازی محیط - راهنمایی گامبهگام برای پیکربندی dbt Cloud با Databricks، اصول کنترل نسخه و آشنایی با کامپوننتهای اصلی و پایپلاینهای داده
- مدلسازی داده و تبدیلات داده - بررسی معماری داده چندلایه، شامل مدلهای برنز، نقرهای و طلا - یادگیری رویکردهای عملی برای ارجاعدهی به منابع، پیکربندی اسکیما و ایجاد پایپلاینهای داده کارآمد با استفاده از فرمانهای dbt
- تست و اعتبارسنجی پیشرفته - پیادهسازی بررسیهای کیفیت داده قوی از طریق تستهای جنریک و جداگانه، انتقال از سینتکس تست به تستهای داده و یکپارچهسازی پکیجهای dbt مانند dbt_utils برای قابلیت بیشتر
- Jinja، ماکروها و توابع سفارشی - تسلط به هنر کد قابل استفاده مجدد و مقیاسپذیر با سینتکس Jinja و ماکروها - کسب مهارتهای لازم برای دستکاری مدلهای داده به صورت پویا، تغییر اسکیماها و توسعه منطق سفارشی برای یوزکیسهای خاص
- توضیحات متریالسازی - درک استراتژیهای مختلف متریالسازی شامل جداول، views، بارهای افزایشی و اسنپشاتها - بررسی سناریوهای خاص مانند SCD نوع 2 برای جداول ابعادی و بروزرسانیهای افزایشی برای جداول فکت
- گردشکارهای استقرار و تولید - راهاندازی محیط dbt آماده تولید روی Databricks، مدیریت jobs و استقرار مدلها به طور بینقص - یادگیری پیکربندی متغیرهای محیطی و هدفگذاری متغیرها برای سادهسازی گردشکارهای CI/CD
- توسعه با dbt Core - تجربه انعطافپذیری dbt Core از طریق راهاندازیهای محلی پروژه، یکپارچهسازی گیتهاب و ناوبری خط فرمان، در حالی که بهترین شیوهها برای کنترل نسخه و همکاری را یاد میگیرید.
- عیبیابی و تکنیکهای پیشرفته - کسب بینشهایی درباره نحوه مدیریت مشکلات رایج اتصال، بهینهسازی عملکرد پروژه و مقیاسپذیری حجمهای کاری روی Databricks
مخاطب هدف:
این دوره برای مهندسان داده، تحلیلگران و معمارانی طراحی شده که با SQL آشنا هستند و میخواهند مهارتهای خود را در تبدیل داده با استفاده از dbt روی پلتفرم Databricks ارتقا دهند. دانش ابتدایی از پایتون، گیت و محیطهای داده مبتنی بر ابر توصیه میشود.
چرا این دوره را بگذرانید؟
با پروژههای عملی، تمرینات راهنما و منابع قابل دانلود، این دوره مهارتهای عملی را توسعه میدهد که میتوانند به چالشهای واقعی داده نزدیک شوند. در پایان دوره، تسلط به ساخت، تست و استقرار پایپلاینهای داده قوی، یادگیرندگان را به عنوان حرفهایهای متخصص داده برای مدیریت گردشکارهای تحلیل پیچیده متمایز خواهد کرد.
این دوره برای چه کسانی مناسب است؟
- این دوره برای توسعهدهندگان Databricks، مهندسان داده و حرفهایهای تحلیل داده مناسب است که میخواهند از dbt برای تبدیلات کارآمد داده استفاده کنند و تخصص خود را در گردشکارهای داده مدرن افزایش دهند.
آموزش dbt روی Databricks
-
مقدمه دوره 02:15
-
پیشنیازها 01:34
-
dbt چیست؟ 05:05
-
Jinja چیست؟ 01:41
-
YAML چیست؟ 05:30
-
DAG چیست؟ 01:25
-
الزامات فضای کاری Databricks 03:04
-
بارگذاری مجموعه داده خردهفروشی 05:12
-
راهاندازی dbt Cloud و بررسی رابط کاربری 05:54
-
راهاندازی پروژه dbt 06:03
-
کامپوننتهای اصلی dbt 10:00
-
اصول کنترل نسخه گیت 08:57
-
بررسی تبدیلات داده 02:29
-
لینکدهی به ویکی دوره 01:42
-
نگاهی اولیه به مدلهای dbt 14:00
-
پاکسازی کد کامپایل شده 03:11
-
مدلسازی لایه برنزی و منابع 09:28
-
تازگی منبع 06:13
-
مدلسازی لایه نقرهای 10:45
-
مدلسازی لایه طلایی 08:05
-
ساختار پوشه و قراردادهای نامگذاری 06:23
-
آشنایی با ویژگیها و پیکربندیها 10:17
-
پیکربندی اسکیمای سفارشی 09:46
-
انتخاب گره 08:05
-
بررسی تستهای جنریک و جداگانه 01:59
-
(جهت اطلاع) "tests" در مقابل "data_tests" - نامهای متفاوت، اما یکسان 01:10
-
تستهای جنریک روی منابع 06:31
-
تستهای جنریک روی مدلها 05:47
-
تستهای جداگانه 04:48
-
بیلد dbt 04:50
-
Seeds 05:28
-
تحلیلها 02:50
-
آشنایی با سینتکس Jinja 03:34
-
متغیرها در Jinja 05:11
-
شرطی IF 03:33
-
حلقههای For 06:22
-
توابع 06:06
-
ماکروها 09:29
-
پکیجها 05:42
-
بررسی متریالسازیها 05:03
-
جداول و Views (جمعبندی) 05:09
-
جداول افزایشی - بخش 1 20:00
-
جداول افزایشی - بخش 2 07:02
-
عبارات رایج جدول (CTEs) 06:23
-
Ephemeral 04:24
-
اسنپشاتها و SCD نوع 2 12:00
-
پیکربندیهای جدول خاص Databricks 00:30
-
جمعبندی و بررسی 01:29
-
انتخاب تست 06:34
-
پیکربندیهای اضافی تست 12:24
-
تستهای جنریک سفارشی 05:33
-
تست با dbt_utils 04:42
-
تست با dbt_expectations 04:39
-
آشنایی با تست واحد در dbt 06:14
-
دموی تست واحد 09:40
-
ادغام تغییرات ما با Main 03:11
-
محیطهای استقرار 02:29
-
ایجاد محیط تولید 05:31
-
اولین Job استقراری ما 11:08
-
افزودن اسکیمای لندینگ در کاتالوگ تولید ما 00:52
-
متغیرهای هدف 07:40
-
متغیرهای محیطی 05:23
-
افزودن توضیحات به مستندات 04:13
-
هوکها 05:52
-
dbt Core در مقابل dbt Cloud 03:49
-
بررسی راهاندازی محیط توسعه 01:04
-
حساب و مخزن گیتهاب 01:59
-
نصب گیت (ویندوز) 00:58
-
نصب پایتون (ویندوز) 02:29
-
نصب پایتون (سیستم عامل مک) 02:13
-
نصب و بررسی ویژوال استودیو کد 08:12
-
ناوبری خط فرمان 03:28
-
کلونسازی مخزن گیتهاب و دموی گردشکارهای اولیه گیتهاب 16:13
-
پیکربندی گواهینامههای SSL (سیستم عامل مک) 01:06
-
نصب dbt-core و dbt-databricks 02:44
-
راهاندازی پروژه dbt Core 10:38
-
دموی dbt Core - ساخت پروژههای dbt به طور محلی 06:48
-
دموی dbt Core - افزودن محیط هدف تولید 03:12
-
استفاده از dbt در گردشکار Databricks 09:47
-
بررسی گسترش کاربر قدرتمند 06:43
-
دموی گسترش کاربر قدرتمند 05:51
مشخصات آموزش
آموزش dbt روی Databricks
- تاریخ به روز رسانی: 1404/06/21
- سطح دوره:متوسط
- تعداد درس:81
- مدت زمان :07:47:26
- حجم :3.66GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy