مقدمهای بر معماری Lakehouse در Databricks
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
راه حلهای سنتی ذخیرهسازی داده مانند Data Lakes و Data Warehouses، هر کدام قابلیتهای مقیاسپذیری یا اطمینان را اما نه هر دو را همزمان ارائه میدهند. این موضوع توانایی سازمان در مدیریت و تحلیل مؤثر دادهها را محدود میکند.
در این دوره، با عنوان «مقدمهای بر معماری Lakehouse در Databricks»، خواهید توانست از پلتفرم Databricks Lakehouse بهرهمند شوید تا راهحلهای یکپارچه، مقیاسپذیر و کارآمد در زمینه دادهها طراحی کنید.
در ابتدا، مفاهیم پایهای معماری Lakehouse، مزایای آن نسبت به Data Lakes و Data Warehouses سنتی و کامپوننت های اصلی آن مانند Delta Lake ،Spark ،Databricks SQL و MLflow را بررسی خواهید کرد.
سپس، نحوه کار با معماری Lakehouse با استفاده از Delta Lake، شامل کوئری های داده ساختاریافته و غیر ساختاریافته، و مدیریت گردشهای کاری یادگیری ماشین با MLflow را کشف خواهید نمود.
در نهایت، یاد خواهید گرفت چگونه مدل Lakehouse را در سناریوهای واقعی به کار ببرید، از جمله ساخت یک پایپ لاین داده کامل و یک گردش کار یادگیری ماشین، و به بررسی کاربردهای رایج در صنعت مانند تشخیص تقلب، سیستمهای پیشنهاددهی و تحلیلهای مشتری میپردازید.
پس از پایان این دوره، مهارتها و دانش لازم برای طراحی و اجرای راهحلهای داده مدرن برای تحلیل، یادگیری ماشین و فراتر از آن را خواهید داشت.
مقدمهای بر معماری Lakehouse در Databricks
-
پیشنیازهای سیستم و نرمافزار 34s
-
انواع دادهها و مسائل مرتبط با Data Silos 4m 51s
-
راهحلهای سنتی ذخیرهسازی داده 5m 16s
-
معماری Data Lakehouse 4m 43s
-
Lakehouse در Databricks 6m 33s
-
گردشهای کاری مدرن داده در Lakehouse 2m 24s
-
معماری Lakehouse بر روی Databricks 3m 3s
-
دمو: ذخیره و کوئری داده در جدول Delta با استفاده از Notebooks 7m 6s
-
دمو: اجرای کوئریهای SQL روی جداول Delta 5m 36s
-
دمو: پایپ لاین ETL کامل 4m 26s
-
دمو: چرخه عمر یادگیری ماشین End-to-end با MLflow 6m 26s
-
کاربردهای عمومی در صنعت با قدرتگیری از Databricks 2m 4s
مشخصات آموزش
مقدمهای بر معماری Lakehouse در Databricks
- تاریخ به روز رسانی: 1404/06/21
- سطح دوره:مقدماتی
- تعداد درس:12
- مدت زمان :00:53:08
- حجم :136.0MB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy