آمادهسازی و بررسی داده در Databricks
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
دیتابریکس یک پلتفرم تحلیلی یکپارچه است که میتواند حجم عظیمی از داده را مدیریت کرده، آنها را سریعتر پردازش کند و به بررسی و تحلیل عمیق داده کمک نماید.
در این دوره، "آمادهسازی و بررسی داده در Databricks"، شما توانایی بررسی، تحلیل، پاکسازی و تبدیل داده با استفاده از پلتفرم Databricks را به دست خواهید آورد؛ داده پردازششده را در فرمت دلتا لیک ذخیره کرده و داده را با استفاده از نمودارها و داشبوردهای Databricks مصورسازی خواهید کرد. ابتدا، یاد خواهید گرفت که چگونه محیط Databricks را راهاندازی کنید.
سپس، خواهید آموخت که چگونه داده را از منابع مختلف در Databricks مانند Azure Data Lake Store و فایل سیستم Databricks (DBFS) استخراج کرده و دیتافریمهای اسپارک ایجاد کنید. در ادامه، به چگونگی بررسی و تحلیل داده با استفاده از ویژگیهای اسپارک و Databricks، پاکسازی و تبدیل داده با استفاده از اسپارک، و مصورسازی داده با استفاده از نمودارها و داشبوردهای Databricks خواهید پرداخت.
پس از آن، خواهید دید که چگونه داده پردازششده را در Data Lake یا به صورت جداول دیتابریکس با فرمت دلتا لیک ذخیره کنید. در نهایت، یاد خواهید گرفت که چگونه بهینهسازی عملکرد را در دیتابریکس انجام دهید. پس از اتمام این دوره، شما مهارتها و دانش لازم برای آمادهسازی و بررسی داده با دیتابریکس را خواهید داشت.
آمادهسازی و بررسی داده در Databricks
-
آشنایی با Databricks 3m 27s
-
درک معماری و اجرای Apache Spark 5m 52s
-
راهاندازی محیط 3m 54s
-
کار با Unity Catalog در Databricks 5m 41s
-
اتصال به Azure Data Lake Storage از Databricks 4m 47s
-
درک و ایجاد دیتافریمهای آپاچی اسپارک 5m 11s
-
اعمال اسکیماها 3m 51s
-
بررسی و تحلیل داده 2m 52s
-
پاکسازی داده 3m 47s
-
اعمال تبدیلها 7m 36s
-
اجرای کوئریهای SQL روی دیتافریمها 3m 22s
-
مصورسازی داده و ایجاد داشبورد 2m 32s
-
درک دلتا لیک در Databricks 7m 28s
-
نوشتن داده در Data Lake به صورت فایل 3m 22s
-
کار با جداول دلتا 4m 43s
-
انجام عملیات DML روی جدول دلتا 3m 48s
-
بررسی داده تاریخی با قابلیت سفر در زمان دلتا لیک 3m 19s
-
بهینهسازی و Z-ordering جداول دلتا 7m 26s
-
پاکسازی فایلهای جدول دلتا با دستور Vacuum 4m 15s
-
فعالسازی بهینهسازی خودکار در جداول دلتا 4m 41s
مشخصات آموزش
آمادهسازی و بررسی داده در Databricks
- تاریخ به روز رسانی: 1404/06/21
- سطح دوره:مقدماتی
- تعداد درس:20
- مدت زمان :01:32:04
- حجم :337.0MB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy