آشنایی با کلان داده با اسپارک و هدوپ
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- تأثیر کلان داده را توضیح دهید، از جمله موارد استفاده، ابزارها و متدهای پردازش
- معماری Apache Hadoop، اکوسیستم، شیوهها و کاربردهای مرتبط با کاربر، از جمله Hive ،HDFS ،HBase، اسپارک و MapReduce را توصیف کنید.
- اصول برنامهنویسی اسپارک را از جمله اصول برنامهنویسی موازی برای DataFrames، مجموعههای داده و Spark SQL بهکار گیرید.
- از RDDها و مجموعههای داده اسپارک استفاده کنید، Spark SQL را با استفاده از Catalyst و Tungsten بهینهسازی کنید و از گزینههای محیط توسعه و ران تایم اسپارک استفاده کنید.
توضیحات دوره
این دوره آموزشی خودمحور از IBM به شما همه چیز درباره کلان داده را آموزش خواهد داد! شما با ویژگیهای کلان داده و کاربرد آنها در تحلیل کلان داده آشنا خواهید شد. همچنین تجربیات عملی با ابزارهای پردازش کلان داده مانند Apache Hadoop و Apache Spark خواهید داشت.
برنارد مار تعریف میکند که کلان داده ردپای دیجیتالی است که در این عصر دیجیتال تولید میکنیم. شما دوره را با درک معنا کلان داده و بررسی اینکه چگونه میتوان بینشهای کلان داده را برای موارد استفاده مختلف به کار برد، آغاز خواهید کرد. همچنین نحوه استفاده از فناوریهایی مانند پردازش موازی، مقیاسپذیری و موازیسازی داده را بررسی خواهید کرد.
سپس در مورد Hadoop، یک فریمورک متن باز که اجازه پردازش توزیعشده مقادیر زیادی از دادهها و اکوسیستم آن را میدهد، اطلاعات بیشتری خواهید آموخت. با کاربردهای مهمی که با Hadoop همراه است مثل Distributed File System (HDFS)، MapReduce و HBase آشنا خواهید شد. همچنین با Hive، نرمافزار انبار داده که یک رابط SQL مشابه برای پرسش و دستکاری مجموعههای داده بزرگ بهطور کارآمد فراهم میکند، آشنا خواهید شد.
سپس به جزئیات Apache Spark، یک موتور پردازش متن باز که روشهای جدیدی برای ذخیره و استفاده از کلان داده به کاربران ارائه میدهد، پرداخته و یاد خواهید گرفت که چگونه از اسپارک برای ارائه بینشهای قابل اعتماد بهره ببرید. این دوره نمای کلی از پلتفرم را ارائه داده و به کامپوننت های تشکیلدهنده Apache Spark میپردازد.
شما با DataFrames آشنا خواهید شد و عملیات بنیادی DataFrame را انجام خواهید داد و با SparkSQL کار خواهید کرد. نحوه پردازش و نظارت اسپارک بر درخواستهایی که اپلیکیشن تان ارسال میکند بررسی میشود و همچنین یاد میگیرید که چگونه میتوانید کارها را با استفاده از رابط کاربری اپلیکیشن اسپارک ردیابی کنید.
این دوره شامل چندین آزمایشگاه عملی است که به شما کمک میکند تا مفاهیم یادگرفتهشده را به کار گیرید و تمرین کنید. شما آزمایشگاههای Hadoop و Spark را با استفاده از ابزارها و فناوریهای مختلف از جمله Docker ،Kubernetes ،Python و Jupyter Notebooks به پایان خواهید رساند.
آشنایی با کلان داده با اسپارک و هدوپ
-
مقدمهای بر دوره 5:45
-
کلان داده چیست؟ 7:42
-
تأثیر کلان داده 5:33
-
پردازش موازی، مقیاسپذیری و موازیسازی داده 7:37
-
ابزارها و اکوسیستم کلان داده 4:32
-
متن باز و کلان داده 6:29
-
فراتر از هیاهو 4:34
-
موارد استفاده از کلان داده 5:34
-
خلاصه و نکات کلیدی: مقدمهای بر کلان داده None
-
مقدمهای بر Hadoop 7:20
-
مقدمهای بر MapReduce 5:41
-
اکوسیستم Hadoop 4:22
-
HDFS 8:15
-
HIVE 5:40
-
HBASE 5:59
-
خلاصه و نکات کلیدی: مقدمهای بر Hadoop None
-
چرا از Apache Spark استفاده کنیم؟ 5:07
-
اصول برنامهنویسی تابعی 5:32
-
برنامهنویسی موازی با استفاده از مجموعههای توزیعشده مقاوم 5:27
-
مقیاسپذیری یا موازیسازی دادهای در Apache Spark 3:45
-
Dataframes و SparkSQL 4:15
-
خلاصه و نکات کلیدی: مقدمهای بر Apache Spark None
-
RDDها در برنامهنویسی موازی و اسپارک 5:18
-
Data-frames و مجموعههای داده 4:31
-
Catalyst و Tungsten 5:13
-
ETL با DataFrames 6:25
-
استفاده واقعی از SparkSQL 4:16
-
خلاصه و نکات کلیدی: مقدمهای بر DataFrames و Spark SQL None
-
معماری Apache Spark 5:48
-
مروری بر حالتهای کلاستر Apache Spark 6:05
-
چگونه یک برنامه Apache Spark را اجرا کنیم؟ 6:31
-
استفاده از Apache Spark روی IBM Cloud 4:06
-
تنظیم پیکربندی Apache Spark 5:52
-
اجرای اسپارک بر روی Kubernetes 4:32
-
خلاصه و نکات کلیدی: معماری اسپارک None
-
خلاصه و نکات کلیدی: محیطهای زمان اجرا اسپارک None
-
رابط کاربری Apache Spark 5:41
-
نظارت بر پیشرفت برنامه 7:50
-
اشکالزدایی از مشکلات برنامه Apache Spark 5:30
-
درک منابع حافظه 5:58
-
درک منابع پردازنده 5:11
-
خلاصه و نکات کلیدی: مقدمهای بر نظارت و تنظیم None
-
دستورالعملها برای ارزیابی نهایی None
-
تبریک و مراحل بعدی None
-
تشکر از طرف تیم دوره None
مشخصات آموزش
آشنایی با کلان داده با اسپارک و هدوپ
- تاریخ به روز رسانی: 1404/06/14
- سطح دوره:متوسط
- تعداد درس:45
- مدت زمان :03:17:56
- حجم :367.0MB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy