دوره آموزشی
آموزش های Coursera
دوبله زبان فارسی

آشنایی با کلان داده با اسپارک و هدوپ

آشنایی با کلان داده با اسپارک و هدوپ

✅ سرفصل و جزئیات آموزش

آنچه یاد خواهید گرفت:

  • تأثیر کلان داده را توضیح دهید، از جمله موارد استفاده، ابزارها و متدهای پردازش
  • معماری Apache Hadoop، اکوسیستم، شیوه‌ها و کاربردهای مرتبط با کاربر، از جمله Hive ،HDFS ،HBase، اسپارک و MapReduce را توصیف کنید.
  • اصول برنامه‌نویسی اسپارک را از جمله اصول برنامه‌نویسی موازی برای DataFrames، مجموعه‌های داده و Spark SQL به‌کار گیرید.
  • از RDDها و مجموعه‌های داده اسپارک استفاده کنید، Spark SQL را با استفاده از Catalyst و Tungsten بهینه‌سازی کنید و از گزینه‌های محیط توسعه و ران تایم اسپارک استفاده کنید.

توضیحات دوره

این دوره آموزشی خودمحور از IBM به شما همه چیز درباره کلان داده را آموزش خواهد داد! شما با ویژگی‌های کلان داده و کاربرد آن‌ها در تحلیل کلان داده آشنا خواهید شد. همچنین تجربیات عملی با ابزارهای پردازش کلان داده مانند Apache Hadoop و Apache Spark خواهید داشت.

برنارد مار تعریف می‌کند که کلان داده ردپای دیجیتالی است که در این عصر دیجیتال تولید می‌کنیم. شما دوره را با درک معنا کلان داده و بررسی اینکه چگونه می‌توان بینش‌های کلان داده را برای موارد استفاده مختلف به کار برد، آغاز خواهید کرد. همچنین نحوه استفاده از فناوری‌هایی مانند پردازش موازی، مقیاس‌پذیری و موازی‌سازی داده را بررسی خواهید کرد.

سپس در مورد Hadoop، یک فریمورک متن باز که اجازه پردازش توزیع‌شده مقادیر زیادی از داده‌ها و اکوسیستم آن را می‌دهد، اطلاعات بیشتری خواهید آموخت. با کاربردهای مهمی که با Hadoop همراه است مثل Distributed File System (HDFS)، MapReduce و HBase آشنا خواهید شد. همچنین با Hive، نرم‌افزار انبار داده که یک رابط SQL مشابه برای پرسش و دستکاری مجموعه‌های داده بزرگ به‌طور کارآمد فراهم می‌کند، آشنا خواهید شد.

سپس به جزئیات Apache Spark، یک موتور پردازش متن باز که روش‌های جدیدی برای ذخیره و استفاده از کلان داده به کاربران ارائه می‌دهد، پرداخته و یاد خواهید گرفت که چگونه از اسپارک برای ارائه بینش‌های قابل اعتماد بهره ببرید. این دوره نمای کلی از پلتفرم را ارائه داده و به کامپوننت های تشکیل‌دهنده Apache Spark می‌پردازد.

شما با DataFrames آشنا خواهید شد و عملیات بنیادی DataFrame را انجام خواهید داد و با SparkSQL کار خواهید کرد. نحوه پردازش و نظارت اسپارک بر درخواست‌هایی که اپلیکیشن تان ارسال می‌کند بررسی می‌شود و همچنین یاد می‌گیرید که چگونه می‌توانید کارها را با استفاده از رابط کاربری اپلیکیشن اسپارک ردیابی کنید.

این دوره شامل چندین آزمایشگاه عملی است که به شما کمک می‌کند تا مفاهیم یادگرفته‌شده را به کار گیرید و تمرین کنید. شما آزمایشگاه‌های Hadoop و Spark را با استفاده از ابزارها و فناوری‌های مختلف از جمله Docker ،Kubernetes ،Python و Jupyter Notebooks به پایان خواهید رساند.

آشنایی با کلان داده با اسپارک و هدوپ

  • مقدمه‌ای بر دوره 5:45
  • کلان داده چیست؟ 7:42
  • تأثیر کلان داده 5:33
  • پردازش موازی، مقیاس‌پذیری و موازی‌سازی داده 7:37
  • ابزارها و اکوسیستم کلان داده 4:32
  • متن باز و کلان داده 6:29
  • فراتر از هیاهو 4:34
  • موارد استفاده از کلان داده 5:34
  • خلاصه و نکات کلیدی: مقدمه‌ای بر کلان داده None
  • مقدمه‌ای بر Hadoop 7:20
  • مقدمه‌ای بر MapReduce 5:41
  • اکوسیستم Hadoop 4:22
  • HDFS 8:15
  • HIVE 5:40
  • HBASE 5:59
  • خلاصه و نکات کلیدی: مقدمه‌ای بر Hadoop None
  • چرا از Apache Spark استفاده کنیم؟ 5:07
  • اصول برنامه‌نویسی تابعی 5:32
  • برنامه‌نویسی موازی با استفاده از مجموعه‌های توزیع‌شده مقاوم 5:27
  • مقیاس‌پذیری یا موازی‌سازی داده‌ای در Apache Spark 3:45
  • Dataframes و SparkSQL 4:15
  • خلاصه و نکات کلیدی: مقدمه‌ای بر Apache Spark None
  • RDDها در برنامه‌نویسی موازی و اسپارک 5:18
  • Data-frames و مجموعه‌های داده 4:31
  • Catalyst و Tungsten 5:13
  • ETL با DataFrames 6:25
  • استفاده واقعی از SparkSQL 4:16
  • خلاصه و نکات کلیدی: مقدمه‌ای بر DataFrames و Spark SQL None
  • معماری Apache Spark 5:48
  • مروری بر حالت‌های کلاستر Apache Spark 6:05
  • چگونه یک برنامه Apache Spark را اجرا کنیم؟ 6:31
  • استفاده از Apache Spark روی IBM Cloud 4:06
  • تنظیم پیکربندی Apache Spark 5:52
  • اجرای اسپارک بر روی Kubernetes 4:32
  • خلاصه و نکات کلیدی: معماری اسپارک None
  • خلاصه و نکات کلیدی: محیط‌های زمان اجرا اسپارک None
  • رابط کاربری Apache Spark 5:41
  • نظارت بر پیشرفت برنامه 7:50
  • اشکال‌زدایی از مشکلات برنامه Apache Spark 5:30
  • درک منابع حافظه 5:58
  • درک منابع پردازنده 5:11
  • خلاصه و نکات کلیدی: مقدمه‌ای بر نظارت و تنظیم None
  • دستورالعمل‌ها برای ارزیابی نهایی None
  • تبریک و مراحل بعدی None
  • تشکر از طرف تیم دوره None

1,296,500 259,300 تومان

مشخصات آموزش

آشنایی با کلان داده با اسپارک و هدوپ

  • تاریخ به روز رسانی: 1404/06/14
  • سطح دوره:متوسط
  • تعداد درس:45
  • مدت زمان :03:17:56
  • حجم :367.0MB
  • زبان:دوبله زبان فارسی
  • دوره آموزشی:AI Academy

آموزش های مرتبط

The Great Courses
2,067,000 413,400 تومان
  • زمان: 05:14:59
  • تعداد درس: 30
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,428,500 285,700 تومان
  • زمان: 03:37:21
  • تعداد درس: 57
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
2,165,500 433,100 تومان
  • زمان: 05:29:46
  • تعداد درس: 50
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,362,500 272,500 تومان
  • زمان: 03:27:39
  • تعداد درس: 60
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
490,000 98,000 تومان
  • زمان: 45:15
  • تعداد درس: 18
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
7,577,000 1,515,400 تومان
  • زمان: 19:11:34
  • تعداد درس: 203
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
490,000 98,000 تومان
  • زمان: 50:18
  • تعداد درس: 18
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
796,500 159,300 تومان
  • زمان: 02:01:30
  • تعداد درس: 32
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
7,261,000 1,452,200 تومان
  • زمان: 18:23:18
  • تعداد درس: 103
  • سطح دوره:
  • زبان: دوبله فارسی

آیا سوالی دارید؟

ما به شما کمک خواهیم کرد تا شغل و رشد خود را افزایش دهید.
امروز با ما تماس بگیرید