دوره آموزشی
The Great Courses
دوبله زبان فارسی

تسلط به Hive - از مبانی تا تحلیل پیشرفته کلان داده

تسلط به Hive - از مبانی تا تحلیل پیشرفته کلان داده

✅ سرفصل و جزئیات آموزش

آنچه یاد خواهید گرفت:

  • آشنایی با Hive: درک اصول Hive و نقش آن در اکوسیستم هدوپ
  • مدیریت پایگاه داده Hive: یاد بگیرید چگونه پایگاه داده‌ها و جداول Hive را ایجاد و مدیریت کنید.
  • بارگذاری و دستکاری داده: تسلط به تکنیک‌های بارگذاری داده در Hive و انجام عملیات‌های دستکاری داده
  • کوئری کردن پیشرفته: اجرای کوئری‌های پیچیده با HiveQL، شامل جوین‌ها، پارتیشن‌ها و bucketing
  • توابع Hive: استفاده از توابع داخلی Hive برای پردازش و تحلیل داده
  • توابع تعریف‌شده توسط کاربر (UDF): ایجاد و پیاده‌سازی UDFهای سفارشی برای گسترش قابلیت‌های Hive
  • یکپارچه‌سازی Hive با HBase: بررسی یکپارچه‌سازی Hive با HBase برای ذخیره‌سازی و بازیابی موثر داده
  • مطالعات موردی واقعی: به‌کارگیری دانش Hive در مطالعات موردی عملی در صنایع مختلف، مانند مخابرات و شبکه‌های اجتماعی
  • Hive در کنار سایر ابزارهای کلان داده: یادگیری استفاده همزمان از Hive با Pig ،MapReduce و Sqoop برای تحلیل جامع داده
  • تحلیل داده سنسور: کسب تجربه عملی در پردازش و تحلیل داده سنسور با Hive و Pig

پیش‌نیازهای دوره

  • درک اولیه از اس کیوال
  • آشنایی با اکوسیستم هدوپ و مفاهیم کلان داده
  • دانش اولیه برنامه‌نویسی، ترجیحاً در پایتون یا جاوا
  • دسترسی به کامپیوتری با اتصال اینترنت برای تمرین‌های عملی

توضیحات دوره

دانشجویان درک جامعی از Hive، از اصول تا مباحث پیشرفته، کسب خواهند کرد. آن‌ها یاد می‌گیرند چگونه پایگاه داده‌های Hive را ایجاد و مدیریت کنند، داده را بارگذاری و دستکاری کنند، کوئری‌های پیچیده را اجرا نمایند و از ویژگی‌های قدرتمند Hive برای پارتیشن‌بندی، bucketing و ایندکس‌گذاری استفاده کنند. علاوه بر این، دانشجویان مطالعات موردی و پروژه‌های عملی را بررسی خواهند کرد و دانش خود را در سناریوهای واقعی مانند تحلیل صنعت مخابرات، تحلیل شکایات مشتریان، تحلیل شبکه‌های اجتماعی و تحلیل داده سنسور به‌کار می‌گیرند.

بخش 1: Hive - مقدماتی

در این بخش، دانشجویان با Hive، ابزاری لازم برای مدیریت و کوئری مجموعه کلان داده ذخیره‌شده در هدوپ، آشنا می‌شوند. آن‌ها مبانی Hive، از جمله ایجاد پایگاه داده، بارگذاری داده و دستکاری جداول را می‌آموزند. موضوعاتی مانند جداول خارجی، Hive Metastore و پارتیشن‌ها را همراه با مثال‌های عملی از ایجاد جداول پارتیشن‌بندی شده، استفاده از پارتیشن‌های پویا و اجرای جوین‌ها در Hive پوشش می‌دهیم. همچنین، مفهوم توابع تعریف‌شده توسط کاربر (UDF) و چگونگی پیاده‌سازی آن‌ها را بررسی می‌کنیم.

بخش 2: Hive - پیشرفته

این بخش بر دانش اولیه تکیه دارد و به مفاهیم پیشرفته Hive می‌پردازد. دانشجویان با جداول داخلی و خارجی، درج داده و توابع مختلف Hive آشنا می‌شوند. این بخش تکنیک‌های پیشرفته پارتیشن‌بندی، bucketing، نمونه‌برداری از جدول و ایندکس‌گذاری را پوشش می‌دهد. نمایش‌های عملی شامل ایجاد viewها، استفاده از متغیرهای Hive و آشنایی با معماری Hive است. دانشجویان قابلیت‌های موازی بودن Hive، ویژگی‌های جدول و چگونگی مدیریت و فشرده‌سازی فایل‌ها در Hive رابررسی می‌کنند.

بخش 3: پروژه 1 - جداول Hive مدیریت‌شده توسط HBase

این بخش بر یکپارچه‌سازی Hive با HBase، یک پایگاه داده توزیع‌شده تمرکز دارد. دانشجویان می‌آموزند چگونه جداول Hive مدیریت شده و خارجی را ایجاد و مدیریت کنند و پیچیدگی‌های پارتیشن‌های استاتیک و پویا را درک می‌کنند. آن‌ها تجربه عملی در ایجاد جوین‌ها، viewها و ایندکس‌ها کسب می‌کنند و با انواع داده پیچیده در Hive آشنا می‌شوند. این بخش با پروژه‌های پیاده‌سازی عملی شامل Hive و HBase به اوج خود می‌رسد و کاربردها و موارد استفاده واقعی را به نمایش می‌گذارد.

بخش 4: پروژه 2 - مطالعه موردی در صنعت مخابرات با Hive

دانشجویان دانش Hive خود را در مطالعه موردی صنعت مخابرات به کار می‌گیرند. این پروژه شامل کار با داده ساده و پیچیده، ایجاد و مدیریت جداول و استفاده از پارتیشن‌بندی و bucketing برای سازماندهی داده است. دانشجویان یاد می‌گیرند چگونه عملیات‌های مختلف داده را انجام دهند، سرویس‌های کنترل جدول را درک می‌کنند و جداول قرارداد را ایجاد می‌کنند. این پروژه عملی بینش‌های ارزشمندی از کاربرد Hive در تحلیل داده صنعت ارائه می‌دهد.

بخش 5: پروژه 3 - تحلیل شکایات مشتریان با Hive - بررسی MapReduce

در این بخش، دانشجویان داده شکایات مشتریان را با Hive و MapReduce تحلیل می‌کنند. آن‌ها یاد می‌گیرند چگونه فایل‌های درایور ایجاد کرده، داده لوکیشن‌های خاص را پردازش کنند و شکایات را بر اساس لوکیشن دسته‌بندی کنند. این پروژه قدرت Hive و MapReduce در مدیریت کلان داده را نشان می‌دهد و تجربه عملی در پردازش و تحلیل داده فراهم می‌کند.

بخش 6: پروژه 4 - تحلیل شبکه‌های اجتماعی با HIVE ،PIG ،Sqoop و MapReduce

این بخش به یکپارچه‌سازی Hive با ابزارهای دیگر کلان داده مانند Pig ،MapReduce و Sqoop برای تحلیل داده شبکه‌های اجتماعی می‌پردازد. دانشجویان یاد می‌گیرند چگونه داده شبکه‌های اجتماعی را پردازش و تحلیل کنند، انتقال داده از RDMS به HDFS را انجام دهند و برنامه‌های MapReduce را اجرا کنند. پروژه شامل تمرین‌های عملی در پردازش فایل‌های XML، تحلیل نظرات و عملکرد کتاب و کار با مجموعه داده‌های پیچیده از طریق Hive و Pig است.

بخش 7: پروژه 5 - تحلیل داده سنسور با Hive و Pig

بخش نهایی بر تحلیل داده سنسور با Hive و Pig تمرکز دارد. دانشجویان مبانی کلان داده و MapReduce را فرا می‌گیرند و یاد می‌گیرند چگونه فایل‌های JSON را به فرمت متنی ساده تبدیل کنند. آن‌ها وظایف مختلف تحلیل داده، از جمله محاسبه نسبت‌ها، تولید گزارش‌ها و پردازش داده با توابع Pig را انجام می‌دهند. این پروژه تجربه کاملی از پردازش و تحلیل داده سنسور ارائه می‌دهد و کاربردهای عملی Hive و Pig را در سناریوهای واقعی نشان می‌دهد.

نتیجه‌گیری

این دوره سفری کامل از درک مبانی Hive تا تسلط به تکنیک‌های پیشرفته تحلیل کلان داده ارائه می‌دهد. با ترکیب دانش نظری و پروژه‌های عملی، دانشجویان مهارت‌های لازم برای مدیریت، تحلیل و استخراج بینش‌ها از کلان داده با Hive را کسب خواهند کرد. چه مهندس داده باشید، چه تحلیلگر داده یا کارآفرین فناوری، این دوره شما را به ابزارها و دانش لازم برای برتری در دنیای کلان داده مجهز می‌کند.

این دوره برای چه کسانی مناسب است؟

  • مهندسان داده آینده: افرادی که هدفشان ساخت حرفه‌ای در مهندسی داده و تحلیل کلان داده است.
  • علاقه‌مندان به کلان داده: هر کسی که به فناوری‌ها و تحلیل کلان داده علاقه‌مند است.
  • تحلیلگران داده: متخصصانی که می‌خواهند مهارت تحلیل داده خود را با Hive ارتقا دهند.
  • دانشجویان: دانشجویان علوم کامپیوتر و مهندسی که به یادگیری فناوری‌های کلان داده علاقه دارند.
  • متخصصان فناوری اطلاعات: افرادی که به دنبال ارتقاء مهارت و ورود به حوزه کلان داده هستند.
  • توسعه‌دهندگان نرم‌افزار: توسعه‌دهندگانی که می‌خواهند قابلیت‌های Hive را در برنامه‌های خود یکپارچه‌سازی کنند.
  • کارآفرینان فناوری: کارآفرینانی که قصد دارند راه‌حل‌های کلان داده را در استارتاپ‌های خود پیاده‌سازی کنند.

تسلط به Hive - از مبانی تا تحلیل پیشرفته کلان داده

  • آشنایی با HIVE 10:45
  • پایگاه داده Hive 10:21
  • فرمان بارگذاری داده 05:37
  • چگونه ستون را جایگزین کنیم؟ 04:17
  • جدول خارجی 06:26
  • HIVE Metastore 03:25
  • پارتیشن در Hive چیست؟ 09:45
  • ایجاد جدول پارتیشن 08:30
  • Insert Overwrite جدول 03:55
  • Dynamic Partition True 01:57
  • Bucketing در Hive 05:24
  • تجزیه مجموعه داده‌ها 05:30
  • جوین‌ها در Hive 08:51
  • جوین‌ها در Hive - ادامه 09:45
  • Skew Join 02:54
  • Serde چیست؟ 07:29
  • Serde در Hive 08:55
  • تابع تعریف‌شده توسط کاربر (UDF) در Hive 09:46
  • تابع تعریف‌شده توسط کاربر (UDF) در Hive - ادامه 07:28
  • اطلاعات بیشتر درباره توابع تعریف‌شده توسط کاربر در Hive 06:58
  • تابع Maxcale 03:01
  • مثال کاربرد Hive 12:04
  • آشنایی با مفاهیم Hive و نمایش عملی 05:59
  • جدول داخلی و جدول خارجی 06:19
  • درج داده در جداول 07:25
  • توابع تاریخ و ریاضی 09:00
  • دستورات شرطی 06:40
  • Explode و Lateral View 07:59
  • مرتب‌سازی 06:18
  • جوین 08:44
  • Map Join 02:10
  • پارتیشن‌بندی استاتیک و پویا 07:17
  • اطلاعات بیشتر درباره پارتیشن‌بندی پویا 06:59
  • فرمان Alter 06:15
  • فرمان MSCK 08:44
  • Bucketing 08:08
  • نمونه‌برداری جدول 03:05
  • بایگانی 02:44
  • رتبه‌ها 08:44
  • ایجاد Viewها 08:39
  • مزایای Viewها و تغییر Viewها 06:50
  • ایندکس‌گذاری چیست؟ 05:49
  • ران‌تایم ایندکس Compact و Bitmap 05:25
  • فرمان‌های Hive در شل Bash 05:24
  • متغیرهای Hive - بررسی Hiveconf 04:10
  • متغیرهای Hive - بررسی Hiveconf در شل Bash 05:08
  • پیکربندی متغیر Hive Var 08:57
  • جانشینی متغیر 02:14
  • شمارش کلمات 05:47
  • معماری Hive 03:14
  • موازی بودن در Hive 06:14
  • خصوصیات جدول در Hive 06:06
  • خصوصیات فرمت Null 05:31
  • خصوصیات فرمت Null - ادامه 03:39
  • فرمان‌های Purge در Hive 04:41
  • Slowing Changing Dimension 06:56
  • پیاده‌سازی SCD 08:57
  • مثالی از SCD 04:02
  • چگونه داده XML را در Hive بارگذاری کنیم؟ 05:11
  • چگونه داده XML را در Hive بارگذاری کنیم؟ - ادامه 08:48
  • No Drop و آفلاین در Hive 08:09
  • جدول غیرقابل تغییر 09:09
  • چگونه فایل RC را در Hive ایجاد کنیم؟ 08:38
  • جداول متعدد 06:25
  • ادغام فایل‌های ایجاد شده توسط Hive و تابع rLike 05:32
  • تنظیمات مختلف پیکربندی در Hive 09:07
  • تنظیمات مختلف پیکربندی در Hive - ادامه 03:12
  • فشرده‌سازی فایل‌های مختلف در Hive 05:45
  • حالت‌های مختلف در Hive 03:54
  • فشرده‌سازی فایل در Hive 05:30
  • انواع حالت‌ها در Hive 03:56
  • مقایسه جدول داخلی و خارجی 08:19
  • آشنایی با HIVE 11:53
  • ایجاد جداول Hive 08:24
  • جداول مدیریت‌شده در Hive 04:22
  • جداول خارجی در Hive 06:45
  • اطلاعات بیشتر درباره جداول خارجی در Hive 06:08
  • جداول با لوکیشن 11:16
  • پارتیشن‌های استاتیک 11:36
  • پارتیشن‌های پویا 06:54
  • پارتیشن‌های پویا - ادامه 06:59
  • افزودن پارتیشن‌ها 12:00
  • فرمت‌های فایل 12:05
  • Bucketing و کد آن در Hive 11:24
  • آشنایی با جوین‌ها در Hive 05:52
  • مثالی از جوین‌ها در Hive 09:14
  • ایجاد فضای جوین در Hive 06:02
  • ایجاد فضای جوین در Hive - ادامه 06:49
  • Viewها و مثال آن در Hive 11:27
  • ایندکس‌ها 06:25
  • نمونه‌هایی از ایندکس 07:29
  • انواع داده پیچیده 12:00
  • انواع داده پیچیده - ادامه 07:33
  • نمونه‌هایی از انواع داده در Hive 05:14
  • 3 نوع داده 11:49
  • اسکریپت‌های Hive و مثال آن 14:05
  • تابع تعریف‌شده توسط کاربر و مزایای آن در Hive 05:46
  • مثالی از تابع تعریف‌شده توسط کاربر در Hive 08:06
  • پیاده‌سازی عملی تابع تعریف‌شده توسط کاربر 06:27
  • پیاده‌سازی عملی تابع تعریف‌شده توسط کاربر - ادامه 08:08
  • انواع جداول در Hive 05:22
  • مثالی از انواع جدول در Hive 07:12
  • ایجاد جداول با Hive و HBase 06:02
  • مزایا و معایب Hive و HBase 06:39
  • ایجاد جدول HBase با چندین ستون 07:56
  • مثالی از ایجاد جدول HBase با چندین ستون 05:07
  • جداول Hive مدیریت‌شده توسط HBase 07:26
  • جداول Hive مدیریت‌شده با HBase - ادامه 06:01
  • سینتکس جداول Hive مدیریت‌شده با HBase 07:11
  • مثالی از جداول Hive مدیریت‌شده با HBase 05:34
  • آشنایی با Hive 07:48
  • نوع داده ساده و پیچیده در Hive 08:48
  • خوشه‌ها 00:29
  • فرمان پایگاه داده در Hive 11:51
  • فرمان جداول در Hive 05:39
  • مدیریت جداول 06:29
  • جداول خارجی 01:31
  • آشنایی با پارتیشن‌بندی 07:08
  • فرمان پارتیشن 06:55
  • Bucketing 08:01
  • سرویس‌های کنترل جدول در Hive 11:06
  • مثالی از سرویس‌های کنترل 06:36
  • مثالی از سرویس‌های کنترل - ادامه 05:04
  • ایجاد همه جداول قرارداد 10:42
  • آشنایی با پروژه شکایات مشتری در کلان داده 11:34
  • شکایت ثبت شده زیر هر فایل 09:57
  • ایجاد فایل‌های Driver و Jar Manifest 10:21
  • ایجاد فایل‌های Driver و Jar Manifest - ادامه 02:05
  • شکایت ثبت شده از لوکیشن خاص 05:34
  • لوکیشن تعریف‌شده توسط کاربر 07:35
  • لیست شکایات گروه‌بندی شده بر اساس لوکیشن 06:09
  • آشنایی با صنعت شبکه‌های اجتماعی 08:35
  • وب‌سایت بوک‌مارکینگ 07:39
  • وب‌سایت بوک‌مارکینگ - ادامه 05:19
  • آشنایی با Sqoop 07:22
  • دریافت داده از RDMS به HDFS 08:51
  • اجرای برنامه MapReduce برای پردازش فایل XML 12:06
  • تحلیل عملکرد کتاب بر اساس نظرات با کد 07:07
  • تحلیل عملکرد کتاب بر اساس نظرات با کد - ادامه 08:48
  • تحلیل کتاب بر اساس لوکیشن 07:24
  • مثالی از تحلیل کتاب بر اساس لوکیشن 06:50
  • تحلیل خواننده کتاب در برابر نویسنده 10:22
  • چگونه فایل XML را در PIG پردازش کنیم؟ 06:25
  • چگونه فایل XML را در PIG پردازش کنیم؟ - ادامه 08:06
  • تحلیل عملکرد کتاب در فایل XML در PIG 10:04
  • اطلاعات بیشتر درباره تحلیل عملکرد کتاب در فایل XML در PIG 10:04
  • خروجی فایل XML در Pig با کتاب 09:28
  • خروجی فایل XML در Pig با لوکیشن 09:32
  • خروجی فایل XML در Pig با لوکیشن - ادامه 08:36
  • آشنایی با مجموعه داده پیچیده با Hive 11:37
  • آشنایی با مجموعه داده پیچیده با Hive - ادامه 09:40
  • ایجاد آرایه در MapReduce با Hive 09:59
  • مجموعه داده نوع بوک‌مارکینگ با نوع پیچیده 08:31
  • خروجی مجموعه داده نوع بوک‌مارکینگ 09:46
  • آشنایی با تحلیل داده سنسور 07:26
  • آشنایی با تحلیل داده سنسور - ادامه 10:20
  • مثالی از تحلیل داده سنسور 10:46
  • درک اساس کلان داده و MapReduce 08:08
  • اطلاعات بیشتر درباره کلان داده و MapReduce 10:30
  • تبدیل فایل JSON به فرمت متن ساده 07:55
  • تبدیل فایل JSON به فرمت متن ساده - ادامه 06:33
  • خروجی برای فرمت فایل JSON 04:29
  • نسبت مرد به زن در MapReduce 05:59
  • خروجی نسبت مرد و زن 06:56
  • تولید شمار زنان مسن 06:33
  • مالیات بر درآمد مورد انتظار در MapReduce 09:04
  • مالیات واقعی بر درآمد در MapReduce 05:01
  • مالیات بر درآمد سال آینده در MapReduce 05:20
  • نسبت تحصیل‌کرده به غیرتحصیل‌کرده در MapReduce 06:26
  • گزارش‌های مردم بومی در MapReduce 09:33
  • گزارش درباره قانون کار کودک در MapReduce 07:57
  • تفاوت بین Pig ،MapReduce و Hive 09:55
  • اطلاعات بیشتر درباره Pig ،MapReduce و Hive 07:22
  • پردازش داده سنسور در Pig 10:34
  • کار با تابع Pig 08:10
  • انواع تابع در Pig 08:24
  • مثالی از تابع Pig 08:03
  • کار روی موارد استفاده با توابع در PIG 08:59
  • جریان داده مورد استفاده در Pig 06:51
  • جریان داده نسبت در Pig 08:11
  • اطلاعات بیشتر درباره موارد استفاده در Pig 09:16
  • اطلاعات بیشتر درباره موارد استفاده در Pig - ادامه 08:57
  • مثالی از نسبت تحصیلی در Pig 08:34
  • فرآیند رویکرد فایل JSON در Hive 10:30
  • ویژگی‌ها و کوئری در Hive 10:30
  • کار روی موارد استفاده JSON با Hive 07:10
  • کار روی موارد استفاده JSON با Hive - ادامه 06:11
  • خروجی موارد استفاده JSON با Hive 11:01
  • اطلاعات بیشتر درباره موارد استفاده JSON در Hive 10:11
  • خلاصه پردازش داده سنسور 09:26

9,361,500 1,872,300 تومان

مشخصات آموزش

تسلط به Hive - از مبانی تا تحلیل پیشرفته کلان داده

  • تاریخ به روز رسانی: 1404/10/04
  • سطح دوره:همه سطوح
  • تعداد درس:190
  • مدت زمان :23:42:17
  • حجم :8.42GB
  • زبان:دوبله زبان فارسی
  • دوره آموزشی:AI Academy

آموزش های مرتبط

The Great Courses
2,067,000 413,400 تومان
  • زمان: 05:14:59
  • تعداد درس: 30
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
500,000 100,000 تومان
  • زمان: 01:16:19
  • تعداد درس: 12
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,580,000 316,000 تومان
  • زمان: 04:00:26
  • تعداد درس: 31
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
770,000 154,000 تومان
  • زمان: 01:57:58
  • تعداد درس: 29
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
490,000 98,000 تومان
  • زمان: 39:24
  • تعداد درس: 25
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,922,000 384,400 تومان
  • زمان: 04:52:39
  • تعداد درس: 73
  • سطح دوره:
  • زبان: دوبله فارسی
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
490,000 98,000 تومان
  • زمان: 1:04:14
  • تعداد درس: 16
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
711,000 142,200 تومان
  • زمان: 1:48:18
  • تعداد درس: 16
  • سطح دوره:
  • زبان: دوبله فارسی

آیا سوالی دارید؟

ما به شما کمک خواهیم کرد تا شغل و رشد خود را افزایش دهید.
امروز با ما تماس بگیرید