تسلط به Hive - از مبانی تا تحلیل پیشرفته کلان داده
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- آشنایی با Hive: درک اصول Hive و نقش آن در اکوسیستم هدوپ
- مدیریت پایگاه داده Hive: یاد بگیرید چگونه پایگاه دادهها و جداول Hive را ایجاد و مدیریت کنید.
- بارگذاری و دستکاری داده: تسلط به تکنیکهای بارگذاری داده در Hive و انجام عملیاتهای دستکاری داده
- کوئری کردن پیشرفته: اجرای کوئریهای پیچیده با HiveQL، شامل جوینها، پارتیشنها و bucketing
- توابع Hive: استفاده از توابع داخلی Hive برای پردازش و تحلیل داده
- توابع تعریفشده توسط کاربر (UDF): ایجاد و پیادهسازی UDFهای سفارشی برای گسترش قابلیتهای Hive
- یکپارچهسازی Hive با HBase: بررسی یکپارچهسازی Hive با HBase برای ذخیرهسازی و بازیابی موثر داده
- مطالعات موردی واقعی: بهکارگیری دانش Hive در مطالعات موردی عملی در صنایع مختلف، مانند مخابرات و شبکههای اجتماعی
- Hive در کنار سایر ابزارهای کلان داده: یادگیری استفاده همزمان از Hive با Pig ،MapReduce و Sqoop برای تحلیل جامع داده
- تحلیل داده سنسور: کسب تجربه عملی در پردازش و تحلیل داده سنسور با Hive و Pig
پیشنیازهای دوره
- درک اولیه از اس کیوال
- آشنایی با اکوسیستم هدوپ و مفاهیم کلان داده
- دانش اولیه برنامهنویسی، ترجیحاً در پایتون یا جاوا
- دسترسی به کامپیوتری با اتصال اینترنت برای تمرینهای عملی
توضیحات دوره
دانشجویان درک جامعی از Hive، از اصول تا مباحث پیشرفته، کسب خواهند کرد. آنها یاد میگیرند چگونه پایگاه دادههای Hive را ایجاد و مدیریت کنند، داده را بارگذاری و دستکاری کنند، کوئریهای پیچیده را اجرا نمایند و از ویژگیهای قدرتمند Hive برای پارتیشنبندی، bucketing و ایندکسگذاری استفاده کنند. علاوه بر این، دانشجویان مطالعات موردی و پروژههای عملی را بررسی خواهند کرد و دانش خود را در سناریوهای واقعی مانند تحلیل صنعت مخابرات، تحلیل شکایات مشتریان، تحلیل شبکههای اجتماعی و تحلیل داده سنسور بهکار میگیرند.
بخش 1: Hive - مقدماتی
در این بخش، دانشجویان با Hive، ابزاری لازم برای مدیریت و کوئری مجموعه کلان داده ذخیرهشده در هدوپ، آشنا میشوند. آنها مبانی Hive، از جمله ایجاد پایگاه داده، بارگذاری داده و دستکاری جداول را میآموزند. موضوعاتی مانند جداول خارجی، Hive Metastore و پارتیشنها را همراه با مثالهای عملی از ایجاد جداول پارتیشنبندی شده، استفاده از پارتیشنهای پویا و اجرای جوینها در Hive پوشش میدهیم. همچنین، مفهوم توابع تعریفشده توسط کاربر (UDF) و چگونگی پیادهسازی آنها را بررسی میکنیم.
بخش 2: Hive - پیشرفته
این بخش بر دانش اولیه تکیه دارد و به مفاهیم پیشرفته Hive میپردازد. دانشجویان با جداول داخلی و خارجی، درج داده و توابع مختلف Hive آشنا میشوند. این بخش تکنیکهای پیشرفته پارتیشنبندی، bucketing، نمونهبرداری از جدول و ایندکسگذاری را پوشش میدهد. نمایشهای عملی شامل ایجاد viewها، استفاده از متغیرهای Hive و آشنایی با معماری Hive است. دانشجویان قابلیتهای موازی بودن Hive، ویژگیهای جدول و چگونگی مدیریت و فشردهسازی فایلها در Hive رابررسی میکنند.
بخش 3: پروژه 1 - جداول Hive مدیریتشده توسط HBase
این بخش بر یکپارچهسازی Hive با HBase، یک پایگاه داده توزیعشده تمرکز دارد. دانشجویان میآموزند چگونه جداول Hive مدیریت شده و خارجی را ایجاد و مدیریت کنند و پیچیدگیهای پارتیشنهای استاتیک و پویا را درک میکنند. آنها تجربه عملی در ایجاد جوینها، viewها و ایندکسها کسب میکنند و با انواع داده پیچیده در Hive آشنا میشوند. این بخش با پروژههای پیادهسازی عملی شامل Hive و HBase به اوج خود میرسد و کاربردها و موارد استفاده واقعی را به نمایش میگذارد.
بخش 4: پروژه 2 - مطالعه موردی در صنعت مخابرات با Hive
دانشجویان دانش Hive خود را در مطالعه موردی صنعت مخابرات به کار میگیرند. این پروژه شامل کار با داده ساده و پیچیده، ایجاد و مدیریت جداول و استفاده از پارتیشنبندی و bucketing برای سازماندهی داده است. دانشجویان یاد میگیرند چگونه عملیاتهای مختلف داده را انجام دهند، سرویسهای کنترل جدول را درک میکنند و جداول قرارداد را ایجاد میکنند. این پروژه عملی بینشهای ارزشمندی از کاربرد Hive در تحلیل داده صنعت ارائه میدهد.
بخش 5: پروژه 3 - تحلیل شکایات مشتریان با Hive - بررسی MapReduce
در این بخش، دانشجویان داده شکایات مشتریان را با Hive و MapReduce تحلیل میکنند. آنها یاد میگیرند چگونه فایلهای درایور ایجاد کرده، داده لوکیشنهای خاص را پردازش کنند و شکایات را بر اساس لوکیشن دستهبندی کنند. این پروژه قدرت Hive و MapReduce در مدیریت کلان داده را نشان میدهد و تجربه عملی در پردازش و تحلیل داده فراهم میکند.
بخش 6: پروژه 4 - تحلیل شبکههای اجتماعی با HIVE ،PIG ،Sqoop و MapReduce
این بخش به یکپارچهسازی Hive با ابزارهای دیگر کلان داده مانند Pig ،MapReduce و Sqoop برای تحلیل داده شبکههای اجتماعی میپردازد. دانشجویان یاد میگیرند چگونه داده شبکههای اجتماعی را پردازش و تحلیل کنند، انتقال داده از RDMS به HDFS را انجام دهند و برنامههای MapReduce را اجرا کنند. پروژه شامل تمرینهای عملی در پردازش فایلهای XML، تحلیل نظرات و عملکرد کتاب و کار با مجموعه دادههای پیچیده از طریق Hive و Pig است.
بخش 7: پروژه 5 - تحلیل داده سنسور با Hive و Pig
بخش نهایی بر تحلیل داده سنسور با Hive و Pig تمرکز دارد. دانشجویان مبانی کلان داده و MapReduce را فرا میگیرند و یاد میگیرند چگونه فایلهای JSON را به فرمت متنی ساده تبدیل کنند. آنها وظایف مختلف تحلیل داده، از جمله محاسبه نسبتها، تولید گزارشها و پردازش داده با توابع Pig را انجام میدهند. این پروژه تجربه کاملی از پردازش و تحلیل داده سنسور ارائه میدهد و کاربردهای عملی Hive و Pig را در سناریوهای واقعی نشان میدهد.
نتیجهگیری
این دوره سفری کامل از درک مبانی Hive تا تسلط به تکنیکهای پیشرفته تحلیل کلان داده ارائه میدهد. با ترکیب دانش نظری و پروژههای عملی، دانشجویان مهارتهای لازم برای مدیریت، تحلیل و استخراج بینشها از کلان داده با Hive را کسب خواهند کرد. چه مهندس داده باشید، چه تحلیلگر داده یا کارآفرین فناوری، این دوره شما را به ابزارها و دانش لازم برای برتری در دنیای کلان داده مجهز میکند.
این دوره برای چه کسانی مناسب است؟
- مهندسان داده آینده: افرادی که هدفشان ساخت حرفهای در مهندسی داده و تحلیل کلان داده است.
- علاقهمندان به کلان داده: هر کسی که به فناوریها و تحلیل کلان داده علاقهمند است.
- تحلیلگران داده: متخصصانی که میخواهند مهارت تحلیل داده خود را با Hive ارتقا دهند.
- دانشجویان: دانشجویان علوم کامپیوتر و مهندسی که به یادگیری فناوریهای کلان داده علاقه دارند.
- متخصصان فناوری اطلاعات: افرادی که به دنبال ارتقاء مهارت و ورود به حوزه کلان داده هستند.
- توسعهدهندگان نرمافزار: توسعهدهندگانی که میخواهند قابلیتهای Hive را در برنامههای خود یکپارچهسازی کنند.
- کارآفرینان فناوری: کارآفرینانی که قصد دارند راهحلهای کلان داده را در استارتاپهای خود پیادهسازی کنند.
تسلط به Hive - از مبانی تا تحلیل پیشرفته کلان داده
-
آشنایی با HIVE 10:45
-
پایگاه داده Hive 10:21
-
فرمان بارگذاری داده 05:37
-
چگونه ستون را جایگزین کنیم؟ 04:17
-
جدول خارجی 06:26
-
HIVE Metastore 03:25
-
پارتیشن در Hive چیست؟ 09:45
-
ایجاد جدول پارتیشن 08:30
-
Insert Overwrite جدول 03:55
-
Dynamic Partition True 01:57
-
Bucketing در Hive 05:24
-
تجزیه مجموعه دادهها 05:30
-
جوینها در Hive 08:51
-
جوینها در Hive - ادامه 09:45
-
Skew Join 02:54
-
Serde چیست؟ 07:29
-
Serde در Hive 08:55
-
تابع تعریفشده توسط کاربر (UDF) در Hive 09:46
-
تابع تعریفشده توسط کاربر (UDF) در Hive - ادامه 07:28
-
اطلاعات بیشتر درباره توابع تعریفشده توسط کاربر در Hive 06:58
-
تابع Maxcale 03:01
-
مثال کاربرد Hive 12:04
-
آشنایی با مفاهیم Hive و نمایش عملی 05:59
-
جدول داخلی و جدول خارجی 06:19
-
درج داده در جداول 07:25
-
توابع تاریخ و ریاضی 09:00
-
دستورات شرطی 06:40
-
Explode و Lateral View 07:59
-
مرتبسازی 06:18
-
جوین 08:44
-
Map Join 02:10
-
پارتیشنبندی استاتیک و پویا 07:17
-
اطلاعات بیشتر درباره پارتیشنبندی پویا 06:59
-
فرمان Alter 06:15
-
فرمان MSCK 08:44
-
Bucketing 08:08
-
نمونهبرداری جدول 03:05
-
بایگانی 02:44
-
رتبهها 08:44
-
ایجاد Viewها 08:39
-
مزایای Viewها و تغییر Viewها 06:50
-
ایندکسگذاری چیست؟ 05:49
-
رانتایم ایندکس Compact و Bitmap 05:25
-
فرمانهای Hive در شل Bash 05:24
-
متغیرهای Hive - بررسی Hiveconf 04:10
-
متغیرهای Hive - بررسی Hiveconf در شل Bash 05:08
-
پیکربندی متغیر Hive Var 08:57
-
جانشینی متغیر 02:14
-
شمارش کلمات 05:47
-
معماری Hive 03:14
-
موازی بودن در Hive 06:14
-
خصوصیات جدول در Hive 06:06
-
خصوصیات فرمت Null 05:31
-
خصوصیات فرمت Null - ادامه 03:39
-
فرمانهای Purge در Hive 04:41
-
Slowing Changing Dimension 06:56
-
پیادهسازی SCD 08:57
-
مثالی از SCD 04:02
-
چگونه داده XML را در Hive بارگذاری کنیم؟ 05:11
-
چگونه داده XML را در Hive بارگذاری کنیم؟ - ادامه 08:48
-
No Drop و آفلاین در Hive 08:09
-
جدول غیرقابل تغییر 09:09
-
چگونه فایل RC را در Hive ایجاد کنیم؟ 08:38
-
جداول متعدد 06:25
-
ادغام فایلهای ایجاد شده توسط Hive و تابع rLike 05:32
-
تنظیمات مختلف پیکربندی در Hive 09:07
-
تنظیمات مختلف پیکربندی در Hive - ادامه 03:12
-
فشردهسازی فایلهای مختلف در Hive 05:45
-
حالتهای مختلف در Hive 03:54
-
فشردهسازی فایل در Hive 05:30
-
انواع حالتها در Hive 03:56
-
مقایسه جدول داخلی و خارجی 08:19
-
آشنایی با HIVE 11:53
-
ایجاد جداول Hive 08:24
-
جداول مدیریتشده در Hive 04:22
-
جداول خارجی در Hive 06:45
-
اطلاعات بیشتر درباره جداول خارجی در Hive 06:08
-
جداول با لوکیشن 11:16
-
پارتیشنهای استاتیک 11:36
-
پارتیشنهای پویا 06:54
-
پارتیشنهای پویا - ادامه 06:59
-
افزودن پارتیشنها 12:00
-
فرمتهای فایل 12:05
-
Bucketing و کد آن در Hive 11:24
-
آشنایی با جوینها در Hive 05:52
-
مثالی از جوینها در Hive 09:14
-
ایجاد فضای جوین در Hive 06:02
-
ایجاد فضای جوین در Hive - ادامه 06:49
-
Viewها و مثال آن در Hive 11:27
-
ایندکسها 06:25
-
نمونههایی از ایندکس 07:29
-
انواع داده پیچیده 12:00
-
انواع داده پیچیده - ادامه 07:33
-
نمونههایی از انواع داده در Hive 05:14
-
3 نوع داده 11:49
-
اسکریپتهای Hive و مثال آن 14:05
-
تابع تعریفشده توسط کاربر و مزایای آن در Hive 05:46
-
مثالی از تابع تعریفشده توسط کاربر در Hive 08:06
-
پیادهسازی عملی تابع تعریفشده توسط کاربر 06:27
-
پیادهسازی عملی تابع تعریفشده توسط کاربر - ادامه 08:08
-
انواع جداول در Hive 05:22
-
مثالی از انواع جدول در Hive 07:12
-
ایجاد جداول با Hive و HBase 06:02
-
مزایا و معایب Hive و HBase 06:39
-
ایجاد جدول HBase با چندین ستون 07:56
-
مثالی از ایجاد جدول HBase با چندین ستون 05:07
-
جداول Hive مدیریتشده توسط HBase 07:26
-
جداول Hive مدیریتشده با HBase - ادامه 06:01
-
سینتکس جداول Hive مدیریتشده با HBase 07:11
-
مثالی از جداول Hive مدیریتشده با HBase 05:34
-
آشنایی با Hive 07:48
-
نوع داده ساده و پیچیده در Hive 08:48
-
خوشهها 00:29
-
فرمان پایگاه داده در Hive 11:51
-
فرمان جداول در Hive 05:39
-
مدیریت جداول 06:29
-
جداول خارجی 01:31
-
آشنایی با پارتیشنبندی 07:08
-
فرمان پارتیشن 06:55
-
Bucketing 08:01
-
سرویسهای کنترل جدول در Hive 11:06
-
مثالی از سرویسهای کنترل 06:36
-
مثالی از سرویسهای کنترل - ادامه 05:04
-
ایجاد همه جداول قرارداد 10:42
-
آشنایی با پروژه شکایات مشتری در کلان داده 11:34
-
شکایت ثبت شده زیر هر فایل 09:57
-
ایجاد فایلهای Driver و Jar Manifest 10:21
-
ایجاد فایلهای Driver و Jar Manifest - ادامه 02:05
-
شکایت ثبت شده از لوکیشن خاص 05:34
-
لوکیشن تعریفشده توسط کاربر 07:35
-
لیست شکایات گروهبندی شده بر اساس لوکیشن 06:09
-
آشنایی با صنعت شبکههای اجتماعی 08:35
-
وبسایت بوکمارکینگ 07:39
-
وبسایت بوکمارکینگ - ادامه 05:19
-
آشنایی با Sqoop 07:22
-
دریافت داده از RDMS به HDFS 08:51
-
اجرای برنامه MapReduce برای پردازش فایل XML 12:06
-
تحلیل عملکرد کتاب بر اساس نظرات با کد 07:07
-
تحلیل عملکرد کتاب بر اساس نظرات با کد - ادامه 08:48
-
تحلیل کتاب بر اساس لوکیشن 07:24
-
مثالی از تحلیل کتاب بر اساس لوکیشن 06:50
-
تحلیل خواننده کتاب در برابر نویسنده 10:22
-
چگونه فایل XML را در PIG پردازش کنیم؟ 06:25
-
چگونه فایل XML را در PIG پردازش کنیم؟ - ادامه 08:06
-
تحلیل عملکرد کتاب در فایل XML در PIG 10:04
-
اطلاعات بیشتر درباره تحلیل عملکرد کتاب در فایل XML در PIG 10:04
-
خروجی فایل XML در Pig با کتاب 09:28
-
خروجی فایل XML در Pig با لوکیشن 09:32
-
خروجی فایل XML در Pig با لوکیشن - ادامه 08:36
-
آشنایی با مجموعه داده پیچیده با Hive 11:37
-
آشنایی با مجموعه داده پیچیده با Hive - ادامه 09:40
-
ایجاد آرایه در MapReduce با Hive 09:59
-
مجموعه داده نوع بوکمارکینگ با نوع پیچیده 08:31
-
خروجی مجموعه داده نوع بوکمارکینگ 09:46
-
آشنایی با تحلیل داده سنسور 07:26
-
آشنایی با تحلیل داده سنسور - ادامه 10:20
-
مثالی از تحلیل داده سنسور 10:46
-
درک اساس کلان داده و MapReduce 08:08
-
اطلاعات بیشتر درباره کلان داده و MapReduce 10:30
-
تبدیل فایل JSON به فرمت متن ساده 07:55
-
تبدیل فایل JSON به فرمت متن ساده - ادامه 06:33
-
خروجی برای فرمت فایل JSON 04:29
-
نسبت مرد به زن در MapReduce 05:59
-
خروجی نسبت مرد و زن 06:56
-
تولید شمار زنان مسن 06:33
-
مالیات بر درآمد مورد انتظار در MapReduce 09:04
-
مالیات واقعی بر درآمد در MapReduce 05:01
-
مالیات بر درآمد سال آینده در MapReduce 05:20
-
نسبت تحصیلکرده به غیرتحصیلکرده در MapReduce 06:26
-
گزارشهای مردم بومی در MapReduce 09:33
-
گزارش درباره قانون کار کودک در MapReduce 07:57
-
تفاوت بین Pig ،MapReduce و Hive 09:55
-
اطلاعات بیشتر درباره Pig ،MapReduce و Hive 07:22
-
پردازش داده سنسور در Pig 10:34
-
کار با تابع Pig 08:10
-
انواع تابع در Pig 08:24
-
مثالی از تابع Pig 08:03
-
کار روی موارد استفاده با توابع در PIG 08:59
-
جریان داده مورد استفاده در Pig 06:51
-
جریان داده نسبت در Pig 08:11
-
اطلاعات بیشتر درباره موارد استفاده در Pig 09:16
-
اطلاعات بیشتر درباره موارد استفاده در Pig - ادامه 08:57
-
مثالی از نسبت تحصیلی در Pig 08:34
-
فرآیند رویکرد فایل JSON در Hive 10:30
-
ویژگیها و کوئری در Hive 10:30
-
کار روی موارد استفاده JSON با Hive 07:10
-
کار روی موارد استفاده JSON با Hive - ادامه 06:11
-
خروجی موارد استفاده JSON با Hive 11:01
-
اطلاعات بیشتر درباره موارد استفاده JSON در Hive 10:11
-
خلاصه پردازش داده سنسور 09:26
مشخصات آموزش
تسلط به Hive - از مبانی تا تحلیل پیشرفته کلان داده
- تاریخ به روز رسانی: 1404/10/04
- سطح دوره:همه سطوح
- تعداد درس:190
- مدت زمان :23:42:17
- حجم :8.42GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy