دوره آموزشی
دوبله زبان فارسی
بهبود کیفیت دادهها در تحلیل دادهها و یادگیری ماشین
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- استراتژیهایی برای افزایش کیفیت دادهها
- روشهایی برای ارزیابی کیفیت دادهها
- تفسیر مصورسازی های داده
- چگونه مشکلات داده را شناسایی کنیم؟
پیش نیازهای دوره
- علاقه به کار با دادهها
- علاقه به دانستن بیشتر درباره کیفیت داده
- مهارتهای پایهای در Python برای ویدیوهای کدنویسی اختیاری مفید است.
توضیحات دوره
تمامی تصمیمات ما بر اساس دادهها است. اعضای حسی ما دادهها را جمعآوری میکنند، حافظههایمان داده است و دروننگریامان نیز داده است. اگر میخواهید تصمیمات خوب بگیرید، نیاز به دادههای با کیفیت بالا دارید.
این دوره درباره کیفیت داده است: کیفیت داده چه معنا دارد، چرا مهم است و چگونه میتوانید کیفیت دادههای خود را افزایش دهید.
در این دوره شما خواهید آموخت:
- استراتژیهای سطح بالا برای تضمین کیفیت بالای دادهها، از جمله اصطلاحات، مستندسازی و مدیریت داده، و مراحل مختلف تحقیق که میتوانید کیفیت دادهها را بررسی و افزایش دهید.
- روشهای کیفی و کمی برای ارزیابی کیفیت دادهها، از جمله بازرسی بصری، نرخ خطا و outliers. کد Python برای مشاهده پیادهسازی این مصورسازی ها و متدهای امتیازدهی با استفاده از pandas ،numpy ،seaborn و matplotlib ارائه شده است.
- متدها و الگوریتمهای خاص داده برای پاکسازی دادهها و رد کردن دادههای نامناسب یا غیرعادی. مشابه مورد بالا، کد Python برای مشاهده پیادهسازی این رویهها با استفاده از pandas ،numpy ،seaborn و matplotlib ارائه شده است.
این دوره را افراد زیر باید شرکت کنند:
- متخصصان داده که میخواهند استراتژیهای سطح بالا و رویههای سطح پایین برای ارزیابی و بهبود کیفیت دادهها را درک کنند.
- مدیران، مشتریان و همکارانی که میخواهند اهمیت کیفیت دادهها را درک کنند، حتی اگر مستقیماً با دادهها کار نکنند.
این دوره برای چه کسانی مناسب است؟
- متخصصان علم داده
- دانشجویان علم داده
- مدیران یا همکارانی که با متخصصان داده کار میکنند.
بهبود کیفیت دادهها در تحلیل دادهها و یادگیری ماشین
-
آیا این دوره برای شما مناسب است؟ 06:44
-
دانلود کد 02:57
-
خلاصهی بخش 01:09
-
آیا دادهها هستند یا داده است؟ 02:33
-
دربارهی منشأ و کیفیت داده 06:32
-
مشکلات بالقوه با داده None
-
GIGO (garbage in و garbage out) 03:29
-
کیفیت داده بر تصمیمات داده محور تأثیر میگذارد 03:55
-
خلاصهی بخش 01:55
-
مدیریت داده 06:22
-
مستندسازی داده 05:09
-
ممیزی های داده 07:56
-
چه مواردی باید در مستندسازی دادهها گنجانده شود؟ None
-
مراحل پاکسازی داده 02:59
-
بهبود کیفیت قبل از دریافت داده 08:56
-
بهبود کیفیت در حین جمعآوری داده 05:10
-
بهبود کیفیت پس از جمعآوری داده 05:20
-
بهبود کیفیت در حین تحلیل داده 03:14
-
ریسکهای نتایج مغرضانه 07:32
-
چه زمانی باید کیفیت دادهها را به حداکثر برسانید؟ None
-
خلاصهی بخش 00:33
-
ارزیابیهای کیفی در مقابل کمی کیفیت 10:15
-
ارزیابی کیفیت دادهها با چشم و با الگوریتم None
-
ارزیابیهای کیفی از طریق بازرسی بصری 13:08
-
کد: مصورسازی توزیعهای داده 16:38
-
ارزیابیهای واریانس 06:41
-
همبستگیها و ماتریسهای همبستگی 16:27
-
نرخ خطا در داده 04:42
-
سایزهای نمونهها 08:58
-
کد: اندازهگیری کیفیت داده 12:20
-
خلاصهی بخش 10:49
-
مقیاسبندی Z-score 09:08
-
مقیاسبندی Min/Max 05:02
-
اتصال (گرد کردن) 12:21
-
نرمالسازی واحد 10:32
-
تبدیل رتبه 06:29
-
تبدیلات غیرخطی 10:39
-
کد: تبدیل داده 21:44
-
خلاصهی بخش 01:18
-
Outliers چیست؟ 13:51
-
متد Z-score 09:22
-
متد Z-score تغییر یافته 03:40
-
برخورد با دادههای گمشده 06:26
-
کد: برخورد با دادههای نامناسب یا گمشده 13:59
-
خلاصهی بخش 01:09
-
بهروز ماندن با پیشرفتهای علم داده 07:51
-
آیا میتوانید همه چیز را بدانید؟ 04:23
-
آنچه دانشمندان داده میخواهند 01:44
مشخصات آموزش
بهبود کیفیت دادهها در تحلیل دادهها و یادگیری ماشین
- تاریخ به روز رسانی: 1404/06/14
- سطح دوره:مقدماتی
- تعداد درس:48
- مدت زمان :05:23:05
- حجم :1.31GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy