پاکسازی دادهها با استفاده از pandas و pyspan
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- فرصتهای پاکسازی داده را تشخیص دهید و مجموعه داده خود را برای فرآیند پاکسازی آماده کنید.
- مراحل رایج پاکسازی داده مانند مدیریت مقادیر گمشده و قالببندی ستونهای تاریخ/زمان را پیادهسازی کنید.
- تسک های پیچیده پاکسازی داده مانند حذف دادههای پرت و تقسیم/ایجاد ستونهای جدید را درک و پیادهسازی کنید.
- تکنیکهای سفارشی تبدیل داده را برای استانداردسازی و بهبود کیفیت مجموعه داده توسعه و به کار بگیرید.
پیش نیازهای دوره
- درک اولیه از برنامهنویسی Python
- درک استفاده از کتابخانههای اولیه مانند Pandas
- یک کامپیوتر با دسترسی به اینترنت
توضیحات دوره
به تکنیکهای اساسی پاکسازی داده با pandas و pyspan در Python مسلط شوید! این دوره مناسب مبتدیان به شما کمک میکند تا دادههای خام و بههمریخته را به مجموعههای داده پاک و آماده استفاده برای تحلیل تبدیل کنید. پاکسازی داده یک اولین گام حیاتی در هر پروژه داده است و در این دوره، شما مهارتهای عملی برای مقابله با مشکلات رایج دادهها را خواهید آموخت.
شما یاد خواهید گرفت چگونه:
- دادههای گمشده را به طور مؤثر مدیریت کنید.
- دادههای پرت را شناسایی و حذف کنید.
- دادهها را برای وضوح بهتر، قالببندی و سازماندهی کنید.
- فرآیند پاکسازی داده خود را با استفاده از pyspan سادهسازی کنید.
ما با یک مجموعه داده ساده شروع خواهیم کرد و تکنیکهای اساسی پاکسازی داده را گام به گام معرفی میکنیم. در پایان دوره، شما پایهای محکم در استفاده از کتابخانههای pandas و pyspan در Python برای پاکسازی و آمادهسازی دادهها خواهید داشت.
هیچ تجربه قبلی در پاکسازی داده لازم نیست، اما دانش اولیه Python مفید است. این دوره برای مبتدیان، تحلیلگران داده مشتاق، یا هر کسی که به دنبال بهبود مهارتهای آمادهسازی داده خود است، عالی میباشد.
در طول دوره، شما روی تمرینهای عملی کار خواهید کرد که به شما کمک میکند تکنیکهایی را که میآموزید در سناریوهای دنیای واقعی به کار ببرید. با تکمیل این دوره، شما آماده خواهید بود تا با اطمینان مجموعههای داده را برای تحلیل پاکسازی و آماده کنید. چه در حال ورود به حوزه تحلیل داده باشید یا فقط بخواهید مهارتهای Python خود را ارتقا دهید، این دوره اصول ضروری مورد نیاز شما را فراهم خواهد کرد.
این دوره برای چه کسانی مناسب است؟
- این دوره برای هر کسی که با دادهها کار میکند، شامل تحلیلگران داده، دانشمندان داده، و متخصصان مشتاقی که به دنبال بهبود مهارتهای پاکسازی داده خود هستند، طراحی شده است. اگر شما مکرراً با مجموعههای داده بههمریخته سروکار دارید و میخواهید فرآیند آمادهسازی داده خود را با استفاده از Python بهینهسازی کنید، این دوره بهویژه ارزشمند خواهد بود. همچنین برای دانشجویان و مبتدیان با دانش پایه Python که مشتاق تسلط به Pandas و Pyspan برای تسک ها پاکسازی داده هستند، ایدهآل است. چه در صنعت فناوری باشید یا تازه سفر دادهای خود را شروع کرده باشید، این دوره شما را به مهارتهای ضروری مجهز خواهد کرد.
پاکسازی دادهها با استفاده از pandas و pyspan
-
مقدمهای بر پاکسازی داده و بررسی دوره 02:18
-
بررسی مجموعه داده و نوشتن شبهکد 11:28
-
شروع کار با pyspan: توابع remove و handle_nulls 11:09
-
شناسایی و مدیریت دادههای پرت با pyspan 07:22
-
توابع پیشرفته pyspan: توابع format_dt و split_column 15:15
-
ارزیابی پاکسازی داده: قبل و بعد 09:22
-
جمعبندی دوره 00:30
مشخصات آموزش
پاکسازی دادهها با استفاده از pandas و pyspan
- تاریخ به روز رسانی: 1404/09/07
- سطح دوره:مقدماتی
- تعداد درس:7
- مدت زمان :57:24
- حجم :357.0MB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy