بینایی رایانه ای کاربردی: تشخیص و شناسایی اشیاء
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- درک اصول شناسایی تصویر، شامل طبقهبندی تصویر، تشخیص شیء، و بخشبندی تصویر (معنایی، نمونهای و پانوبتیک)
- تسلط به تئوریها و اصول بنیادین مدلهای کلیدی بینایی کامپیوتر، برای دستیابی به درکی عمیق از عملکرد و کاربردهای آنها
- تسلط به اصول PyTorch، یادگیری چگونگی ساخت یک مدل CNN و مجموعه داده تصویری سفارشی خودتان
- پیادهسازی مدلهای پیشرفته شناسایی تصویر و آموزش آنها در PyTorch
پیشنیازهای دوره
- تجربه برنامهنویسی پایتون: آشنایی با برنامهنویسی، به ویژه در پایتون، زیرا زبان اصلی مورد استفاده در PyTorch است. دانشجویان باید با مفاهیم و ساختارهای پایه برنامهنویسی راحت باشند.
- درک مفاهیم اولیه یادگیری ماشین: دانش اساسی از اصول یادگیری ماشین، شامل اینکه مدلها چه هستند، چگونه آموزش میبینند، و درک اولیه از مفاهیمی مانند طبقهبندی، رگرسیون، بیشبرازش و کمبرازش
- دانش مقدماتی یادگیری عمیق: آشنایی با مفاهیم اولیه شبکههای عصبی، شامل اینکه چه هستند و به طور کلی چگونه ساختار یافته و آموزش میبینند.
توضیحات دوره
بینایی کامپیوتر و شناسایی شیء
این دوره یک سفر جامع به دنیای بینایی کامپیوتر و شناسایی شیء را فراهم میکند و شما را از مفاهیم اساسی تا پیادهسازی و ارزیابی مدلهای پیشرفته راهنمایی میکند. از طریق یک رویکرد عملی، شما تسک های کلیدی بینایی کامپیوتر مانند طبقهبندی تصویر، تشخیص شیء، بخشبندی معنایی و بخشبندی نمونهای را بررسی خواهید کرد. این دوره از مجموعه داده معروفی مانند COCO-2017 و CamVid و فریمورکهایی مانند PyTorch و FiftyOne برای تقویت مهارتهای عملی شما استفاده میکند.
- بخش 1: مقدمه - ما با بررسی دوره و شناسایی شیء شروع میکنیم و سپس محیط لازم برای پیادهسازی کارآمد را راهاندازی میکنیم.
- بخش 2: مروری بر شبکههای عصبی کانولوشنی (CNNs): این بخش دانش شما را در مورد CNNs مرور کرده و ابزارهای ضروری مانند FiftyOne برای مدیریت مجموعه داده را به همراه آموزشهایی برای آشنایی با PyTorch معرفی میکند.
- بخش 3: طبقهبندی تصویر - شما یاد خواهید گرفت که یک طبقهبندیکننده تصویر چندکلاسه را با استفاده از مجموعه داده COCO-2017 بسازید و آموزش دهید، با تمرکز بر کلاسهایی مانند گربه، سگ و اسب. این طبقهبندیکننده با استفاده از یک مدل ResNet از پیش آموزشدیده ساخته میشود که فرآیند یادگیری انتقالی و تیونینگ فراپارامترها را نشان میدهد.
- بخش 4: تشخیص شیء - ما با استفاده از دو مدل محبوب، Faster-RCNN و YOLOv8، به تشخیص شیء میپردازیم. شما مجموعه داده را آماده کرده، هر دو مدل را آموزش داده و عملکرد آنها را با استفاده از FiftyOne تحلیل خواهید کرد و تجربه عملی با هر دو متد تشخیص مبتنی بر ناحیه و تکمرحلهای را به دست خواهید آورد.
- بخش 5: بخشبندی معنایی - در این بخش، شما با مجموعه داده CamVid کار خواهید کرد تا بخشبندی معنایی را درک کنید، که شامل تخصیص یک کلاس به هر پیکسل در یک تصویر است. با استفاده از کتابخانه segmentation_models_pytorch، شما یک مدل بخشبندی را برای تشخیص اشیاء در صحنهها آموزش داده و ارزیابی خواهید کرد.
- بخش 6: بخشبندی نمونهای - ما بخشبندی نمونهای را پوشش میدهیم، جایی که هدف تمایز بین چندین نمونه از یک کلاس شیء یکسان است. شما یک مدل Mask-RCNN را برای این کار ساخته و آموزش خواهید داد و با حاشیهنویسیهای بخشبندی از مجموعه داده COCO-2017 کار خواهید کرد.
در طول دوره، ما تأکید زیادی بر تمرینهای عملی، مجموعه داده دنیای واقعی و ارزیابی مدل داریم تا شما را به مهارتهای لازم برای مقابله با چالشهای عملی بینایی کامپیوتر مجهز کنیم. در پایان، شما به خوبی برای پیادهسازی و ارزیابی مدلهای مختلف بینایی کامپیوتر آماده خواهید بود و درک کاملی از تفاوتهای ظریف در تسک های مختلف مانند طبقهبندی، تشخیص و بخشبندی خواهید داشت.
این دوره برای چه کسانی مناسب است؟
- دانشجویان و فراگیران علوم کامپیوتر: دانشجویان کارشناسی یا کارشناسی ارشد که در رشتههای علوم کامپیوتر، علم داده، هوش مصنوعی یا زمینههای مرتبط تحصیل میکنند و میخواهند مهارتهای عملی در شناسایی تصویر با استفاده از PyTorch کسب کنند.
- دانشمندان داده و مهندسان یادگیری ماشین آینده: افرادی که به دنبال ورود به حوزه علم داده یا یادگیری ماشین با علاقه خاص به تکنیکهای پردازش و شناسایی تصویر هستند.
- علاقهمندان به هوش مصنوعی و یادگیری ماشین: افرادی که علاقه زیادی به هوش مصنوعی و یادگیری ماشین دارند و میخواهند درک خود را از شناسایی تصویر تعمیق بخشند.
- کارآفرینان حوزه فناوری: کارآفرینان یا نوآورانی که به دنبال درک شناسایی تصویر برای پیادهسازی یا بهبود محصولات خود، به ویژه در بازارهای فناوری محور هستند.
بینایی رایانه ای کاربردی: تشخیص و شناسایی اشیاء
-
مقدمه دوره 02:07
-
مفاهیم اصولی در شناسایی تصویر 06:56
-
کانولوشن یکبعدی (1D) 05:22
-
کانولوشن دوبعدی (2D) 03:05
-
ادغام و زیرنمونهبرداری 02:16
-
توابع فعالسازی 03:07
-
توابع فعالسازی None
-
ساخت یک CNN اولیه 04:06
-
پسانتشار 02:19
-
حذف تصادفی 02:10
-
مقدمهای بر طبقهبندی تصویر 03:57
-
طبقهبندی چندکلاسه در مقابل چندبرچسبی None
-
ساخت یک طبقهبندیکننده تصویر 03:31
-
خانواده مدلهای ResNet 05:04
-
معماریش ResNet None
-
مدلهای Torchvision 01:32
-
معیارهای عملکرد برای طبقهبندی تصویر 06:04
-
عملکرد طبقهبندی None
-
آشنایی با تشخیص شیء 03:13
-
مدلهای تشخیص شیء 01:35
-
تشخیصدهندههای شیء دو مرحلهای: R-CNN - قسمت 1 02:39
-
تشخیصدهندههای شیء دو مرحلهای: R-CNN - قسمت 2 02:59
-
تشخیصدهندههای شیء دو مرحلهای: R-CNN - قسمت 3 02:51
-
تشخیصدهندههای شیء دو مرحلهای: R-CNN - قسمت 4 02:15
-
پسپردازش در تشخیص شیء: سرکوب غیربیشینه 01:33
-
سرکوب غیربیشینه None
-
معیارهای ارزیابی عملکرد تشخیص شیء 04:34
-
آشنایی با بخشبندی معنایی 01:55
-
مدلهای بخشبندی معنایی 06:14
-
مدلهای تقسیمبندی None
-
بخشبندی معنایی در PyTorch 02:41
-
توابع زیان برای بخشبندی معنایی 03:27
-
معیارهای ارزیابی عملکرد برای بخشبندی معنایی 04:11
-
آشنایی با بخشبندی نمونهای و پانوبتیک 04:06
-
تسک های تقسیمبندی None
-
مدلهای تقسیمبندی نمونهای 05:26
-
بخشبندی نمونهای با Mask R-CNN در PyTorch 04:47
-
بخشبندی نمونهای با YOLO (Ultralytics) 02:22
مشخصات آموزش
بینایی رایانه ای کاربردی: تشخیص و شناسایی اشیاء
- تاریخ به روز رسانی: 1404/06/21
- سطح دوره:متوسط
- تعداد درس:38
- مدت زمان :02:06:49
- حجم :792.0MB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy