طبقهبندی صوتی با استفاده از شبکههای عصبی کانولوشن
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- تعریف محیطهای واقعی صوتی برای ضبط کلیپها جهت پیشبینی مدل یادگیری ماشین
- تهیه کلیپهای صوتی مثبت و منفی برای استفاده در یادگیری ماشین
- درج «کلمه کلیدی صوتی» برای فعالسازی پردازنده Raspberry Pi 5 در کلیپهای صوتی مثبت
- برش یک فایل صوتی به چند کلیپ برای تغذیه شبکه عصبی
- اعمال پنج مرحله بچینگ صوت خام برای استفاده در شبکه عصبی (بارگذاری، دامنه زمانی، دامنه فرکانسی، اسپکتروگرام، و تغییر اندازه)
- استفاده از Librosa، اسپکتروگرام، و Decibel صوت خام برای شبکه عصبی
- برچسبگذاری کلیپهای صوتی به عنوان صوت مثبت و منفی برای آموزش شبکه عصبی
- برش، برچسبگذاری، و دستهبندی کلیپها برای استفاده در شبکه عصبی
- استفاده از Google Colab برای ساخت برنامه پایتون با شبکه عصبی کانولوشنی جهت طبقهبندی و پیشبینی صوت و ذخیره آن به صورت مدل H5
- مونتاژ Raspberry Pi 5 و دیگر سختافزارها برای استفاده در پیشبینی صوت
- نصب پیشنیازهای نرمافزاری Raspberry Pi 5 شامل سیستم عامل، VNC viewer ،Librosa ،Tensorflow و غیره
- استفاده از FileZilla برای انتقال مدل H5 به Raspberry Pi 5
- استقرار و اجرای مدل H5 در Raspberry Pi 5 و انجام پیشبینی صوت
- استفاده از پیشبینی صوت Raspberry Pi 5 برای کنترل حرکت سروو موتور
پیشنیازهای دوره
- دانش اولیه پایتون و دانش اولیه هوش مصنوعی
توضیحات دوره
این دوره طراحی شده است تا درک واقعی از چگونگی کار با فایلهای صوتی در یادگیری ماشین را به شما ارائه دهد. در این دوره، مسیر کامل پردازش فایلهای صوتی از صفر تا صد با استفاده از پایتون به شما آموزش داده خواهد شد. همچنین، چگونگی استفاده از شبکههای عصبی کانولوشنی برای ساخت مدل هوش مصنوعی با فرمت H5 جهت طبقهبندی صوت شرح داده میشود.
این دوره به شما درک کامل از مونتاژ Raspberry Pi 5، برنامهنویسی، استقرار مدل هوش مصنوعی و پیشبینی فایلهای صوتی را میدهد. یاد میگیریم چگونه محیطهای صوتی را برای اهداف یادگیری ماشین شناسایی کنیم. چگونه فایلهای صوتی را ضبط کرده و به کلیپهای مثبت و منفی تقسیم کنیم. چگونه کلیپهای صوتی خام را پردازش کرده و کلمه کلیدی را وارد کنیم تا توسط شبکه عصبی شناسایی شود.
برچسبگذاری کلیپها، برش و بچینگ برای آمادهسازی داده جهت ورودی به شبکه عصبی اعمال کنید. مراحل لازم (بارگذاری، دامنه زمانی، دامنه فرکانسی، اسپکتروگرام و تغییر اندازه) را برای پردازش کلیپهای صوتی خام به منظور پیشبینی اعمال میکنیم. با برنامهنویسی پایتون، مدل هوش مصنوعی H5 را برای پیشبینی صوت تولید میکنیم. مدل H5 را در Raspberry Pi 5 مستقر کرده و اجرا میکنیم تا حرکت موتور سروو را با فرمان صوتی کنترل کنیم. مدل را با پیشبینی صوتی در زمان واقعی تست خواهیم کرد.
این دوره برای چه کسانی مناسب است؟
- کسانی که به درک جامع از کار با فایلهای صوتی در یادگیری ماشین نیاز دارند.
- کسانی که به درک جامع از کار با فایلهای صوتی با پایتون نیاز دارند.
- کسانی که به درک جامع از کار با فایلهای صوتی با Raspberry Pi 5 نیاز دارند.
طبقهبندی صوتی با استفاده از شبکههای عصبی کانولوشن
-
مقدمه 06:40
-
تعریف محیط های صوتی و کلمه کلیدی صوتی 04:39
-
ضبط محیط اول (سکوت) 01:59
-
ضبط محیط دوم (گفتگوی خانوادگی) 01:57
-
ضبط محیط سوم (گفتگوی خانوادگی + صدای افتادن لیوان) 01:18
-
تبدیل صدا به WAV 06:22
-
ایجاد صدای مثبت 06:09
-
ایجاد صدای مثبت - محیط گفتگوی خانوادگی 03:57
-
برش یک فایل صوتی به چندین کلیپ 3 ثانیه ای در پایتون 11:39
-
برش صدا، متعادل سازی مثبت و منفی 08:34
-
تقسیم دیتاست صوتی به آموزش و آزمون با استفاده از روش کپی-پیست 09:37
-
تقسیم دیتاست صوتی به آموزش و آزمون با استفاده از روش کپی-پیست - بخش 1 12:33
-
تقسیم دیتاست صوتی به آموزش و آزمون با استفاده از روش کپی-پیست - بخش 2 10:49
-
مرتب سازی کلیپ های صوتی 10:30
-
بارگذاری و پخش فایل های صوتی در پایتون 07:51
-
اسپکتروگرام 11:05
-
پنج مرحله پردازش صدا 11:25
-
مبانی و معنای برچسب گذاری 09:25
-
برچسب گذاری کلیپ های صوتی به عنوان مثبت و منفی 09:30
-
بچینگ 05:54
-
کتابخانه های CNN، طرح ها، کامپایل و خلاصه 10:54
-
تقسیم فایل های صوتی به دو بخش آموزش و تست CNN و برازش مدل 10:20
-
انجام پیش بینی بر روی فایل های صوتی با CNN 09:15
-
ذخیره مدل CNN به صورت H5 و تست آن 07:09
-
Raspberry Pi 5 و سایر دستگاه های سخت افزاری 05:52
-
مونتاژ Raspberry Pi 5 (نصب پدهای حرارتی، خنککننده فعال، و منبع تغذیه) 11:51
-
نصب سیستم عامل Raspberry Pi 5 07:11
-
اتصال Raspberry Pi 5 و نصب VNC 09:33
-
محیط مجازی Raspberry Pi 5 و نصب TensorFlow 09:41
-
نصب Librosa بر روی Raspberry Pi 5 و کپی مدل هوش مصنوعی با FileZilla 11:18
-
ضبط صدا با Raspberry Pi 5 07:25
-
پیش بینی صوتی با Raspberry Pi 5 09:41
-
Raspberry Pi 5 و سروو موتور 07:55
-
اجرای مدل هوش مصنوعی صوتی و تست آن در Raspberry Pi 5 07:40
مشخصات آموزش
طبقهبندی صوتی با استفاده از شبکههای عصبی کانولوشن
- تاریخ به روز رسانی: 1404/06/21
- سطح دوره:همه سطوح
- تعداد درس:34
- مدت زمان :04:37:38
- حجم :4.45GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy