دوره آموزشی
آموزش های یودمی
دوبله زبان فارسی

طبقه‌بندی صوتی با استفاده از شبکه‌های عصبی کانولوشن

طبقه‌بندی صوتی با استفاده از شبکه‌های عصبی کانولوشن

✅ سرفصل و جزئیات آموزش

آنچه یاد خواهید گرفت:

  • تعریف محیط‌های واقعی صوتی برای ضبط کلیپ‌ها جهت پیش‌بینی مدل یادگیری ماشین
  • تهیه کلیپ‌های صوتی مثبت و منفی برای استفاده در یادگیری ماشین
  • درج «کلمه کلیدی صوتی» برای فعال‌سازی پردازنده Raspberry Pi 5 در کلیپ‌های صوتی مثبت
  • برش یک فایل صوتی به چند کلیپ برای تغذیه شبکه عصبی
  • اعمال پنج مرحله بچینگ صوت خام برای استفاده در شبکه عصبی (بارگذاری، دامنه زمانی، دامنه فرکانسی، اسپکتروگرام، و تغییر اندازه)
  • استفاده از Librosa، اسپکتروگرام، و Decibel صوت خام برای شبکه عصبی
  • برچسب‌گذاری کلیپ‌های صوتی به عنوان صوت مثبت و منفی برای آموزش شبکه عصبی
  • برش، برچسب‌گذاری، و دسته‌بندی کلیپ‌ها برای استفاده در شبکه عصبی
  • استفاده از Google Colab برای ساخت برنامه پایتون با شبکه عصبی کانولوشنی جهت طبقه‌بندی و پیش‌بینی صوت و ذخیره آن به صورت مدل H5
  • مونتاژ Raspberry Pi 5 و دیگر سخت‌افزارها برای استفاده در پیش‌بینی صوت
  • نصب پیش‌نیازهای نرم‌افزاری Raspberry Pi 5 شامل سیستم عامل، VNC viewer ،Librosa ،Tensorflow و غیره
  • استفاده از FileZilla برای انتقال مدل H5 به Raspberry Pi 5
  • استقرار و اجرای مدل H5 در Raspberry Pi 5 و انجام پیش‌بینی صوت
  • استفاده از پیش‌بینی صوت Raspberry Pi 5 برای کنترل حرکت سروو موتور

پیش‌نیازهای دوره

  • دانش اولیه پایتون و دانش اولیه هوش مصنوعی

توضیحات دوره

این دوره طراحی شده است تا درک واقعی از چگونگی کار با فایل‌های صوتی در یادگیری ماشین را به شما ارائه دهد. در این دوره، مسیر کامل پردازش فایل‌های صوتی از صفر تا صد با استفاده از پایتون به شما آموزش داده خواهد شد. همچنین، چگونگی استفاده از شبکه‌های عصبی کانولوشنی برای ساخت مدل هوش مصنوعی با فرمت H5 جهت طبقه‌بندی صوت شرح داده می‌شود.

این دوره به شما درک کامل از مونتاژ Raspberry Pi 5، برنامه‌نویسی، استقرار مدل هوش مصنوعی و پیش‌بینی فایل‌های صوتی را می‌دهد. یاد می‌گیریم چگونه محیط‌های صوتی را برای اهداف یادگیری ماشین شناسایی کنیم. چگونه فایل‌های صوتی را ضبط کرده و به کلیپ‌های مثبت و منفی تقسیم کنیم. چگونه کلیپ‌های صوتی خام را پردازش کرده و کلمه کلیدی را وارد کنیم تا توسط شبکه عصبی شناسایی شود.

برچسب‌گذاری کلیپ‌ها، برش و بچینگ برای آماده‌سازی داده‌ جهت ورودی به شبکه عصبی اعمال کنید. مراحل لازم (بارگذاری، دامنه زمانی، دامنه فرکانسی، اسپکتروگرام و تغییر اندازه) را برای پردازش کلیپ‌های صوتی خام به منظور پیش‌بینی اعمال می‌کنیم. با برنامه‌نویسی پایتون، مدل هوش مصنوعی H5 را برای پیش‌بینی صوت تولید می‌کنیم. مدل H5 را در Raspberry Pi 5 مستقر کرده و اجرا می‌کنیم تا حرکت موتور سروو را با فرمان صوتی کنترل کنیم. مدل را با پیش‌بینی صوتی در زمان واقعی تست خواهیم کرد.

این دوره برای چه کسانی مناسب است؟

  • کسانی که به درک جامع از کار با فایل‌های صوتی در یادگیری ماشین نیاز دارند.
  • کسانی که به درک جامع از کار با فایل‌های صوتی با پایتون نیاز دارند.
  • کسانی که به درک جامع از کار با فایل‌های صوتی با Raspberry Pi 5 نیاز دارند.

طبقه‌بندی صوتی با استفاده از شبکه‌های عصبی کانولوشن

  • مقدمه 06:40
  • تعریف محیط های صوتی و کلمه کلیدی صوتی 04:39
  • ضبط محیط اول (سکوت) 01:59
  • ضبط محیط دوم (گفتگوی خانوادگی) 01:57
  • ضبط محیط سوم (گفتگوی خانوادگی + صدای افتادن لیوان) 01:18
  • تبدیل صدا به WAV 06:22
  • ایجاد صدای مثبت 06:09
  • ایجاد صدای مثبت - محیط گفتگوی خانوادگی 03:57
  • برش یک فایل صوتی به چندین کلیپ 3 ثانیه ای در پایتون 11:39
  • برش صدا، متعادل سازی مثبت و منفی 08:34
  • تقسیم دیتاست صوتی به آموزش و آزمون با استفاده از روش کپی-پیست 09:37
  • تقسیم دیتاست صوتی به آموزش و آزمون با استفاده از روش کپی-پیست - بخش 1 12:33
  • تقسیم دیتاست صوتی به آموزش و آزمون با استفاده از روش کپی-پیست - بخش 2 10:49
  • مرتب سازی کلیپ های صوتی 10:30
  • بارگذاری و پخش فایل های صوتی در پایتون 07:51
  • اسپکتروگرام 11:05
  • پنج مرحله پردازش صدا 11:25
  • مبانی و معنای برچسب گذاری 09:25
  • برچسب گذاری کلیپ های صوتی به عنوان مثبت و منفی 09:30
  • بچینگ 05:54
  • کتابخانه های CNN، طرح ها، کامپایل و خلاصه 10:54
  • تقسیم فایل های صوتی به دو بخش آموزش و تست CNN و برازش مدل 10:20
  • انجام پیش بینی بر روی فایل های صوتی با CNN 09:15
  • ذخیره مدل CNN به صورت H5 و تست آن 07:09
  • Raspberry Pi 5 و سایر دستگاه های سخت افزاری 05:52
  • مونتاژ Raspberry Pi 5 (نصب پدهای حرارتی، خنک‌کننده فعال، و منبع تغذیه) 11:51
  • نصب سیستم عامل Raspberry Pi 5 07:11
  • اتصال Raspberry Pi 5 و نصب VNC 09:33
  • محیط مجازی Raspberry Pi 5 و نصب TensorFlow 09:41
  • نصب Librosa بر روی Raspberry Pi 5 و کپی مدل هوش مصنوعی با FileZilla 11:18
  • ضبط صدا با Raspberry Pi 5 07:25
  • پیش بینی صوتی با Raspberry Pi 5 09:41
  • Raspberry Pi 5 و سروو موتور 07:55
  • اجرای مدل هوش مصنوعی صوتی و تست آن در Raspberry Pi 5 07:40

1,823,500 364,700 تومان

مشخصات آموزش

طبقه‌بندی صوتی با استفاده از شبکه‌های عصبی کانولوشن

  • تاریخ به روز رسانی: 1404/06/21
  • سطح دوره:همه سطوح
  • تعداد درس:34
  • مدت زمان :04:37:38
  • حجم :4.45GB
  • زبان:دوبله زبان فارسی
  • دوره آموزشی:AI Academy

آموزش های مرتبط

The Great Courses
651,500 130,300 تومان
  • زمان: 01:39:55
  • تعداد درس: 6
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,889,000 377,800 تومان
  • زمان: 04:47:39
  • تعداد درس: 30
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,501,000 300,200 تومان
  • زمان: 03:48:11
  • تعداد درس: 47
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
10,289,500 2,057,900 تومان
  • زمان: 26:03:06
  • تعداد درس: 121
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
490,000 98,000 تومان
  • زمان: 54:55
  • تعداد درس: 18
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,797,000 359,400 تومان
  • زمان: 04:33:59
  • تعداد درس: 86
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
9,249,500 1,849,900 تومان
  • زمان: 23:25:23
  • تعداد درس: 78
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
490,000 98,000 تومان
  • زمان: 01:08:59
  • تعداد درس: 8
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
5,029,500 1,005,900 تومان
  • زمان: 12:44:39
  • تعداد درس: 121
  • سطح دوره:
  • زبان: دوبله فارسی

آیا سوالی دارید؟

ما به شما کمک خواهیم کرد تا شغل و رشد خود را افزایش دهید.
امروز با ما تماس بگیرید