دوره آموزشی
The Great Courses
دوبله زبان فارسی

اصول LLMs: مدل‌های Tokenization و Word Embeddings

اصول LLMs: مدل‌های Tokenization و Word Embeddings

✅ سرفصل و جزئیات آموزش

آنچه یاد خواهید گرفت:

  • تسلط به اصول LLM و چت‌بات‌های هوش مصنوعی از طریق درک چگونگی و چرایی عملکرد مدل‌های Word Embeddings و Tokenization
  • یادگیری چگونگی ساخت و استفاده از مدل‌های Word Embeddings برای کاربردهای دنیای واقعی مانند سیستم‌های پرسش و پاسخ
  • توسعه یک LLM "مینیاتوری اولیه"
  • تسلط به ریاضیات پایه LLMها به ساده‌ترین و بصری‌ترین روش.
  • یادگیری عملی چگونگی استفاده از Pytorch برای ساخت مدل‌های Word Embeddings

پیش‌نیازهای دوره

  • دانش اولیه برنامه‌نویسی Python
  • دانش اولیه شبکه‌های عصبی

توضیحات دوره

در این دوره عملی و مناسب برای مبتدیان، مدرس اسرار اساسی پشت مدل‌های زبانی بزرگ (LLMها) و چت‌بات‌های هوش مصنوعی را آشکار می‌کند تا بلوک‌های سازنده اصلی سیستم‌های NLP مدرن را ابهام‌زدایی کند. چه توسعه‌دهنده مشتاق باشید، چه علاقه‌مند به هوش مصنوعی یا متخصص باسابقه که به دنبال بینش‌های عمیق‌تر است، این دوره رویکردی روشن، بصری و عملی برای درک Tokenization و Word Embeddings دو رکن اصلی معماری LLM ارائه می‌دهد. شما درک واقعی از چگونگی و چرایی عملکرد مدل‌های Word Embedding و Tokenization به دست خواهید آورد.

از طریق بیش از 6 ساعت محتوای ویدئویی تعاملی، فراگیران بررسی می‌کنند که چگونه Tokenization متن خام را به واحدهای قابل خواندن برای ماشین تبدیل می‌کند و چگونه Word Embeddings معنای معنایی را در فضای چندبعدی ثبت می‌کنند. شما یاد خواهید گرفت که مدل‌های Word Embedding خود را با استفاده از PyTorch بسازید، آن‌ها را در تسک های دنیای واقعی مانند پرسش و پاسخ به کار ببرید و حتی یک LLM مینیاتوری ابتدا را از ابتدا توسعه دهید.

مدرس مفاهیم پیچیده ریاضی را به درس‌های قابل هضم تقسیم می‌کند و اطمینان می‌دهد که شما نه تنها "چگونگی"، بلکه "چرایی" پشت هر تکنیک را درک کنید. در پایان، شما اصول قوی در مکانیک LLMها و اعتماد به نفس لازم برای به کارگیری این مهارت‌ها در پروژه‌های عملی هوش مصنوعی خواهید داشت.

بدون پیش‌نیازهای پیشرفته فقط دانش اولیه Python و شبکه عصبی نیاز است. اگر آماده‌اید فراتر از تبلیغات بروید و واقعاً درک کنید که چت‌بات‌های هوش مصنوعی در زیر کاپوت چگونه کار می‌کنند، این دوره سکوی پرتاب شماست.

این دوره برای چه کسانی مناسب است؟

  • مبتدیان با دانش اولیه برنامه‌نویسی Python و شبکه‌های عصبی که به دنبال درک واقعی و دانش عملی از اصول LLMها و چت‌بات‌های هوش مصنوعی هستند.
  • علاقه‌مندان به هوش مصنوعی، مدیران کسب‌وکار یا هر کسی که به دنبال یک مرور کلی بصری و واضح از اصول LLMها و چت‌بات‌های هوش مصنوعی است.
  • توسعه‌دهندگان/متخصصان مشتاقی که به دنبال درک واقعی و دانش عملی از مبانی LLMها و چت‌بات‌های هوش مصنوعی هستند.
  • متخصصان در این زمینه که به دنبال درک بهتر و بینش‌های عمیق‌تر هستند.
  • هر کسی که به دنبال دانش عملی در مورد پایه‌های اصلی LLMها و چت‌بات‌های هوش مصنوعی است.

اصول LLMs: مدل‌های Tokenization و Word Embeddings

  • مقدمه 02:38
  • مقدمه‌ای بر Tokenization و الگوریتم WordPiece Tokenization 08:04
  • الگوریتم WordPiece Tokenization: کاراکترهای انفرادی 03:42
  • الگوریتم WordPiece Tokenization: جفت‌های دو کاراکتری 11:35
  • الگوریتم WordPiece Tokenization: محاسبات امتیاز و جفت‌های چند کاراکتری 13:25
  • جلسه عملی: Tokenization 05:34
  • مقدمه‌ای بر مدل‌های Word Embeddings و Word2vec 05:49
  • مدل Word Embeddings نوع CBOW چگونه کار می‌کند؟ 13:05
  • اصول CBOW 09:54
  • فرآیند آموزش مدل CBOW 07:24
  • کارایی پیاده‌سازی عملی و ریاضیات CBOW 15:18
  • آزمون تعاملی (iQuiz): چرا تابع فعال‌سازی وجود ندارد؟ 08:36
  • مصورسازی معماری مدل CBOW 10:14
  • جزئیات بیشتر در مورد معماری مدل CBOW 07:34
  • جستجوی عملی Embedding 06:02
  • مصورسازی ماتریس Embeddings 15:34
  • پس از آموزش: استفاده از مدل CBOW (استنتاج) 09:27
  • مدل Word Embeddings نوع Skip-gram 15:01
  • خلاصه جامع مدل‌های Word Embeddings 06:42
  • عملی: ساخت تابع برای Tokenization و واژگان سفارشی 14:33
  • عملی: تابع برای آماده‌سازی داده‌های آموزشی 16:38
  • عملی: ادامه آماده‌سازی داده‌های آموزشی 19:49
  • عملی: ساخت مدل CBOW با Pytorch 24:18
  • عملی: ساخت مدل Skip-gram با استفاده از Pytorch 22:44
  • عملی: پیاده‌سازی تابع برای آموزش مدل‌ها در Pytorch 22:01
  • عملی: نوشتن کدها برای آموزش مدل‌ها روی داده‌های نمونه 23:04
  • عملی: نوشتن کدها برای تست مدل‌ها و اجرای همه موارد 25:48
  • عملی: نتایج + LLM پرسش و پاسخ مینیاتوری اولیه 14:05
  • عملی: استفاده از مدل‌های Word Embeddings از پیش آموزش‌دیده + تست روابط 11:52
  • مدل‌های Transformer 03:27
  • LLMها و چت‌بات‌های هوش مصنوعی 00:44

2,462,000 492,400 تومان

مشخصات آموزش

اصول LLMs: مدل‌های Tokenization و Word Embeddings

  • تاریخ به روز رسانی: 1404/10/04
  • سطح دوره:متوسط
  • تعداد درس:31
  • مدت زمان :06:14:41
  • حجم :1.4GB
  • زبان:دوبله زبان فارسی
  • دوره آموزشی:AI Academy

آموزش های مرتبط

The Great Courses
651,500 130,300 تومان
  • زمان: 01:39:55
  • تعداد درس: 6
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,889,000 377,800 تومان
  • زمان: 04:47:39
  • تعداد درس: 30
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,501,000 300,200 تومان
  • زمان: 03:48:11
  • تعداد درس: 47
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
10,289,500 2,057,900 تومان
  • زمان: 26:03:06
  • تعداد درس: 121
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
490,000 98,000 تومان
  • زمان: 54:55
  • تعداد درس: 18
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,797,000 359,400 تومان
  • زمان: 04:33:59
  • تعداد درس: 86
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
9,269,000 1,853,800 تومان
  • زمان: 23:28:00
  • تعداد درس: 170
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
500,000 100,000 تومان
  • زمان: 01:16:19
  • تعداد درس: 12
  • سطح دوره:
  • زبان: دوبله فارسی
The Great Courses
1,580,000 316,000 تومان
  • زمان: 04:00:26
  • تعداد درس: 31
  • سطح دوره:
  • زبان: دوبله فارسی

آیا سوالی دارید؟

ما به شما کمک خواهیم کرد تا شغل و رشد خود را افزایش دهید.
امروز با ما تماس بگیرید