اصول LLMs: مدلهای Tokenization و Word Embeddings
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- تسلط به اصول LLM و چتباتهای هوش مصنوعی از طریق درک چگونگی و چرایی عملکرد مدلهای Word Embeddings و Tokenization
- یادگیری چگونگی ساخت و استفاده از مدلهای Word Embeddings برای کاربردهای دنیای واقعی مانند سیستمهای پرسش و پاسخ
- توسعه یک LLM "مینیاتوری اولیه"
- تسلط به ریاضیات پایه LLMها به سادهترین و بصریترین روش.
- یادگیری عملی چگونگی استفاده از Pytorch برای ساخت مدلهای Word Embeddings
پیشنیازهای دوره
- دانش اولیه برنامهنویسی Python
- دانش اولیه شبکههای عصبی
توضیحات دوره
در این دوره عملی و مناسب برای مبتدیان، مدرس اسرار اساسی پشت مدلهای زبانی بزرگ (LLMها) و چتباتهای هوش مصنوعی را آشکار میکند تا بلوکهای سازنده اصلی سیستمهای NLP مدرن را ابهامزدایی کند. چه توسعهدهنده مشتاق باشید، چه علاقهمند به هوش مصنوعی یا متخصص باسابقه که به دنبال بینشهای عمیقتر است، این دوره رویکردی روشن، بصری و عملی برای درک Tokenization و Word Embeddings دو رکن اصلی معماری LLM ارائه میدهد. شما درک واقعی از چگونگی و چرایی عملکرد مدلهای Word Embedding و Tokenization به دست خواهید آورد.
از طریق بیش از 6 ساعت محتوای ویدئویی تعاملی، فراگیران بررسی میکنند که چگونه Tokenization متن خام را به واحدهای قابل خواندن برای ماشین تبدیل میکند و چگونه Word Embeddings معنای معنایی را در فضای چندبعدی ثبت میکنند. شما یاد خواهید گرفت که مدلهای Word Embedding خود را با استفاده از PyTorch بسازید، آنها را در تسک های دنیای واقعی مانند پرسش و پاسخ به کار ببرید و حتی یک LLM مینیاتوری ابتدا را از ابتدا توسعه دهید.
مدرس مفاهیم پیچیده ریاضی را به درسهای قابل هضم تقسیم میکند و اطمینان میدهد که شما نه تنها "چگونگی"، بلکه "چرایی" پشت هر تکنیک را درک کنید. در پایان، شما اصول قوی در مکانیک LLMها و اعتماد به نفس لازم برای به کارگیری این مهارتها در پروژههای عملی هوش مصنوعی خواهید داشت.
بدون پیشنیازهای پیشرفته فقط دانش اولیه Python و شبکه عصبی نیاز است. اگر آمادهاید فراتر از تبلیغات بروید و واقعاً درک کنید که چتباتهای هوش مصنوعی در زیر کاپوت چگونه کار میکنند، این دوره سکوی پرتاب شماست.
این دوره برای چه کسانی مناسب است؟
- مبتدیان با دانش اولیه برنامهنویسی Python و شبکههای عصبی که به دنبال درک واقعی و دانش عملی از اصول LLMها و چتباتهای هوش مصنوعی هستند.
- علاقهمندان به هوش مصنوعی، مدیران کسبوکار یا هر کسی که به دنبال یک مرور کلی بصری و واضح از اصول LLMها و چتباتهای هوش مصنوعی است.
- توسعهدهندگان/متخصصان مشتاقی که به دنبال درک واقعی و دانش عملی از مبانی LLMها و چتباتهای هوش مصنوعی هستند.
- متخصصان در این زمینه که به دنبال درک بهتر و بینشهای عمیقتر هستند.
- هر کسی که به دنبال دانش عملی در مورد پایههای اصلی LLMها و چتباتهای هوش مصنوعی است.
اصول LLMs: مدلهای Tokenization و Word Embeddings
-
مقدمه 02:38
-
مقدمهای بر Tokenization و الگوریتم WordPiece Tokenization 08:04
-
الگوریتم WordPiece Tokenization: کاراکترهای انفرادی 03:42
-
الگوریتم WordPiece Tokenization: جفتهای دو کاراکتری 11:35
-
الگوریتم WordPiece Tokenization: محاسبات امتیاز و جفتهای چند کاراکتری 13:25
-
جلسه عملی: Tokenization 05:34
-
مقدمهای بر مدلهای Word Embeddings و Word2vec 05:49
-
مدل Word Embeddings نوع CBOW چگونه کار میکند؟ 13:05
-
اصول CBOW 09:54
-
فرآیند آموزش مدل CBOW 07:24
-
کارایی پیادهسازی عملی و ریاضیات CBOW 15:18
-
آزمون تعاملی (iQuiz): چرا تابع فعالسازی وجود ندارد؟ 08:36
-
مصورسازی معماری مدل CBOW 10:14
-
جزئیات بیشتر در مورد معماری مدل CBOW 07:34
-
جستجوی عملی Embedding 06:02
-
مصورسازی ماتریس Embeddings 15:34
-
پس از آموزش: استفاده از مدل CBOW (استنتاج) 09:27
-
مدل Word Embeddings نوع Skip-gram 15:01
-
خلاصه جامع مدلهای Word Embeddings 06:42
-
عملی: ساخت تابع برای Tokenization و واژگان سفارشی 14:33
-
عملی: تابع برای آمادهسازی دادههای آموزشی 16:38
-
عملی: ادامه آمادهسازی دادههای آموزشی 19:49
-
عملی: ساخت مدل CBOW با Pytorch 24:18
-
عملی: ساخت مدل Skip-gram با استفاده از Pytorch 22:44
-
عملی: پیادهسازی تابع برای آموزش مدلها در Pytorch 22:01
-
عملی: نوشتن کدها برای آموزش مدلها روی دادههای نمونه 23:04
-
عملی: نوشتن کدها برای تست مدلها و اجرای همه موارد 25:48
-
عملی: نتایج + LLM پرسش و پاسخ مینیاتوری اولیه 14:05
-
عملی: استفاده از مدلهای Word Embeddings از پیش آموزشدیده + تست روابط 11:52
-
مدلهای Transformer 03:27
-
LLMها و چتباتهای هوش مصنوعی 00:44
مشخصات آموزش
اصول LLMs: مدلهای Tokenization و Word Embeddings
- تاریخ به روز رسانی: 1404/10/04
- سطح دوره:متوسط
- تعداد درس:31
- مدت زمان :06:14:41
- حجم :1.4GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy