ریاضیات پشت مدلهای زبانی بزرگ و ترنسفرمرها
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- ریاضیات پشت مدلهای زبانی بزرگ
- انکودینگ پوزیشنال
- توجه Multi Head
- ماتریسهای کوئری، مقدار و کلید
- ماسکهای توجه
- مدلسازی زبان ماسک شده
- ضرب نقطهای و ترازبندی برداری
- ماهیت توابع سینوس و کسینوس در انکودینگ پوزیشنال
- مدلهایی مانند چتجیپیتی چگونه در under the hood کار میکنند؟
- مدلهای دوطرفه
- نمایشهای کلمات با در نظر گرفتن کانتکس
- تعبیه کلمات
- ضرب داخلی چگونه کار میکنند؟
- ضرب ماتریسی
- ایجاد توکنها به صورت برنامهای
پیشنیازهای دوره
- ریاضیات پایه دبیرستان (جبر خطی)
توضیحات دوره
به دوره ریاضیات ترنسفرمرها خوش آمدید. این دوره بهطور عمیق برای افرادی طراحی شده که مایل هستند اصول ریاضیاتی مدلهای زبانی بزرگ مانند جی پیتی، BERT و فراتر از آن را درک کنند. این دوره به بررسی الگوریتمهای ریاضی پیچیده میپردازد که به این مدلهای پیشرفته اجازه میدهد متنها را پردازش کرده، درک کنند و متنهایی شبیه به انسان تولید کنند.
با شروع از توکنسازی، دانشجویان یاد خواهند گرفت که چگونه متن خام از طریق تکنیکهایی مانند الگوریتم WordPiece به فرمتی قابل درک برای مدلها تبدیل میشود. ما به بررسی کامپوننتهای اصلی معماریهای ترنسفرمر، شامل ماتریسهای کلید، ماتریسهای کوئری و ماتریسهای مقدار و نقش های آنها در انکودینگ اطلاعات خواهیم پرداخت. توجه ویژهای به مکانیکهای مکانیزم توجه، از جمله مطالعات دقیقی از توجه multi-head و ماسکهای توجه خواهیم داشت. این مفاهیم در توانمندسازی مدلها برای تمرکز بر بخشهای مرتبط داده ورودی بسیار مهم هستند و توانایی آنها در درک کانتکس و لحن را افزایش میدهند.
همچنین انکودینگ پوزیشنال که برای حفظ توالی کلمات در ورودیها ضروری هستند، مورد بررسی قرار خواهند گرفت و از توابع سینوس و کسینوس برای تعبیه اطلاعات پوزیشن بهطور ریاضی استفاده میشود. علاوه بر این، این دوره شامل بینشهای جامع درباره مدلهای دوطرفه و مدلهای زبان ماسک شده، بردارها، ضرب داخلی و تعبیه چندبعدی کلمات خواهد بود که برای ایجاد نمایشهای متراکم از کلمات حیاتی هستند.
در پایان دوره، شرکتکنندگان نه تنها اصول نظری ترنسفرمرها را به طور کامل یاد خواهند گرفت بلکه بینشهای عملی در مورد قابلیت و کاربرد آنها خواهند داشت. این دانش شما را آماده میکند تا در زمینه یادگیری ماشین نوآوری کرده و در صفوف بالای مهندسان و پژوهشگران هوش مصنوعی قرار بگیرید.
این دوره برای چه کسانی مناسب است؟
- برای یادگیرندگان بلندپرواز که میخواهند به قله دنیای برنامهنویسی برسند.
- این محتوا برای کسانی طراحی شده که آرزو دارند در بین 1% برتر دانشمندان داده و مهندسان یادگیری ماشین باشند.
- این دوره به طور ویژه برای افرادی که تمایل دارند درک عمیقی از ترنسفرمرها، فناوری پیشرفته پشت مدلهای زبانی بزرگ، به دست آورند، مناسب است.
- این دوره شما را با دانش بنیادی و مهارتهای فنی لازم برای برتری در توسعه و پیادهسازی اپلیکیشنهای پیشرفته هوش مصنوعی مجهز میکند.
ریاضیات پشت مدلهای زبانی بزرگ و ترنسفرمرها
-
آشنایی با توکنسازی 11:44
-
بررسی عمیق توکنسازی 11:23
-
درک توکنسازیها به صورت برنامهای 08:59
-
BERT در مقابل DistilBERT 05:07
-
تعبیهها در یک فضای برداری پیوسته 07:50
-
آشنایی با انکودینگ پوزیشنال 05:20
-
انکودینگ پوزیشنال چگونه کار میکنند؟ 04:18
-
درک اندیسهای زوج و فرد با استفاده از انکودینگ پوزیشنال 10:31
-
دلیل استفاده از توابع سینوس و کسینوس برای انکودینگ پوزیشنال 05:15
-
درک ماهیت توابع سینوس و کسینوس 10:04
-
مصورسازی انکودینگ پوزیشنال در نمودارهای سینوس و کسینوس 09:34
-
حل معادلات برای به دست آوردن انکودینگ پوزیشنال 18:47
-
آشنایی با مکانیزمهای توجه 03:02
-
ماتریس کوئری، کلید و مقدار 18:20
-
شروع کار با محاسبه توجه به صورت گامبهگام 07:09
-
محاسبه بردارهای کلید 20:44
-
مقدمه ماتریس کوئری 10:34
-
محاسبه امتیازات توجه خام 21:59
-
درک ریاضیات پشت ضرب داخلی و ترازبندی برداری 13:56
-
مصورسازی امتیازات توجه خام در دو بعد 05:56
-
تبدیل امتیازات توجه خام به توزیعهای احتمالی با Softmax 09:32
-
نرمالسازی و مقیاسبندی 03:24
-
درک ماتریس مقدار و بردار مقدار 09:24
-
محاسبه نمایش غنی آگاه از کانتکس نهایی برای کلمه "river" 10:59
-
درک خروجی 01:57
-
درک توجه Multi Head 12:13
-
مثال توجه Multi Head و لایههای بعدی 10:13
-
مدلسازی زبان دارای ماسک 02:33
مشخصات آموزش
ریاضیات پشت مدلهای زبانی بزرگ و ترنسفرمرها
- تاریخ به روز رسانی: 1404/06/21
- سطح دوره:مقدماتی
- تعداد درس:28
- مدت زمان :04:33:37
- حجم :1.48GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy