group-telegram.com/DataScience_Association/767
Last Update:
⭕️ دوره Stanford CS229: Machine Learning - با موضوع ساخت LLM
این ارائه، یک مرور کوتاه و مفید درباره ساخت مدلی شبیه به ChatGPT ارائه میدهد و مراحل پیشآموزش (مدلسازی زبان) و پسآموزش (SFT/RLHF) را پوشش میدهد.
فهرست مطالب:
00:00 - مقدمه
00:10 - مرور کلی مدلهای زبانی بزرگ (LLM)
00:16 - تعریف مدلهای زبانی بزرگ
00:19 - مثالهایی از مدلهای زبانی
01:16 - اهمیت دادهها
01:20 - معیارهای ارزیابی
01:33 - بخش سیستمها
01:41 - اهمیت سیستمها
01:47 - مدلهای زبانی مبتنی بر ترانسفورمر
01:57 - تمرکز بر موضوعات کلیدی
02:00 - انتقال به پیشآموزش
03:02 - مرور مدلسازی زبان
04:17 - توضیح مدلهای مولد
05:15 - تعریف مدلهای خودبازگشتی
06:36 - توضیح وظیفه خودبازگشتی
07:49 - مرور آموزش
08:48 - اهمیت توکنسازی
10:50 - فرآیند توکنسازی
13:30 - مثال توکنسازی
16:00 - ارزیابی با معیار پرپلکسیتی
20:50 - روشهای ارزیابی کنونی
24:30 - معیار آکادمیک: MMLU
در کانال انجمن علوم داده شبکه نخبگان ایران با ما همراه باشید 🌱
| @DataScience_Association |
BY انجمن علوم داده
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
Share with your friend now:
group-telegram.com/DataScience_Association/767