group-telegram.com/senior_augur/7
Last Update:
Чат канала: @augur_chat
Про локальные языковые модели для относительно неподготовленной аудитории:
Видео: https://youtu.be/KXBRGkZTX1U?si=CyVKSUavsSnZfffR&t=241
Презентация: http://tinyurl.com/gusevlocal
Подкаст: https://mlpodcast.mave.digital/ep-55
Про древнюю генерацию стихов:
Видео: https://www.youtube.com/watch?v=wTN-qKPu4c0
Статья на Хабре: https://habr.com/ru/articles/334046/
Про древнюю суммаризацию:
Цикл статей на Хабре: https://habr.com/ru/articles/595517/
Про Сайгу:
Видео: https://www.youtube.com/watch?v=YqKCk8_dNpQ
Презентация: http://tinyurl.com/gusevsaiga
Видео 2: https://www.youtube.com/watch?v=xiPCIWGTX1M
Презентация 2: http://tinyurl.com/gusevsaiga2
Статья на Хабре: https://habr.com/ru/articles/759386/
Про не-трансформерные модели:
Видео: https://www.youtube.com/watch?v=C65JbhTi-O4
Презентация: https://tinyurl.com/gusevlrnn
Разборы направлений:
- Спекулятивная генерация: https://www.group-telegram.com/us/senior_augur.com/14
- Определение языков: https://www.group-telegram.com/us/senior_augur.com/18
- Отказ от статических бенчмарков для языковых моделей: https://www.group-telegram.com/us/senior_augur.com/19
- Бенчмарки для длинных контекстов: https://www.group-telegram.com/us/senior_augur.com/32, https://www.group-telegram.com/us/senior_augur.com/33
- Методы сэмплирования токенов: https://www.group-telegram.com/us/senior_augur.com/72, https://www.group-telegram.com/us/senior_augur.com/281
- RLHF методы: https://www.group-telegram.com/us/senior_augur.com/119
- Позиционная кодировка: https://www.group-telegram.com/us/senior_augur.com/184, https://www.group-telegram.com/us/senior_augur.com/193
- Шахматы и языковые модели: https://www.group-telegram.com/us/senior_augur.com/201, https://www.group-telegram.com/us/senior_augur.com/219
- ACL 2024, серия постов, начало: https://www.group-telegram.com/us/senior_augur.com/251
Разборы статей:
- Repeat after me, https://arxiv.org/abs/2402.01032: https://www.group-telegram.com/us/senior_augur.com/13
- BooookScore, https://arxiv.org/abs/2310.00785: https://www.group-telegram.com/us/senior_augur.com/21
- Zoology, https://arxiv.org/abs/2312.04927: https://www.group-telegram.com/us/senior_augur.com/56
- Based, https://arxiv.org/abs/2402.18668: https://www.group-telegram.com/us/senior_augur.com/61
- Электрорецензенты, https://arxiv.org/abs/2403.07183: https://www.group-telegram.com/us/senior_augur.com/73
- Статья Тьюринга, https://www.group-telegram.com/us/senior_augur.com/272
- Взлом side-by-side бенча: https://arxiv.org/abs/2410.07137, https://www.group-telegram.com/us/senior_augur.com/301
- Слияние больших моделей: https://arxiv.org/abs/2410.03617, https://www.group-telegram.com/us/senior_augur.com/321
- CCE (FA для перекрестной энтропии): https://arxiv.org/abs/2411.09009, https://www.group-telegram.com/us/senior_augur.com/349
- Teacherless обучение: https://arxiv.org/abs/2403.06963, https://www.group-telegram.com/us/senior_augur.com/352
Полезные посты:
- Компиляция обучающих материалов: https://www.group-telegram.com/us/senior_augur.com/3
- Список песочниц и морд языковых моделей: https://www.group-telegram.com/us/senior_augur.com/48
- Общая архитектура языковых моделей: https://www.group-telegram.com/us/senior_augur.com/62
- Представление информации для нейронок: https://www.group-telegram.com/us/senior_augur.com/68
- Экономия памяти при обучении моделей: https://www.group-telegram.com/us/senior_augur.com/348
BY Старший Авгур
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
Share with your friend now:
group-telegram.com/senior_augur/7