У Dwarkesh новый выпуск подкаста с двумя LLM-щиками. Именно из превью этой беседы я вчера узнал про статью о генерализации и интерпретируемости

Сиолошная

Я ни разу в канале не писал, но ещё в прошлом году заметил молодого выдающегося подкастера Dwarkesh Patel. Как-то наткнулся на его интервью с Ilya Sutskever, потом на разговоры с автором метода RLHF (которым дообучали ChatGPT) Paul Christiano, ex-CEO GitHub…

У Dwarkesh новый выпуск подкаста с двумя LLM-щиками. Именно из превью этой беседы я вчера узнал про статью о генерализации и интерпретируемости, детали которой расписал в канале.

Один из гостей — нейробиолог, переключившийся в интерпретируемость моделей (и проводящий аналогии с мозгом) и работающий в Anthropic.
Второй — исследователь в DeepMind. Он молодой, работает буквально 2 года в индустрии, но один из создателей трансформера говорил, что без этого парня Gemini могла бы не состояться, и вообще он один из лучших и недооцененных спецов в области.

Должно быть очень интересно, го смотреть: https://www.youtube.com/watch?v=UTuuTTnjxMQ

Затрагивают следующие топики:
— Long contexts
— Intelligence is just associations
— Intelligence explosion & great researchers
— Superposition & secret communication
— Agents & true reasoning
— How Sholto & Trenton got into AI research
— Are feature spaces the wrong way to think about intelligence?
— Will interp actually work on superhuman models

www.group-telegram.com/nl/seeallochnaya.com/1241

31.8K viewsedited Mar 28, 2024 at 16:58

group-telegram.com/seeallochnaya/1241

Create: 2024-03-28
Last Update: 2025-01-23 00:09:55

BY Сиолошная

Share with your friend now:
group-telegram.com/seeallochnaya/1241

Telegram | DID YOU KNOW?

У Dwarkesh новый выпуск подкаста с двумя LLM-щиками. Именно из превью этой беседы я вчера узнал про статью о генерализации и интерпретируемости