Всех ждем сегодня в spatial chat!
Скоро начинаем!
Как подключиться
- Заходите в спейс по ссылке https://app.spatial.chat/s/ods
- Вбиваете пароль festparroteverywhere23
- Вбиваете свои ник и должность, разрешаете браузеру доступ к микрофону и видео
- Идем в комнату Reliable ML
Скоро начинаем!
Как подключиться
- Заходите в спейс по ссылке https://app.spatial.chat/s/ods
- Вбиваете пароль festparroteverywhere23
- Вбиваете свои ник и должность, разрешаете браузеру доступ к микрофону и видео
- Идем в комнату Reliable ML
Трансляция первого дня секции Reliable ML сегодня доступна также на youtube.
https://www.youtube.com/watch?v=oaRIDDBVDuc
https://www.youtube.com/watch?v=oaRIDDBVDuc
YouTube
Data Fest 2023, день 15: online из spatial.chat
В последнюю субботу Data Fest 2023 в spatial.chat участников Феста ждет много всего крутого!
На этом стриме с 10:00 до 19:30 по Московскому времени будет идти трансляция Reliable ML. Основные активности, вопросы, и личное общение будут происходить в spatial.chat…
На этом стриме с 10:00 до 19:30 по Московскому времени будет идти трансляция Reliable ML. Основные активности, вопросы, и личное общение будут происходить в spatial.chat…
4 июня - продолжение секции Reliable ML на Data Fest 2023
Скоро начинаем!
Сегодня будем говорить об Interpretable ML, Causal Inference in ML, Data Centric AI. Завершим день и всю секцию финалом контеста ML System Design Doc Challenge. Участники презентуют свои решения, а зрители и менторы определят победителей.
Как подключиться
- Открываете браузер Chrome (остальные тоже работают, но не всегда)
- Заходите в спейс по ссылке https://app.spatial.chat/s/ods
- Вбиваете пароль festparroteverywhere23
- Вбиваете свои ник и должность, разрешаете браузеру доступ к микрофону и видео
- Идете в комнату Reliable ML
Всех очень ждем!
Ваш @Reliable ML
Скоро начинаем!
Сегодня будем говорить об Interpretable ML, Causal Inference in ML, Data Centric AI. Завершим день и всю секцию финалом контеста ML System Design Doc Challenge. Участники презентуют свои решения, а зрители и менторы определят победителей.
Как подключиться
- Открываете браузер Chrome (остальные тоже работают, но не всегда)
- Заходите в спейс по ссылке https://app.spatial.chat/s/ods
- Вбиваете пароль festparroteverywhere23
- Вбиваете свои ник и должность, разрешаете браузеру доступ к микрофону и видео
- Идете в комнату Reliable ML
Всех очень ждем!
Ваш @Reliable ML
Вакансии в Raiffeisenbank Operations
По следам предшествующего поста
Всем привет!
Итоги предыдущего поста про вакансии показали, что нас читают очень профессиональные и компетентные люди, вовлеченные в аналитику данных. И часть из них уже с нами :)
Хочу снова поделиться с вами интересными вакансиями в мою команду – предложить вам принять участие в построении Advanced Analytics and Data Management Department в Операционном блоке Райффайзенбанка.
Ниже краткое описание к каждой вакансии, подробнее – можно почитать по ссылкам. Откликаться лучше ко мне в тг (@irina_goloshchapova) – с заголовком, на какую позицию откликаетесь.
- Middle+/Senior Data Analyst – на задачи аналитики, отчетности и исследований в направления Corporate и Retail Operations.
- Senior Data Scientist – на задачи управления эффективностью наличных денежных средств и антифрода.
- Tech Lead Advanced Analytics Team – по сути – Head of Data Science & Data Analytics для нашей замечательной команды аналитиков и data саентистов.
- Product Owner Data Management Team – вести команду по развитию дата-сервисов для аналитики в домене.
#анонс #career
По следам предшествующего поста
Всем привет!
Итоги предыдущего поста про вакансии показали, что нас читают очень профессиональные и компетентные люди, вовлеченные в аналитику данных. И часть из них уже с нами :)
Хочу снова поделиться с вами интересными вакансиями в мою команду – предложить вам принять участие в построении Advanced Analytics and Data Management Department в Операционном блоке Райффайзенбанка.
Ниже краткое описание к каждой вакансии, подробнее – можно почитать по ссылкам. Откликаться лучше ко мне в тг (@irina_goloshchapova) – с заголовком, на какую позицию откликаетесь.
- Middle+/Senior Data Analyst – на задачи аналитики, отчетности и исследований в направления Corporate и Retail Operations.
- Senior Data Scientist – на задачи управления эффективностью наличных денежных средств и антифрода.
- Tech Lead Advanced Analytics Team – по сути – Head of Data Science & Data Analytics для нашей замечательной команды аналитиков и data саентистов.
- Product Owner Data Management Team – вести команду по развитию дата-сервисов для аналитики в домене.
#анонс #career
Новый запуск курса по ML System Design в августе 2023
Собрали программу и примерное расписание нового запуска курса по ML System Design https://kolodezev.ru/mlsystemdesign2023.html
Содержание будет обновлено более чем наполовину. Будет добавлен раздел про вывод языковых моделей в продуктовое окружение. Скорее всего, будут еще материалы про тестирование и риски, дополнительные материалы про устойчивость и переработанное введение в ML Design Doc.
Есть возможность повлиять на содержание - напишите в комментариях, о чем хотелось бы услышать, чего не хватило на прошлом запуске курса.
Курс будет осенью, онлайн, бесплатно, анонсы будут в этом канале.
Ваш @Reliable ML
#анонс #ml_system_design
Собрали программу и примерное расписание нового запуска курса по ML System Design https://kolodezev.ru/mlsystemdesign2023.html
Содержание будет обновлено более чем наполовину. Будет добавлен раздел про вывод языковых моделей в продуктовое окружение. Скорее всего, будут еще материалы про тестирование и риски, дополнительные материалы про устойчивость и переработанное введение в ML Design Doc.
Есть возможность повлиять на содержание - напишите в комментариях, о чем хотелось бы услышать, чего не хватило на прошлом запуске курса.
Курс будет осенью, онлайн, бесплатно, анонсы будут в этом канале.
Ваш @Reliable ML
#анонс #ml_system_design
Дата ужин Reliable ML 28.06
Почему бы и нет?
Всем привет! Задумали мы тут с Димой дата-ужин в Мск провести, и рассказать вам об этом даже заранее, в выходные.
Но как-то отложился анонс с выходных :)
Поэтому решили брать внезапностью! Если кому интересно завтра с нами пообщаться о Reliable или даже UnReliable ML, то заходите сюда. Мы планируем быть с 18:30 до 21:00.
Расскажем про задумки на сентябрь :)
P.S. Если действительно готовы прийти, то поставьте, пожалуйста, 💯 - нам было бы очень полезно понимать примерное количество людей 😊
Ваш @Reliable ML
#анонс #дата_ужин
Почему бы и нет?
Всем привет! Задумали мы тут с Димой дата-ужин в Мск провести, и рассказать вам об этом даже заранее, в выходные.
Но как-то отложился анонс с выходных :)
Поэтому решили брать внезапностью! Если кому интересно завтра с нами пообщаться о Reliable или даже UnReliable ML, то заходите сюда. Мы планируем быть с 18:30 до 21:00.
Расскажем про задумки на сентябрь :)
P.S. Если действительно готовы прийти, то поставьте, пожалуйста, 💯 - нам было бы очень полезно понимать примерное количество людей 😊
Ваш @Reliable ML
#анонс #дата_ужин
Видеозаписи докладов - Reliable ML - 3 июня 2023 - Data Fest Online
Видео и презентации докладов первого дня секции
Опубликованы видео и презентации докладов первого дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме ML System Design. Можно смотреть, пересматривать и наслаждаться! 😊
Все доклады, их описания и презентации можно найти на сайте ODS.ai, а также в плейлисте на YouTube.
Ссылки отдельно по докладам:
- Евгений Финогеев - Автоматизация заведения новых товаров на маркетплейс с использованием ML (видео, презентация)
- Михаил Масагутов - Опыт составления дизайн документа при проектировании ML системы: прогнозирование продаж в магазинах (видео, презентация, диздок)
- Любава Ткаченко - Опыт составления дизайн документа при проектировании ML системы: сервис для кластеризации магазинов (видео, презентация, диздок опубликуем в репозитории чуть позже)
- Андрей Денисенко - Как построить real-time ML на криптобирже (видео, презентация)
- Максим Берёзов - Алгоритм маршрутизации без компромисса между качеством и скоростью (видео, презентация)
- Павел Филонов - Паттерны инференса ML-моделей (видео, презентация)
- Павел Филонов - Тестовое ML System Design Interview (видео, материалы)
- Дмитрий Колодезев - Reliable ML: Устойчивость моделей после выкатки в прод (видео, презентация)
- Валерий Бабушкин - Метрики и функции потерь при дизайне систем машинного обучения (видео, презентация)
- Даниил Дранга - Дебаты: Fullstack Data Scientist или DS & Machine Learning Engineer — cтоит ли разделять роли? [Виктор Кантор – Big Data Director, МТС vs. Дмитрий Жванский – Expert Data Scientist, Райффайзен Банк] (видео, презентация)
- Дмитрий Раевский - FailConf - DS: почему бывает так больно (видео, презентацию опубликуем чуть позже)
Ваш @Reliable ML
#tech #business #reliable_ml #ml_system_design
Видео и презентации докладов первого дня секции
Опубликованы видео и презентации докладов первого дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме ML System Design. Можно смотреть, пересматривать и наслаждаться! 😊
Все доклады, их описания и презентации можно найти на сайте ODS.ai, а также в плейлисте на YouTube.
Ссылки отдельно по докладам:
- Евгений Финогеев - Автоматизация заведения новых товаров на маркетплейс с использованием ML (видео, презентация)
- Михаил Масагутов - Опыт составления дизайн документа при проектировании ML системы: прогнозирование продаж в магазинах (видео, презентация, диздок)
- Любава Ткаченко - Опыт составления дизайн документа при проектировании ML системы: сервис для кластеризации магазинов (видео, презентация, диздок опубликуем в репозитории чуть позже)
- Андрей Денисенко - Как построить real-time ML на криптобирже (видео, презентация)
- Максим Берёзов - Алгоритм маршрутизации без компромисса между качеством и скоростью (видео, презентация)
- Павел Филонов - Паттерны инференса ML-моделей (видео, презентация)
- Павел Филонов - Тестовое ML System Design Interview (видео, материалы)
- Дмитрий Колодезев - Reliable ML: Устойчивость моделей после выкатки в прод (видео, презентация)
- Валерий Бабушкин - Метрики и функции потерь при дизайне систем машинного обучения (видео, презентация)
- Даниил Дранга - Дебаты: Fullstack Data Scientist или DS & Machine Learning Engineer — cтоит ли разделять роли? [Виктор Кантор – Big Data Director, МТС vs. Дмитрий Жванский – Expert Data Scientist, Райффайзен Банк] (видео, презентация)
- Дмитрий Раевский - FailConf - DS: почему бывает так больно (видео, презентацию опубликуем чуть позже)
Ваш @Reliable ML
#tech #business #reliable_ml #ml_system_design
Видеозаписи докладов - Reliable ML - 4 июня 2023 - Data Fest Online
Видео и презентации докладов второго дня секции: Causal Inference & Interpretable ML
Опубликованы видео и презентации докладов второго дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме Causal Inference и Interpretable ML.
Все доклады, их описания и презентации можно найти на сайте ODS.ai, а также в плейлисте на YouTube.
Ссылки отдельно по докладам:
- Захар Понимаш, Виктор Носко - Как интерпретируемый ИИ объясняет генерацию трансформеров (видео)
- Сабрина Садиех - Explainable AI: что, как и зачем (видео, презентация)
- Григорий Чернов - Корреляция не подразумевает причинно-следственную связь. А что подразумевает? (видео, презентация)
- Максим Кочуров - Bayes in the Wild (видео, презентация)
- Кристина Лукьянова - Байесовский подход к АБ-тестам на примере теста конверсии (видео, презентация)
- Юрий Кацер - Предварительная обработка и поиск аномалий во временных рядах (видео, презентация)
- Артем Ерохин - Бутстрапирование временных рядов (видео, материалы)
- Богдан Печёнкин - Bag-of-tricks того, как сделать ваш ML-пайплайн более reliable (видео, презентация)
Ваш @Reliable ML
#tech #business #reliable_ml #causal_inference #interpretable_ml
Видео и презентации докладов второго дня секции: Causal Inference & Interpretable ML
Опубликованы видео и презентации докладов второго дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме Causal Inference и Interpretable ML.
Все доклады, их описания и презентации можно найти на сайте ODS.ai, а также в плейлисте на YouTube.
Ссылки отдельно по докладам:
- Захар Понимаш, Виктор Носко - Как интерпретируемый ИИ объясняет генерацию трансформеров (видео)
- Сабрина Садиех - Explainable AI: что, как и зачем (видео, презентация)
- Григорий Чернов - Корреляция не подразумевает причинно-следственную связь. А что подразумевает? (видео, презентация)
- Максим Кочуров - Bayes in the Wild (видео, презентация)
- Кристина Лукьянова - Байесовский подход к АБ-тестам на примере теста конверсии (видео, презентация)
- Юрий Кацер - Предварительная обработка и поиск аномалий во временных рядах (видео, презентация)
- Артем Ерохин - Бутстрапирование временных рядов (видео, материалы)
- Богдан Печёнкин - Bag-of-tricks того, как сделать ваш ML-пайплайн более reliable (видео, презентация)
Ваш @Reliable ML
#tech #business #reliable_ml #causal_inference #interpretable_ml
Видеозапись - Финал ML System Design Doc Challenge - Reliable ML - 4 июня 2023 - Data Fest Online
Видео финала контекста по составлению дизайн-документов
Отдельным постом хочется опубликовать видеозапись завершающего мероприятия секции Reliable ML на Data Fest Online 2023 - огненного финала контеста ML System Design Doc Challenge от Марины Завгородней из Райффайзенбанка.
Под руководством Марины участники команд в течение 2х дней работали над дизайн документом ML-системы по антифроду и в финале контеста - поделились своими решениями. Преимущества и возможности улучшения решений обсудили вместе с аудиторией.
Такой формат контеста прошел впервые, и мы с Димой счастливы, что наш проект по дизайн доку уже живет своей жизнью и помогает компаниям строить ML-системы эффективнее.
Ваш @Reliable ML
#tech #business #reliable_ml #ml_system_design
Видео финала контекста по составлению дизайн-документов
Отдельным постом хочется опубликовать видеозапись завершающего мероприятия секции Reliable ML на Data Fest Online 2023 - огненного финала контеста ML System Design Doc Challenge от Марины Завгородней из Райффайзенбанка.
Под руководством Марины участники команд в течение 2х дней работали над дизайн документом ML-системы по антифроду и в финале контеста - поделились своими решениями. Преимущества и возможности улучшения решений обсудили вместе с аудиторией.
Такой формат контеста прошел впервые, и мы с Димой счастливы, что наш проект по дизайн доку уже живет своей жизнью и помогает компаниям строить ML-системы эффективнее.
Ваш @Reliable ML
#tech #business #reliable_ml #ml_system_design
YouTube
Марина Завгородняя - ML System Design Doc Challenge – Финал
ML System Design Doc: https://github.com/IrinaGoloshchapova/ml_system_design_doc_ru
Марина Завгородняя, Data Science Community Lead в Райффайзенбанке, проводит финальный этап контеста по составлению ML System Design Doc – дизайна ML-системы для решения конкретных…
Марина Завгородняя, Data Science Community Lead в Райффайзенбанке, проводит финальный этап контеста по составлению ML System Design Doc – дизайна ML-системы для решения конкретных…
Оценка неопределенности, как быть?
Пост от читателя канала — Максима Кочурова, партнера PyMC Labs
Для построения надежных ML-систем нам нужно не только построить систему, предсказывающую интересующие нас переменные, но и оценить неопределенность предсказания. Эту проблему решают с помощью conformal prediction. Байесовские модели тоже оценивают неопределенность, но делают это немного иначе - различается сам подход к моделированию.
Conformal prediction позволяет получить оценку неопределенности в виде, например, интервалов, содержащих истинное значение с заданной вероятностью. Это model-agnostic подход, который может быть использован с любой моделью машинного обучения. Но эта оценка дается только для целевой переменной.
В противоположность этому байесовские методы явно описывают неопределенности процесса, которым генерируются данные. Мы получаем не только оценку неопределенности нашей целевой переменной, но и вероятностную оценку параметров модели. Когда это может быть важно?
В целом, можно разделить прикладные задачи датасаентиста по степени их «прозрачности»: white, grey, black. Вы наверняка слышали эти термины, между ними принципиальная разница в том, как вообще обычно формулируется постановка, и что в ней на самом деле важно. Условно, это качественная градация задач на “предсказывать” (black box), “предсказывать и делать интервенции”(causal grey box), “предсказывать, делать интервенции, находить неэффективности” (white box).
Если с black box задачами все понятно, то во многих чувствительных приложениях нам важен не только результат, но и параметры процесса. Когда нам нужно организовать валидацию модели экспертами, перенос знаний экспертов доменной области в модель, а так же валидацию экспертами закономерностей, выявленных моделями, нам нужны прозрачные модели, явно формулирующие предположения о процессе генерации данных.
Байесовские модели — самый очевидный выбор для построения таких white-box моделей.
В статье от нашего читателя Максима Кочурова из PyMC Labs выясняем что, как и зачем. Максим также прочитал прекрасный вводный доклад о байесовских методах в июне на секции Reliable ML на Data Fest 2023.
Ваш @Reliable ML
#tech #reliable_ml #bayes_in_ml
Пост от читателя канала — Максима Кочурова, партнера PyMC Labs
Для построения надежных ML-систем нам нужно не только построить систему, предсказывающую интересующие нас переменные, но и оценить неопределенность предсказания. Эту проблему решают с помощью conformal prediction. Байесовские модели тоже оценивают неопределенность, но делают это немного иначе - различается сам подход к моделированию.
Conformal prediction позволяет получить оценку неопределенности в виде, например, интервалов, содержащих истинное значение с заданной вероятностью. Это model-agnostic подход, который может быть использован с любой моделью машинного обучения. Но эта оценка дается только для целевой переменной.
В противоположность этому байесовские методы явно описывают неопределенности процесса, которым генерируются данные. Мы получаем не только оценку неопределенности нашей целевой переменной, но и вероятностную оценку параметров модели. Когда это может быть важно?
В целом, можно разделить прикладные задачи датасаентиста по степени их «прозрачности»: white, grey, black. Вы наверняка слышали эти термины, между ними принципиальная разница в том, как вообще обычно формулируется постановка, и что в ней на самом деле важно. Условно, это качественная градация задач на “предсказывать” (black box), “предсказывать и делать интервенции”(causal grey box), “предсказывать, делать интервенции, находить неэффективности” (white box).
Если с black box задачами все понятно, то во многих чувствительных приложениях нам важен не только результат, но и параметры процесса. Когда нам нужно организовать валидацию модели экспертами, перенос знаний экспертов доменной области в модель, а так же валидацию экспертами закономерностей, выявленных моделями, нам нужны прозрачные модели, явно формулирующие предположения о процессе генерации данных.
Байесовские модели — самый очевидный выбор для построения таких white-box моделей.
В статье от нашего читателя Максима Кочурова из PyMC Labs выясняем что, как и зачем. Максим также прочитал прекрасный вводный доклад о байесовских методах в июне на секции Reliable ML на Data Fest 2023.
Ваш @Reliable ML
#tech #reliable_ml #bayes_in_ml
Опубликован новый пример дизайна ML системы по шаблону Reliable ML
Пишем ML System Design Doc вместе с Reliable ML
Для нас большая гордость добавлять дизайны ML систем, написанные на основе нашего шаблона, в открытый доступ. Огромное спасибо авторам, которые вкладываются в развитие ML System Design своими силами и временем.
Сегодня был опубликован новый пример - дизайн сервиса по кластеризации магазинов, разработанного в компании Лента. Автор: Любава Ткаченко, Data Scientist. Бизнес-цель ML-решения – помочь бизнесу в быстром принятии решений с помощью инструмента для автоматической группировки магазинов по базовым метрикам, важным для ритейла. Один из типовых возможных сценариев использования инструмента - адаптация CVP (Customer Value Proposition) с учетом кластеров. А еще Любава сделала замечательный доклад об опыте составления дизайн-дока на недавнем Data Fest.
Успехов в дальнейшем развитии решения!
Шаблон дизайн-документа ML-систем от Reliable ML - тут.
Лекция о том, как с ним работать - тут.
Как написать док вместе с Reliable ML - тут.
Stay tuned!
P.S. Предыдущий дизайн-док был опубликован с похожими словами в посте. Но что поделать, ничего не изменилось - мы с Димой по-прежнему радуемся 😊 И уже знаем об опыте внедрения нашего дока в более чем 10 крупных компаний российского рынка. А еще больше мы радуемся, когда вы приходите к нам рассказать о своем опыте.
Ваш @Reliable ML
#business #tech #ml_system_design
Пишем ML System Design Doc вместе с Reliable ML
Для нас большая гордость добавлять дизайны ML систем, написанные на основе нашего шаблона, в открытый доступ. Огромное спасибо авторам, которые вкладываются в развитие ML System Design своими силами и временем.
Сегодня был опубликован новый пример - дизайн сервиса по кластеризации магазинов, разработанного в компании Лента. Автор: Любава Ткаченко, Data Scientist. Бизнес-цель ML-решения – помочь бизнесу в быстром принятии решений с помощью инструмента для автоматической группировки магазинов по базовым метрикам, важным для ритейла. Один из типовых возможных сценариев использования инструмента - адаптация CVP (Customer Value Proposition) с учетом кластеров. А еще Любава сделала замечательный доклад об опыте составления дизайн-дока на недавнем Data Fest.
Успехов в дальнейшем развитии решения!
Шаблон дизайн-документа ML-систем от Reliable ML - тут.
Лекция о том, как с ним работать - тут.
Как написать док вместе с Reliable ML - тут.
Stay tuned!
P.S. Предыдущий дизайн-док был опубликован с похожими словами в посте. Но что поделать, ничего не изменилось - мы с Димой по-прежнему радуемся 😊 И уже знаем об опыте внедрения нашего дока в более чем 10 крупных компаний российского рынка. А еще больше мы радуемся, когда вы приходите к нам рассказать о своем опыте.
Ваш @Reliable ML
#business #tech #ml_system_design
Winter is coming: почему академики сферы AI все чаще оказываются в депрессии и есть ли у них шансы на выживание
Цикл постов: обзор статьи Togelius, Yannakakis (2023) от Reliable ML. Предисловие и часть 1
Прочитали с Димой статью от весны 2023 г. - Choose Your Weapon: Survival Strategies for Depressed AI Academics, Togelius J., Yannakakis G.N. - и впечатлились.
Впечатлились уже давно, но собрались с мыслями только сейчас :)
Шуточное название статьи обманчиво - в ней на полном серьезе приведена инструкция по выживанию для сотрудников научных лабораторий, выбравших путь теоретических исследований в области AI. Легкое настроение читателя от названия и бодрого резюме в начале статьи - к концу прочтения сменяется серьезной задумчивостью о том, что ждет наш мир уже в ближайшем будущем.
Поделимся с вами конспектом статьи и нашими мыслями о последствиях. По аналогии с размышлениями о тезисах конференции Gartner Data & Analytics про критичность финансовых эффектов дата-команд. Этот пост оказался одним из наиболее популярных в нашем канале.
Часть 1. Почему грустят AI академики
- Недостаток вычислительных ресурсов. Нет доступа к мощностям, или он несопоставимо ниже, чем в любой корпорации с AI отделом. Ресурса критически не хватает для конкурентоспособных исследований, тогда как еще всего 5-10 лет назад для того, чтобы двигать науку в AI, достаточно было локальной машины. Сейчас же большинство прорывов базируется на больших мощностях и сериях крупных экспериментов.
- Несправедливая конкуренция с корпорациями. Рост важности самого понятия конкуренции в академии. В идеальном мире научные эксперименты - это совместный труд ученых на благо развития науки - с признанием вклада каждого. В случае высокого влияния корпораций любая стоящая идея получает развитие в рамках той компании, которая первая вложила достаточно денег. Ученый в любом случае в проигрыше и его вклад незаметен. В статье исследование ученого и подключение к ним корпораций сравнивается с открытием Walmart напротив местного семейного магазинчика в небольшом городке.
В следующем посте обсудим, что предлагается делать академикам, впавшим в депрессию по причинам выше.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
Цикл постов: обзор статьи Togelius, Yannakakis (2023) от Reliable ML. Предисловие и часть 1
Прочитали с Димой статью от весны 2023 г. - Choose Your Weapon: Survival Strategies for Depressed AI Academics, Togelius J., Yannakakis G.N. - и впечатлились.
Впечатлились уже давно, но собрались с мыслями только сейчас :)
Шуточное название статьи обманчиво - в ней на полном серьезе приведена инструкция по выживанию для сотрудников научных лабораторий, выбравших путь теоретических исследований в области AI. Легкое настроение читателя от названия и бодрого резюме в начале статьи - к концу прочтения сменяется серьезной задумчивостью о том, что ждет наш мир уже в ближайшем будущем.
Поделимся с вами конспектом статьи и нашими мыслями о последствиях. По аналогии с размышлениями о тезисах конференции Gartner Data & Analytics про критичность финансовых эффектов дата-команд. Этот пост оказался одним из наиболее популярных в нашем канале.
Часть 1. Почему грустят AI академики
- Недостаток вычислительных ресурсов. Нет доступа к мощностям, или он несопоставимо ниже, чем в любой корпорации с AI отделом. Ресурса критически не хватает для конкурентоспособных исследований, тогда как еще всего 5-10 лет назад для того, чтобы двигать науку в AI, достаточно было локальной машины. Сейчас же большинство прорывов базируется на больших мощностях и сериях крупных экспериментов.
- Несправедливая конкуренция с корпорациями. Рост важности самого понятия конкуренции в академии. В идеальном мире научные эксперименты - это совместный труд ученых на благо развития науки - с признанием вклада каждого. В случае высокого влияния корпораций любая стоящая идея получает развитие в рамках той компании, которая первая вложила достаточно денег. Ученый в любом случае в проигрыше и его вклад незаметен. В статье исследование ученого и подключение к ним корпораций сравнивается с открытием Walmart напротив местного семейного магазинчика в небольшом городке.
В следующем посте обсудим, что предлагается делать академикам, впавшим в депрессию по причинам выше.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
Winter is coming. Цикл постов про академиков в депрессии - Часть 2
Цикл постов по статье Togelius, Yannakakis (2023). Часть 2
Продолжаем цикл постов “Winter is coming: почему академики сферы AI все чаще оказываются в депрессии и есть ли у них шансы на выживание”. Обсудим, какие пути предлагают авторы для AI-академиков, погрузившихся в депрессию. Причины депрессии обсуждали в предыдущем посте цикла.
Что предлагается делать AI-академикам в депрессии
- Сдаться. Не пытаться совершить прорыв, а публиковать статьи в журналах невысоких рейтингов, улучшая технические детали и рассматривая под-под-вопросы различных тем.
- Все-таки пытаться масштабировать вычислительные ресурсы, а именно - тратить наибольшую возможную часть исследовательского гранта на CPU и GPU. Правда, стоит иметь в виду, что даже самые крутые по суммам научные гранты в мире позволяют выделить на вычисления несопоставимо меньше денег, чем нужно на один (один, не серию) норм эксперимент даже с GPT-3.
- Сужать масштаб экспериментов (анти-масштабирование). Сконцентрироваться на игрушечных проблемах, позволяющих продемонстрировать преимущества нового подхода в теории на каких-то сравнениях. Авторы приводят вполне рабочие примеры такого подхода: Shafiullah et al. (2022), Pearce et al. (2023), Paster, McIlraith, Ba (2022). Недостаток в том, что широкий круг людей обращает внимание на подобные прорывы, как правило, значительно позже - когда кто-то проведет крупный эксперимент на реальных данных.
- Использовать претренированные модели. Хороший вариант не делать все с нуля, но чаще всего недостаточно для значимых результатов.
- Анализировать нюансы работы уже существующих моделей, вместо того, чтобы пытаться создать что-то новое.
- Использовать RL! Данные не нужны! Главное, без фанатизма, ибо грань науки и научной фантастики будет пролегать в непосредственной близости от вас.
- Заниматься небольшими моделями. Как с помощью минимально-нагруженной модели и минимального объема данных сделать ценные выводы? Привет Томасу Байесу. Ценность подобных методов неуклонно растет от года к году, хотя и имеет значительные ограничения в использовании.
- Работать над областями, которые на данный момент неинтересны индустрии. Может быть, они не заметят, как вы совершите прорыв. На этом моменте делаем паузу, для того чтобы сходить за успокоительным, и продолжаем дальше.
- Найти области, о которых еще никто не подумал о вас. Или взять заброшенный всеми метод и дать ему шанс. Тут еще чуточку больше шансов остаться незамеченным до получения важных результатов.
- Пробовать методы, которые не должны работать. Ну, вы поняли логику.
- Развивать сомнительные с точки зрения этики направления, потому что корпорации ограничены общими правилами этики, PR-службами и репутационными рисками, а вы - нет. Ну разве что только законом иногда. Цитата: “if you can’t do the research they couldn’t do, do the research they wouldn’t do”.
- Попытаться скооперироваться с индустрией. Если продать перспективную идею бизнесу, то можно получить как финансирование, так и стартап с вашим участием. Правда, ваша идея должна быть в первую очередь практико-ориентированной (иметь кейс с получением денег на не очень большом временном горизонте), чем направленной на улучшение мира, или новые теоретические научные прорывы. Тут уж извините, nothing personal just business.
- Развивать коллаборации между разными университетами. Здорово, но перспективы не сильно видны.
В следующих постах цикла поделимся размышлениями о том, что нас ждет в связи со всем вышеперечисленным, и что же можно сделать.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
Цикл постов по статье Togelius, Yannakakis (2023). Часть 2
Продолжаем цикл постов “Winter is coming: почему академики сферы AI все чаще оказываются в депрессии и есть ли у них шансы на выживание”. Обсудим, какие пути предлагают авторы для AI-академиков, погрузившихся в депрессию. Причины депрессии обсуждали в предыдущем посте цикла.
Что предлагается делать AI-академикам в депрессии
- Сдаться. Не пытаться совершить прорыв, а публиковать статьи в журналах невысоких рейтингов, улучшая технические детали и рассматривая под-под-вопросы различных тем.
- Все-таки пытаться масштабировать вычислительные ресурсы, а именно - тратить наибольшую возможную часть исследовательского гранта на CPU и GPU. Правда, стоит иметь в виду, что даже самые крутые по суммам научные гранты в мире позволяют выделить на вычисления несопоставимо меньше денег, чем нужно на один (один, не серию) норм эксперимент даже с GPT-3.
- Сужать масштаб экспериментов (анти-масштабирование). Сконцентрироваться на игрушечных проблемах, позволяющих продемонстрировать преимущества нового подхода в теории на каких-то сравнениях. Авторы приводят вполне рабочие примеры такого подхода: Shafiullah et al. (2022), Pearce et al. (2023), Paster, McIlraith, Ba (2022). Недостаток в том, что широкий круг людей обращает внимание на подобные прорывы, как правило, значительно позже - когда кто-то проведет крупный эксперимент на реальных данных.
- Использовать претренированные модели. Хороший вариант не делать все с нуля, но чаще всего недостаточно для значимых результатов.
- Анализировать нюансы работы уже существующих моделей, вместо того, чтобы пытаться создать что-то новое.
- Использовать RL! Данные не нужны! Главное, без фанатизма, ибо грань науки и научной фантастики будет пролегать в непосредственной близости от вас.
- Заниматься небольшими моделями. Как с помощью минимально-нагруженной модели и минимального объема данных сделать ценные выводы? Привет Томасу Байесу. Ценность подобных методов неуклонно растет от года к году, хотя и имеет значительные ограничения в использовании.
- Работать над областями, которые на данный момент неинтересны индустрии. Может быть, они не заметят, как вы совершите прорыв. На этом моменте делаем паузу, для того чтобы сходить за успокоительным, и продолжаем дальше.
- Найти области, о которых еще никто не подумал о вас. Или взять заброшенный всеми метод и дать ему шанс. Тут еще чуточку больше шансов остаться незамеченным до получения важных результатов.
- Пробовать методы, которые не должны работать. Ну, вы поняли логику.
- Развивать сомнительные с точки зрения этики направления, потому что корпорации ограничены общими правилами этики, PR-службами и репутационными рисками, а вы - нет. Ну разве что только законом иногда. Цитата: “if you can’t do the research they couldn’t do, do the research they wouldn’t do”.
- Попытаться скооперироваться с индустрией. Если продать перспективную идею бизнесу, то можно получить как финансирование, так и стартап с вашим участием. Правда, ваша идея должна быть в первую очередь практико-ориентированной (иметь кейс с получением денег на не очень большом временном горизонте), чем направленной на улучшение мира, или новые теоретические научные прорывы. Тут уж извините, nothing personal just business.
- Развивать коллаборации между разными университетами. Здорово, но перспективы не сильно видны.
В следующих постах цикла поделимся размышлениями о том, что нас ждет в связи со всем вышеперечисленным, и что же можно сделать.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
Иллюстрация к части 2 - Winter is coming. Цикл постов про академиков в депрессии
Картинка к части 2. Будьте бдительны!
Цикл постов “Winter is coming: почему академики сферы AI все чаще оказываются в депрессии и есть ли у них шансы на выживание”.
- Часть 1. Почему AI-академики оказываются в депрессии.
- Часть 2. Какие пути предлагают авторы дляAI-академиков, погрузившихся в депрессию.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
Картинка к части 2. Будьте бдительны!
Цикл постов “Winter is coming: почему академики сферы AI все чаще оказываются в депрессии и есть ли у них шансы на выживание”.
- Часть 1. Почему AI-академики оказываются в депрессии.
- Часть 2. Какие пути предлагают авторы дляAI-академиков, погрузившихся в депрессию.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
Reliable ML pinned «Видеозаписи докладов - Reliable ML - 3 июня 2023 - Data Fest Online Видео и презентации докладов первого дня секции Опубликованы видео и презентации докладов первого дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме ML System…»
Курс ML System Design от Reliable ML
Старт с 28.08.2023
В понедельник стартует курс ML System Design от ReliableML. Бесплатный семестровый курс будет размещен на площадке ODS.AI, все лекции и дополнительные материалы будут публиковаться в нашем канале.
В курс входит:
* 15 видеолекций
* 14 семинаров
* работа над проектами
* разработка ML дизайн документа
* Доклады/туториалы участников курса по смежным темам
* лабораторные работы
Основная цель курса - развить кругозор и "насмотренность" будущих создателей ML-систем. Это не подготовка к собеседованию и не "вхождение в IT", а, скорее, экскурсия по зоопарку. Смотрите, вот тигры, вот слоны, вот потоковые данные, а здесь у нас пасутся большие языковые модели, их можно покормить и погладить.
Интереснее всего проходить курс, делая проект. Если хотите участвовать в проектной деятельности - лучше зарегистрироваться на курс на ODS.AI. У подписчиков канала будет доступ к лекциям и семинарам без дополнительной регистрации - и задавать вопросы по материалам можно прямо тут.
Ваш @Reliable ML
#tech #ml_system_design
Старт с 28.08.2023
В понедельник стартует курс ML System Design от ReliableML. Бесплатный семестровый курс будет размещен на площадке ODS.AI, все лекции и дополнительные материалы будут публиковаться в нашем канале.
В курс входит:
* 15 видеолекций
* 14 семинаров
* работа над проектами
* разработка ML дизайн документа
* Доклады/туториалы участников курса по смежным темам
* лабораторные работы
Основная цель курса - развить кругозор и "насмотренность" будущих создателей ML-систем. Это не подготовка к собеседованию и не "вхождение в IT", а, скорее, экскурсия по зоопарку. Смотрите, вот тигры, вот слоны, вот потоковые данные, а здесь у нас пасутся большие языковые модели, их можно покормить и погладить.
Интереснее всего проходить курс, делая проект. Если хотите участвовать в проектной деятельности - лучше зарегистрироваться на курс на ODS.AI. У подписчиков канала будет доступ к лекциям и семинарам без дополнительной регистрации - и задавать вопросы по материалам можно прямо тут.
Ваш @Reliable ML
#tech #ml_system_design
Вакансий пост
Команда данных Raiffeisenbank Operations
С началом осени открываем ряд позиций в нашу крутейшую команду данных операционного домена Райффайзен Банка.
Немного о команде
Домен Operations в Райффайзен Банке отвечает за работу ключевых функций: транзакции, банкоматы, поддержка кредитного процесса. По сути операции пронизывают все сферы деятельности банка. Поэтому для них критически важна структурированная система аналитики: иерархия метрик, отчетность, прогнозные и оптимизационные модели.
Наша команда обеспечивает домен Operations отчетностью, аналитикой и моделями для принятия правильных стратегических и операционных решений. А более правильные решения повышают эффективность управления процессами и имеют огромное влияние на бизнес.
Кого мы ищем
Ниже краткое описание к вакансий, подробнее – можно почитать по ссылкам.
- Middle/Senior Data Analyst – на задачи аналитики, отчетности и исследований в различных направлениях Operations. Кроме большого интереса к данным, будет полезен опыт в финансовой сфере, банках, и/или любовь к анализу процессов.
- Middle/Senior Data Scientist – строить, внедрять и развивать прогнозные и оптимизационные модели в области эффективности управления наличными денежными средствами (планирование спроса, выдача наличности, управление инкассацией, обслуживание АТМ).
Как откликнуться
Пишите мне в тг (@irina_goloshchapova) – с заголовком, на какую позицию откликаетесь.
#career #reliable_ml
Команда данных Raiffeisenbank Operations
С началом осени открываем ряд позиций в нашу крутейшую команду данных операционного домена Райффайзен Банка.
Немного о команде
Домен Operations в Райффайзен Банке отвечает за работу ключевых функций: транзакции, банкоматы, поддержка кредитного процесса. По сути операции пронизывают все сферы деятельности банка. Поэтому для них критически важна структурированная система аналитики: иерархия метрик, отчетность, прогнозные и оптимизационные модели.
Наша команда обеспечивает домен Operations отчетностью, аналитикой и моделями для принятия правильных стратегических и операционных решений. А более правильные решения повышают эффективность управления процессами и имеют огромное влияние на бизнес.
Кого мы ищем
Ниже краткое описание к вакансий, подробнее – можно почитать по ссылкам.
- Middle/Senior Data Analyst – на задачи аналитики, отчетности и исследований в различных направлениях Operations. Кроме большого интереса к данным, будет полезен опыт в финансовой сфере, банках, и/или любовь к анализу процессов.
- Middle/Senior Data Scientist – строить, внедрять и развивать прогнозные и оптимизационные модели в области эффективности управления наличными денежными средствами (планирование спроса, выдача наличности, управление инкассацией, обслуживание АТМ).
Как откликнуться
Пишите мне в тг (@irina_goloshchapova) – с заголовком, на какую позицию откликаетесь.
#career #reliable_ml
Оффлайновая встреча ReliableML
Предлагаем встретиться за кофе или чаем в конце сентября, поговорить про анализ данных, машинное обучение, Reliable & UnReliable ML, ML System Design и все такое. Где-нибудь в центре. Нужно выбрать - что удобнее:
Предлагаем встретиться за кофе или чаем в конце сентября, поговорить про анализ данных, машинное обучение, Reliable & UnReliable ML, ML System Design и все такое. Где-нибудь в центре. Нужно выбрать - что удобнее:
Anonymous Poll
23%
датаужин 29 сентября в пятницу с 18:30 до 21:00
17%
датазавтрак 30 сентября в субботу с 10:00 до 12:00
59%
Не пойду, просто интересно посмотреть результат
Оффлайн-встреча Reliable ML в Москве
30 сентября в 11:00 датазавтрак ReliableML в Хлеб Насущный https://go.2gis.com/l4lkg улица Солянка, 1/2 ст1
Большой стол забронирован на Ирину. Приходите, поговорим про Reliable и Unreliable ML, курс ML System Design, осенние митапы, датафесты, датахеллоуины, найм, карьеру, увольнение, синтетические данные и позавтракаем заодно, там хорошо.
Хотели устроить встречу в пятницу вечером, как вы и проголосовали выше, но жизнь и расписания самолетов внесли свои коррективы.
Ваш @Reliable ML
#tech #ml_system_design
30 сентября в 11:00 датазавтрак ReliableML в Хлеб Насущный https://go.2gis.com/l4lkg улица Солянка, 1/2 ст1
Большой стол забронирован на Ирину. Приходите, поговорим про Reliable и Unreliable ML, курс ML System Design, осенние митапы, датафесты, датахеллоуины, найм, карьеру, увольнение, синтетические данные и позавтракаем заодно, там хорошо.
Хотели устроить встречу в пятницу вечером, как вы и проголосовали выше, но жизнь и расписания самолетов внесли свои коррективы.
Ваш @Reliable ML
#tech #ml_system_design