заняли третье место на e-cup. примечательно, что первое и третье место из сотрудников сбермаркета. попал в глупую ситуацию, принимал поздравления с первым, а потом случились... особенности платформы ) расскажу когда-нибудь. в мемуарах
Эволюция ранних пабликов каггл:
2018 год: простая модель на 3 день
2020 год: oof модель + самоусреднение по фолдам на 3 день как стандарт, moёn
сейчас: ансамбль моделей по фолдам, с подбором весов на 3 день.
личная эволюция:
2017 год: 15 простых моделей на 3 день, среднее на лидерборде
2020 год: 2-уровневый стек сеток деревом на 3 день
2022 год: одна сетка по фолдам к концу соревнования
сейчас: отправляю эвристики без моделей спустя полтора месяца после начала соревнования
2018 год: простая модель на 3 день
2020 год: oof модель + самоусреднение по фолдам на 3 день как стандарт, moёn
сейчас: ансамбль моделей по фолдам, с подбором весов на 3 день.
личная эволюция:
2017 год: 15 простых моделей на 3 день, среднее на лидерборде
2020 год: 2-уровневый стек сеток деревом на 3 день
2022 год: одна сетка по фолдам к концу соревнования
сейчас: отправляю эвристики без моделей спустя полтора месяца после начала соревнования
отечественные соревнования, это в том числе еще и соревнование с самой платформой 😢
почитал MARL-book (ничего себе, бесплатная книжка) и прям проникся сложностью задачи. на бейзлайне далеко не уедешь. ничего не понятно, но очень интересно
Marl-Book
Multi-Agent Reinforcement Learning: Foundations and Modern Approaches
Textbook published by MIT Press (2024)
у меня настолько в сореве ничего не работает, что я готов начать писать if'ы. с каждым днем я все дальше от ml. и на работе все заifано лапшеобразно. тоска
пытался в одном чатике объяснить почему у алгебраических уравнений с алгебраическими коэффициентами не может быть трансцендентных корней и внезапно осознал, что на уровне школьной математики это не сделать. заботал группы галуа ... снова
А я в детстве хотел быть профессиональным спортсменом или ученым.
Спортсмен в моем понимании это так: проснулся - тренировка - сдох - поел - поспал - тренировка и жизненный план твой предельно ясен.
Ученый это так: кофе - статья - кофе - симпатичные студентки - "это наука, детка", поправляя очки красивым жестом - кофе - теорема и в целом жизненный план тоже вполне понятен.
Но не сложилось, колбасу дают за другое.
Подумал внезапно, что соревновательный DS это просто сублимация этих грез, вот только где мой предельно понятный жизненный план
Спортсмен в моем понимании это так: проснулся - тренировка - сдох - поел - поспал - тренировка и жизненный план твой предельно ясен.
Ученый это так: кофе - статья - кофе - симпатичные студентки - "это наука, детка", поправляя очки красивым жестом - кофе - теорема и в целом жизненный план тоже вполне понятен.
Но не сложилось, колбасу дают за другое.
Подумал внезапно, что соревновательный DS это просто сублимация этих грез, вот только где мой предельно понятный жизненный план
Сорева AIJ с мультиагентным RL'ем у меня никак не идет. Разобрал и реализовал две статьи, обе не сильно лучше VDN бейзлайна. A3C+inequity aversion и QMix. То ли руки кривые, то ли гиперпараметры не нашел подходящие, то ли подходы не работают - я не знаю.
Может среди людей, что на меня подписались, есть те, кто знает что в этой сореве делать, но им лень участвовать, зато они могут меня погайдить и рассказать какие-то стандартные хаки как заставить RL-подход работать, сообщите мне, пожалуйста, может договоримся )
Не RL-подход вроде как серая зона, судя по комментариям, могут забанить решение, так что ищу именно RL-ный.
Может среди людей, что на меня подписались, есть те, кто знает что в этой сореве делать, но им лень участвовать, зато они могут меня погайдить и рассказать какие-то стандартные хаки как заставить RL-подход работать, сообщите мне, пожалуйста, может договоримся )
Не RL-подход вроде как серая зона, судя по комментариям, могут забанить решение, так что ищу именно RL-ный.
Поныл публично, гифки посмотрел и что-то сдвинулось с мертвой точки. Всегда удивляюсь как это работает... Почему нельзя это сделать по-тихому
пока учится очередная итерация (мои боты делают успехи на поприще борьбы с экокатастрофами, нас много и мы скоро пойдем штурмовать лб), смотрю на сореву MeltingPot там тоже MARL и несколько игр, но попроще. есть записи решений победителей. в частности репа топов. разные игры существенно по-разному решались, прочитал несколько отчетов, не нашел каких-то общих идей (кроме ручного допиливания поверх RL). но посмотрю еще, может что накопаю. не могу сказать, что очень затягивает, но и бросить желания нет
AIcrowd Forum
👾 Welcome to MeltingPot Challenge 2023
We are excited to announce the Melting Pot Contest at NeurIPS 2023, organised by researchers from the Cooperative AI Foundation, MIT, and Google DeepMind. This new competition challenges researchers to push the boundaries of multi-agent reinforcement learning…
Al Zimmermann запустил новое соревнование - решать пятнашку, но N-шку на гексагональном гриде. Тут может наработки по сборке кубика-рубика ML'ем помогут https://www.group-telegram.com/sberlogabig/361 .