Сутра:
1. Kaggle решат
2. Соревы обозреват
3. Gold фармить
4. Социальност
Канал о пути к Kaggle competitionsMaster Grandmaster, баварских сосисках и пиве, которым обливаешься в процессе
https://www.kaggle.com/asimandia
Для вопросов: @dimitriy_rudenko
1. Kaggle решат
2. Соревы обозреват
3. Gold фармить
4. Социальност
Канал о пути к Kaggle competitions
https://www.kaggle.com/asimandia
Для вопросов: @dimitriy_rudenko
Kaggle
Pizzaboi | Master
LMU Munich student
Author: https://www.group-telegram.com/pseudolabeling.com
Author: https://www.group-telegram.com/pseudolabeling.com
Запрети мне псевдолейблить
Сутра: 1. Kaggle решат 2. Соревы обозреват 3. Gold фармить 4. Социальност Канал о пути к Kaggle competitions Master Grandmaster, баварских сосисках и пиве, которым обливаешься в процессе https://www.kaggle.com/asimandia Для вопросов: @dimitriy_rudenko
Обновил превьюшку в тг. Вы вот знали, что тг один раз генерит превью для ссылки и потом не обновляет, пока не попросишь специального бота это сделать? В смысле старое превью моей ссылки на кэггл не обновлялось больше года :0
@WebpageBot
@WebpageBot
Воркшоп по сореве NeuralIPS начался, можно смотреть на мои 10 минут русского акцента:
https://neurips.cc/virtual/2024/competition/84802
https://neurips.cc/virtual/2024/competition/84802
Forwarded from Aparin (Георгий Апарин)
Выступил на NIPS, на воркшопе посвященному соревнованию Ariel Data Challenge. Выступал на английском, опыт интересный, даже не факапнулся в рече. С темой своего выступления как обычно кринжанул, думал там ребята посвященные слушают, а там просто проходящие энтузиасты астрофизики зашли, а я как на зло погружение решил скипнуть со словами "I hope all of you are in the context of the data and the task". Вместо описания решения, как остальные участники, решил сделать спич с заголовком "почему моё решение хоть и решает метрику, но не решает задачу". Ещё и в 2 ночи по Шанхаю спикать пришлось, в полубредовом состоянии.
В общем да, эмоции переполняют, надо больше тренироваться на конфах выступать. В следующий раз надеюсь не на воркшоп, а на статью навайбю🤓
В общем да, эмоции переполняют, надо больше тренироваться на конфах выступать. В следующий раз надеюсь не на воркшоп, а на статью навайбю
Please open Telegram to view this post
VIEW IN TELEGRAM
Про что был NeurIPS Competition track в этом году?
Соревнование было посвящено определению состава атмосферы экзопланет в космосе. Экзопланеты- это любые планеты, которые вращаются вокруг звезд вне солнечной системы. Теоретически, развитие методов их анализа может помочь нам найти внеземную жизнь или хотя бы лучше понять механизмы возникновения жизни на нашей планете. Данные были синтетические, из симуляций, но это решало две проблемы: парсинг статей из интернета не докидывал точности (что работало для прошлого года) и можно было сосредоточиться на конкретных физических эффектах от известных и изученных нами газов.
На вход даются симулированные данные детектора, направленного на звезду, на выходе надо предсказать состав атмосферы планеты, проходящей транзит.
Данные на вход давались в двух вариантах:
1. Честные цифры с детектора, который сам по себе двухмерный + время
2. Данные обработанные в частотный формат. При этом частоты еще и очень удобно метчились с таргетами.
Метрика качества- Gaussian Log-likelihood. Т.е. честное, взаправдашное правдоподобие с учетом оценки дисперсии.
Соревнование было посвящено определению состава атмосферы экзопланет в космосе. Экзопланеты- это любые планеты, которые вращаются вокруг звезд вне солнечной системы. Теоретически, развитие методов их анализа может помочь нам найти внеземную жизнь или хотя бы лучше понять механизмы возникновения жизни на нашей планете. Данные были синтетические, из симуляций, но это решало две проблемы: парсинг статей из интернета не докидывал точности (что работало для прошлого года) и можно было сосредоточиться на конкретных физических эффектах от известных и изученных нами газов.
На вход даются симулированные данные детектора, направленного на звезду, на выходе надо предсказать состав атмосферы планеты, проходящей транзит.
Данные на вход давались в двух вариантах:
1. Честные цифры с детектора, который сам по себе двухмерный + время
2. Данные обработанные в частотный формат. При этом частоты еще и очень удобно метчились с таргетами.
Метрика качества- Gaussian Log-likelihood. Т.е. честное, взаправдашное правдоподобие с учетом оценки дисперсии.
Forwarded from Love. Death. Transformers.
НЕЕЕЕТ ТЫ НЕ ПОНИМАЕШЬ ТЫ ДОЛЖЕН ЗНАТЬ ЧЕМ ОТЛИЧАЕТСЯ RSLORA ОТ QLORA, ты должен знать чем отличается sageattn от fa2 от fa3, ВсМыСлЕ тЫ Не зНаЕшь чЕм отличается adan от LiOn у НаС тИмЛиД еГо ПиСаЛ!!!!
У меня ощущение, что никто никогда кодфорсес не решал.
Рейтинг выдается за победу над другими решающими. Если у вас ожидаемое место ниже, чем реальное в зачете- вам повышают рейтинг.
Условно мы соревнуемся вдвоем, и рейтинг моего противника выше чем у меня на 120. Ожидается, что он меня победит 2 раза из трех.
Как считается победа? По тому, кто первый зашлет решение, которое пройдет все тесты. Конечно чатгпт пишет код быстрее меня и даже более аккуратно, ему даже не надо сидеть на предсмертельной дозе аптечных стимуляторов, чтобы сделать все с константной скоростью.
https://codeforces.com/blog/entry/20762?locale=ru
Рейтинг выдается за победу над другими решающими. Если у вас ожидаемое место ниже, чем реальное в зачете- вам повышают рейтинг.
Условно мы соревнуемся вдвоем, и рейтинг моего противника выше чем у меня на 120. Ожидается, что он меня победит 2 раза из трех.
Как считается победа? По тому, кто первый зашлет решение, которое пройдет все тесты. Конечно чатгпт пишет код быстрее меня и даже более аккуратно, ему даже не надо сидеть на предсмертельной дозе аптечных стимуляторов, чтобы сделать все с константной скоростью.
https://codeforces.com/blog/entry/20762?locale=ru
Codeforces
Рейтинг Codeforces [обновлен в октябре 2015]
Начиная с октября 2015-го года рейтинг на Codeforces считается по открытым формулам, о которых и пойдет здесь речь. Вполне вероятно, что мы будем их слегка менять со временем, что будем отражать в этом посте.
Запрети мне псевдолейблить
Про что был NeurIPS Competition track в этом году? Соревнование было посвящено определению состава атмосферы экзопланет в космосе. Экзопланеты- это любые планеты, которые вращаются вокруг звезд вне солнечной системы. Теоретически, развитие методов их анализа…
🚀 Разбираем решение, которое принесло нашей команде 6-е место в Kaggle-соревновании по обработке данных миссии Ariel
Пост про то, что это вообще за сорева вот тут.
Мы работали с частотными сигналами, которые изначально были очень шумными. Для их сглаживания использовали:
1️⃣ Гауссовский регрессор
2️⃣ Фильтр Савицкого-Голея
Далее ищем границы транзитной зоны планеты. Делаем через простой эмпирический детектор: транзит на графике светимости звезды имеет вид \_/ — яркость падает, когда планета проходит перед звездой, так как часть частотных компонентов теряет интенсивность.
📉 Что мы делали дальше:
Удаляем этапы до и после транзита, чтобы анализировать только изменения светимости в нужный момент.
"Поднимаем" транзит обратно к уровню светимости звезды, чтобы восстановить исходный "пульс звезды". Это важно, чтобы учесть глобальное поведение светимости звезды, которе не очень-то и постоянное.
🔍 Фичи и модели:
На основе изменений яркости между ожидаемыми и наблюдаемыми значениями на заданных частотах извлекали фичи. Эти частоты совпадают с важными таргетами — спектрограммой атмосферы экзопланеты.
Обучаем линейную регрессию глобально для каждого таргета, подбирая оптимальные коэффициенты. В смысле берем все моменты времени для всех транзитов и конкретной частоты и ищем коэффициент подгонки.
Параллельно обучаем CNN, которая анализировала частотные изменения в заданных временных окнах.
Это:
Помогает учитывало локальные особенности спектра и переходов (энергии?) между частотами
Позволяло понять взаимосвязи между соседними частотами, улучшая точность предсказаний.
🔗 Финал:
Смешали (блендили) результаты линейной регрессии и CNN. Затем финальную спектрограмму еще раз сгладили, чтобы убрать артефакты.
💡 Бонус материал: пример 'подъема' спектра на картинке
Пост про то, что это вообще за сорева вот тут.
Мы работали с частотными сигналами, которые изначально были очень шумными. Для их сглаживания использовали:
1️⃣ Гауссовский регрессор
2️⃣ Фильтр Савицкого-Голея
Далее ищем границы транзитной зоны планеты. Делаем через простой эмпирический детектор: транзит на графике светимости звезды имеет вид \_/ — яркость падает, когда планета проходит перед звездой, так как часть частотных компонентов теряет интенсивность.
📉 Что мы делали дальше:
Удаляем этапы до и после транзита, чтобы анализировать только изменения светимости в нужный момент.
"Поднимаем" транзит обратно к уровню светимости звезды, чтобы восстановить исходный "пульс звезды". Это важно, чтобы учесть глобальное поведение светимости звезды, которе не очень-то и постоянное.
🔍 Фичи и модели:
На основе изменений яркости между ожидаемыми и наблюдаемыми значениями на заданных частотах извлекали фичи. Эти частоты совпадают с важными таргетами — спектрограммой атмосферы экзопланеты.
Обучаем линейную регрессию глобально для каждого таргета, подбирая оптимальные коэффициенты. В смысле берем все моменты времени для всех транзитов и конкретной частоты и ищем коэффициент подгонки.
Параллельно обучаем CNN, которая анализировала частотные изменения в заданных временных окнах.
Это:
Помогает учитывало локальные особенности спектра и переходов (энергии?) между частотами
Позволяло понять взаимосвязи между соседними частотами, улучшая точность предсказаний.
🔗 Финал:
Смешали (блендили) результаты линейной регрессии и CNN. Затем финальную спектрограмму еще раз сгладили, чтобы убрать артефакты.
Please open Telegram to view this post
VIEW IN TELEGRAM
Linkedin превратился в апостола мертвого интернета. Пора ли уже и из него удаляться? Какими сервисами вы пользуетесь?