group-telegram.com/abacabadabacaba404/62
Last Update:
GPT научил меня интересной технике: guided_pca. В соревновании про экзопланеты надо было восстанавливать газовый состав атмосферы, а точнее спектр поглощения на разных длиннах волн. И вот, допустим, у вас есть ограниченное количество физических наблюдений и теоретические модели, дающие спектры газов. При разложении спектра на теоретические компоненты, возникают остатки, не проходящие хи-квадрат тесты, но вы точно знаете, что больше газов, дающих вклады нет. Что делать? Автоэнкодер и PCA оверфитятся на небольшое количество наблюдений и не обобщаются как следует.
Можно применить guided_pca. GPT предложила три варианта, я отдебажил и сохранил их себе https://gist.github.com/ifserge/56cbc9cbc3caaf024f9ae576f03be364
Самый лучший первый. Идея такая: мы ищем базис, ортогонализируем его и минимизируем ошибку восстановления, но к ошибке восстановления добавляем штраф за непохожесть на первоначальный вариант. У GPT была ошибка: после окончания процедуры проводилась еще одна ортогонализация вслепую, которая напрочь рушила все компоненты.
BY adapt compete evolve or die

Share with your friend now:
group-telegram.com/abacabadabacaba404/62