group-telegram.com/rizzearch/38
Last Update:
Bridging Associative Memory and Probabilistic Modeling (ICML 2024 submit)
Статья с кучей авторов описывает связь ассоциативной памяти и вероятностных моделей. Контрибьюшенов много из них есть:
1) Самое интересное. Модели ассоциативной памяти (рнн, трансформеры и тд) и energy-based models (EBMs) обе работают с функцией энергии. В первых динамика состояния связана с минимизацией энергии, а во вторых мы моделируем плотность данных с помощью распределения Гиббса, где фигурирует энергия. Так вот, associative memory models способны легко менять ландшафт функций энергии для новых данных. Авторы предлагают EBM, которая использует энергию условную от данных. Это ведет к наблюдению нового феномена in-context обучения функций энергии, подобного in-context обучению в NLP
2) Предлагают две новые модели с ассоциативной памятью, базирующиеся на ELBO и на стохастическом Китайском ресторанном процессе (CRP). Тут глубоко почитать не удалось
3) KDE связан с концептом памяти + дают теорию объясняющую нормализацию перед self-attention в трансформерах, используя пункт (2)
Интересно, можно ли будет сделать новые вероятностные методы, используя понимания связи associative memory и EBM-ок 🤔
👀 LINK
#associative_memory #EBM #clustering #transformers #RNN #in_context_learning
BY rizzearch
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/E4F5v3gUgV_iZCRwJLwODMc3W1yCdABERG3cq6iO0B7lqkQkslQ9p3SXMKaQL9RI_217ZGAF0X9shCjTFzgrOQl66fvqK4FxwobfYGEXW3V_mytZHiG5HWk51eDUDuRiuMt_d0PeOlYLHtnuFt1-fiLPnWhsmPjCCakns_TNVray3aKBMclp51gtL5-nSVCXXchz1hfuItiP90dq3RazjcBpQNu2N1CHtBPH7INL5kync_nBJ3KGSo9h8Z2M97-uin2T9EyeZzae8T_cEQAZTBPCt9m5by2bvyN9lcead9nEwyy870rN9VUfrcBORZHIbpnUmfCvq55sbeCX0P06Fg.jpg)
Share with your friend now:
group-telegram.com/rizzearch/38