Telegram Group & Telegram Channel
❗️Открытие Apple: оказывается у LLM есть особые "супер-веса", которые критически важны для работы всей модели

Исследователи также обнаружили, что эти "супер-веса" создают "супер-активации" - особо сильные сигналы, которые распространяются по всей сети модели.

Исследование проведено командой из Apple и Университета Нотр-Дам.

Представьте себе изменение всего одного параметра из миллиардов может полностью "сломать" работу всей модели.

Что это значит?

В моделях типа LLaMA-7B есть критически важные параметры.
Удаление такого параметра снижает точность модели до уровня случайного угадывания. При этом удаление даже 7000 других крупных весов влияет на качество работы минимально.

Это важно тем, что:

1. Меняет наше понимание работы нейросетей.
2. Открывает новые возможности для оптимизации моделей.
3. Позволяет эффективнее сжимать модели без потери качества.

GitHub.



group-telegram.com/blockchainRF/10940
Create:
Last Update:

❗️Открытие Apple: оказывается у LLM есть особые "супер-веса", которые критически важны для работы всей модели

Исследователи также обнаружили, что эти "супер-веса" создают "супер-активации" - особо сильные сигналы, которые распространяются по всей сети модели.

Исследование проведено командой из Apple и Университета Нотр-Дам.

Представьте себе изменение всего одного параметра из миллиардов может полностью "сломать" работу всей модели.

Что это значит?

В моделях типа LLaMA-7B есть критически важные параметры.
Удаление такого параметра снижает точность модели до уровня случайного угадывания. При этом удаление даже 7000 других крупных весов влияет на качество работы минимально.

Это важно тем, что:

1. Меняет наше понимание работы нейросетей.
2. Открывает новые возможности для оптимизации моделей.
3. Позволяет эффективнее сжимать модели без потери качества.

GitHub.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире




Share with your friend now:
group-telegram.com/blockchainRF/10940

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

In view of this, the regulator has cautioned investors not to rely on such investment tips / advice received through social media platforms. It has also said investors should exercise utmost caution while taking investment decisions while dealing in the securities market. The regulator said it has been undertaking several campaigns to educate the investors to be vigilant while taking investment decisions based on stock tips. In a message on his Telegram channel recently recounting the episode, Durov wrote: "I lost my company and my home, but would do it again – without hesitation." The Securities and Exchange Board of India (Sebi) had carried out a similar exercise in 2017 in a matter related to circulation of messages through WhatsApp. On Feb. 27, however, he admitted from his Russian-language account that "Telegram channels are increasingly becoming a source of unverified information related to Ukrainian events."
from tw


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American