Telegram Group & Telegram Channel
❗️Открытие Apple: оказывается у LLM есть особые "супер-веса", которые критически важны для работы всей модели

Исследователи также обнаружили, что эти "супер-веса" создают "супер-активации" - особо сильные сигналы, которые распространяются по всей сети модели.

Исследование проведено командой из Apple и Университета Нотр-Дам.

Представьте себе изменение всего одного параметра из миллиардов может полностью "сломать" работу всей модели.

Что это значит?

В моделях типа LLaMA-7B есть критически важные параметры.
Удаление такого параметра снижает точность модели до уровня случайного угадывания. При этом удаление даже 7000 других крупных весов влияет на качество работы минимально.

Это важно тем, что:

1. Меняет наше понимание работы нейросетей.
2. Открывает новые возможности для оптимизации моделей.
3. Позволяет эффективнее сжимать модели без потери качества.

GitHub.



group-telegram.com/blockchainRF/10940
Create:
Last Update:

❗️Открытие Apple: оказывается у LLM есть особые "супер-веса", которые критически важны для работы всей модели

Исследователи также обнаружили, что эти "супер-веса" создают "супер-активации" - особо сильные сигналы, которые распространяются по всей сети модели.

Исследование проведено командой из Apple и Университета Нотр-Дам.

Представьте себе изменение всего одного параметра из миллиардов может полностью "сломать" работу всей модели.

Что это значит?

В моделях типа LLaMA-7B есть критически важные параметры.
Удаление такого параметра снижает точность модели до уровня случайного угадывания. При этом удаление даже 7000 других крупных весов влияет на качество работы минимально.

Это важно тем, что:

1. Меняет наше понимание работы нейросетей.
2. Открывает новые возможности для оптимизации моделей.
3. Позволяет эффективнее сжимать модели без потери качества.

GitHub.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире




Share with your friend now:
group-telegram.com/blockchainRF/10940

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

This ability to mix the public and the private, as well as the ability to use bots to engage with users has proved to be problematic. In early 2021, a database selling phone numbers pulled from Facebook was selling numbers for $20 per lookup. Similarly, security researchers found a network of deepfake bots on the platform that were generating images of people submitted by users to create non-consensual imagery, some of which involved children. These administrators had built substantial positions in these scrips prior to the circulation of recommendations and offloaded their positions subsequent to rise in price of these scrips, making significant profits at the expense of unsuspecting investors, Sebi noted. Right now the digital security needs of Russians and Ukrainians are very different, and they lead to very different caveats about how to mitigate the risks associated with using Telegram. For Ukrainians in Ukraine, whose physical safety is at risk because they are in a war zone, digital security is probably not their highest priority. They may value access to news and communication with their loved ones over making sure that all of their communications are encrypted in such a manner that they are indecipherable to Telegram, its employees, or governments with court orders. "There are several million Russians who can lift their head up from propaganda and try to look for other sources, and I'd say that most look for it on Telegram," he said. Also in the latest update is the ability for users to create a unique @username from the Settings page, providing others with an easy way to contact them via Search or their t.me/username link without sharing their phone number.
from it


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American