🔥Сегодня вышлапросто гигантская модель Falcon 180B!
Иновационный Институт Технологий Абу-Даби удивляет. Их новая модель Falcon 180B теперь заняла первое место на открытом лидерборде HF. По качеству ответов она где-то между GPT-3.5 и GPT.4, примерно на уровне PaLM-2.
Параметры модели Falcon-180B: - 180 млрд параметров! Напомню, что предыдущая самая мощная открытая модель была LLaMa-2 70B. - Контекст 2048 токенов (но можно расширить с попощью RoPE scaling) - Тренили 2.5 месяца на 4096 GPU на Amazon SageMaker. - Модель видела 3.5 триллионов токенов (против 2 триллиона у LLaMa 2). То есть Falcon прочитала почти в 2 раза больше текстов. - Multi-query attention (MQA) для скорости инференса и чтобы не раздувать количество параметров. - Есть базовая и чатовая версии.
Забавно, что для инференса этой модели в int4 вам потребуется 8x A100 видеокарт (удачи!).
Лицензия позволяет очень ограниченное коммерческое использование.
🔥Сегодня вышлапросто гигантская модель Falcon 180B!
Иновационный Институт Технологий Абу-Даби удивляет. Их новая модель Falcon 180B теперь заняла первое место на открытом лидерборде HF. По качеству ответов она где-то между GPT-3.5 и GPT.4, примерно на уровне PaLM-2.
Параметры модели Falcon-180B: - 180 млрд параметров! Напомню, что предыдущая самая мощная открытая модель была LLaMa-2 70B. - Контекст 2048 токенов (но можно расширить с попощью RoPE scaling) - Тренили 2.5 месяца на 4096 GPU на Amazon SageMaker. - Модель видела 3.5 триллионов токенов (против 2 триллиона у LLaMa 2). То есть Falcon прочитала почти в 2 раза больше текстов. - Multi-query attention (MQA) для скорости инференса и чтобы не раздувать количество параметров. - Есть базовая и чатовая версии.
Забавно, что для инференса этой модели в int4 вам потребуется 8x A100 видеокарт (удачи!).
Лицензия позволяет очень ограниченное коммерческое использование.
Anastasia Vlasova/Getty Images Additionally, investors are often instructed to deposit monies into personal bank accounts of individuals who claim to represent a legitimate entity, and/or into an unrelated corporate account. To lend credence and to lure unsuspecting victims, perpetrators usually claim that their entity and/or the investment schemes are approved by financial authorities. Oh no. There’s a certain degree of myth-making around what exactly went on, so take everything that follows lightly. Telegram was originally launched as a side project by the Durov brothers, with Nikolai handling the coding and Pavel as CEO, while both were at VK. These entities are reportedly operating nine Telegram channels with more than five million subscribers to whom they were making recommendations on selected listed scrips. Such recommendations induced the investors to deal in the said scrips, thereby creating artificial volume and price rise. Perpetrators of such fraud use various marketing techniques to attract subscribers on their social media channels.
from pl