Не прошло и недели, а у Mistral новый релиз!
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
group-telegram.com/ai_newz/3017
Create:
Last Update:
Last Update:
Не прошло и недели, а у Mistral новый релиз!
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/e0MCXOsinbE17LJKtD2IUzY3eOhnXphP6jQGqtWE-H1vzv1aVJfMuLcqd8_AzQXlfnPWsK0u1fIRZylhjafLC276V4hOA3xj6-ygMkyx_87jcfhDyMxLAeUN-rZGokvIjq9oddFSMPDaZU0zu9T8KBLzo_UPkoa0RrW6MNOruX9Oe6BdqZUC9t8sHNRpOMD-qUGicg-EDtPdR6yq2MjY9-gSn94x7TglRZYPlOcPET0vjS_IrCYEVcH733P4Mh2KewU172_65lwpDLGgKFuIYm60UH9_vOhd9rZHPqWdDg6y0cbp1I8aCIVkAtwaZNtl_tU0U1pthDVIax02_jkjug.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/PlWFr-sn7UUSQ7xN96zrhNXRqFfAfQGkOHQV-YuWxeclZNZtgfrIB6EM8pQ9_HDTZdxzwi7fsBgg7USq1gl1Ikuho0pwBBTi1LdpuwSMOiK8FkcMxxGH8XGUzb25RdutadufHN61IOMOmsHOGcrfqq8grXaJcpXWy-UmJ9vrH0hAmpw-rrT4U8StKPz5PRT7rMzta9EhAySX7HaLHLbqpVtrPgmpaBZbxmJYGLLlMJjkWbw7PM3X6uUVKKVzvgd0OL74alijZLFiY0xRNK-4ZiTzbs4kSCgU0VaF9Yo_Mroj6Vm_2CZB61Sp1ypOBgw1vXEaqjoPGk63daBxR2XM2g.jpg)
Share with your friend now:
group-telegram.com/ai_newz/3017