Не прошло и недели, а у Mistral новый релиз!
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
group-telegram.com/ai_newz/3017
Create:
Last Update:
Last Update:
Не прошло и недели, а у Mistral новый релиз!
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/Y_6Y7uRJ8CF9bXNb5Gu_PXoDCijt6BT7-LFEVQjg8q1CBqoEvaE6N3CkwHh7t46tQuEoNV-9SKIy02hx1FKB1LVCMbhgqA0ZnGZ0ii5jQQHssSP6yBudUVFtxaJUCWYAQgQIQz83xzzcT5Jt_JvRvKe4U_HwjmSKaRTeWMd5SgWGDiy3nzktLl9tlm4qvwaaZncYuo-MGEwh3lQPvTWxKj3EHDfJPQzB3fWqdmHT7Hi2Z1JOnNN6U2MwUYY5d4tkslbxeAaIbREUTctoGevf0eut_VTAvye2YxfpB-xyc-Wmk4JyLujXIEuuk9Z4i9qeEBMxd2TsR8lfstvkFgsK7Q.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/EYUTgidRpDDo8gAFFOaGaLKWKhxKh28LkuHdjdoAm2RQEJKuNALtM6xjxh-i7K_JxM_AYLR3km6P_V4MTu0zscsmwSoeRYMJTEpCbmhDc0HgVibom1B_f2K78cKTj1KgIvbSHtyyKOhKYIV29kj9ZX27OJs7l13F0s3IuPKpanVDiHVYfbfXfZ9QGXDWbFyPEVTQLoHbWRiajZJP-ifKBPQW_wpLf8yuSeld0EJ590LwKI8S9Cb8DefYntrzV3qF_Zo9GNm4F2iAmhD7idG4bVLoVoH8cOPg5zMtAdl_vA72Qtb2qNkO_NAhRLi03tvDPsWl_6TUprbUElYzYOgYxA.jpg)
Share with your friend now:
group-telegram.com/ai_newz/3017