Не прошло и недели, а у Mistral новый релиз!
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
group-telegram.com/ai_newz/3017
Create:
Last Update:
Last Update:
Не прошло и недели, а у Mistral новый релиз!
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
Новую "малую" модель NeMo тренировали совместно с Nvidia. У неё 12 миллиардов параметров, 128k контекста, инференс в fp8 без потери в качестве. Модель сделана так, чтобы влезала в 4090.
NeMo - нативно мультиязычная модель, тренировали в том числе на русском, немецком, японском, китайском. И тут она конкурентов и в хвост, и в гриву. Обновили и токенизатор - он теперь на 36% эффективнее для русского, на 11% для английского, а на некоторых языках прирост по эффективности в 3-4 раза. Интересно, в токенах найдутся пасхалки?
С бенчами опять шалят: сравнивают только базовые модели, а бенчи для Instruct версий публикуют только специализированные, не общие.
Заметьте, как "малые" модельки растут в размере: 7B превратилось в 8, потом в 9, а сейчас уже 12
Веса
Блог
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/GIWlo71gi9W50xLf2FpuFyzNFnZi_j4ZngxIyVhV-8-VDNpTvTqj65M0APHFubOrgGi5ueqW46cUIftKvlI4j2D2rdm0Ph4xuRsVikvtYIAxgEMMFIwFaW1cWpnNG7YPrHK5sMufur-hdUO33AyEoJ9UMLyFCJSXycPZ7X_6Si-2a1SYbDxXDSbXu5ZbJCRuwnVnhGJJ4ujFyhnJyhvbK7m0_7x6KduBVVxlyyjkpfa7Zk3d53ok51NxshmVY8Cjyg65UQvDGOGTYy41rWB2ZxdQgV8Vv6YzvDUq0-ou201aeTKn2MbvB82uI_Rg0xmAPPOTFpqSttuA5stJPORVIA.jpg)
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/t85LPSBhm4LauWKw2zGaWwpnkDW1Hf960ALk_vhzO2uUT1Z4uEi9DB1yQRHyz0SB57WRazdwMFo7OS4hXb7cdFZ8uKwZOTQUbf7uPpMi_Of52WBpqPQSP6xNuf0dddOrbItrYITTmWvTi-HKxOlRWVguSN0jf3JO6I7CyrnwnUXlxkvu-3wUSx-0FPDkm19LjESQiukWtrewLMP0Mkfsd6MhDwL55U1sDVD0r0NZFyN7j4LIM1Xi5W_pfTPnjLYo0uFEqErI4h2BSD6N11-Ms0Kl_mCR7HfTzQMvCSqPfyhRB8m0bWA5zPzcm25-RFpDJ2G3WwyOQJqyLZ5rhmy-kg.jpg)
Share with your friend now:
group-telegram.com/ai_newz/3017