Telegram Group & Telegram Channel
Китайцы выпустили ИИ-модель Kimi, и она превосходит GPT-4 и Claude 3.5 в некоторых задачах более чем на 550%.

Китайская компания Moonshot AI представила новую мультимодальную модель Kimi k1.5, представлена в 2-х версиях:

1. Long-CoT: для сложных задач, требующих глубокого анализа.
2. Short-CoT: оптимизированная версия для повседневных задач.

Основные характеристики модели:
- Работа с контекстом до 128K токенов
- Улучшенные алгоритмы обучения с подкреплением
- Эффективное объединение возможностей работы с текстом и изображениями.

Интересно, что короткая версия модели (Short-CoT) превосходит GPT-4 и Claude 3.5 в некоторых задачах более чем на 550%.

Модель показывает сильные результаты в различных областях:

1. Математика и логика:

- 96.2% на MATH-500 (выше OpenAI o1)
- 77.5% на AIME 2024 (математическая олимпиада)

2. Программирование:

- 94-й процентиль на Codeforces
- Значительное превосходство в LiveCodeBench над GPT-4 и Claude

3. Компьютерное зрение:
- 74.9% на MathVista
- 70% на MMMU (мультимодальное понимание).



group-telegram.com/blockchainRF/11146
Create:
Last Update:

Китайцы выпустили ИИ-модель Kimi, и она превосходит GPT-4 и Claude 3.5 в некоторых задачах более чем на 550%.

Китайская компания Moonshot AI представила новую мультимодальную модель Kimi k1.5, представлена в 2-х версиях:

1. Long-CoT: для сложных задач, требующих глубокого анализа.
2. Short-CoT: оптимизированная версия для повседневных задач.

Основные характеристики модели:
- Работа с контекстом до 128K токенов
- Улучшенные алгоритмы обучения с подкреплением
- Эффективное объединение возможностей работы с текстом и изображениями.

Интересно, что короткая версия модели (Short-CoT) превосходит GPT-4 и Claude 3.5 в некоторых задачах более чем на 550%.

Модель показывает сильные результаты в различных областях:

1. Математика и логика:

- 96.2% на MATH-500 (выше OpenAI o1)
- 77.5% на AIME 2024 (математическая олимпиада)

2. Программирование:

- 94-й процентиль на Codeforces
- Значительное превосходство в LiveCodeBench над GPT-4 и Claude

3. Компьютерное зрение:
- 74.9% на MathVista
- 70% на MMMU (мультимодальное понимание).

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире




Share with your friend now:
group-telegram.com/blockchainRF/11146

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

In the United States, Telegram's lower public profile has helped it mostly avoid high level scrutiny from Congress, but it has not gone unnoticed. "The result is on this photo: fiery 'greetings' to the invaders," the Security Service of Ukraine wrote alongside a photo showing several military vehicles among plumes of black smoke. Also in the latest update is the ability for users to create a unique @username from the Settings page, providing others with an easy way to contact them via Search or their t.me/username link without sharing their phone number. WhatsApp, a rival messaging platform, introduced some measures to counter disinformation when Covid-19 was first sweeping the world. During the operations, Sebi officials seized various records and documents, including 34 mobile phones, six laptops, four desktops, four tablets, two hard drive disks and one pen drive from the custody of these persons.
from ar


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American