1. Long-CoT: для сложных задач, требующих глубокого анализа. 2. Short-CoT: оптимизированная версия для повседневных задач.
Основные характеристики модели: - Работа с контекстом до 128K токенов - Улучшенные алгоритмы обучения с подкреплением - Эффективное объединение возможностей работы с текстом и изображениями.
Интересно, что короткая версия модели (Short-CoT) превосходит GPT-4 и Claude 3.5 в некоторых задачах более чем на 550%.
Модель показывает сильные результаты в различных областях:
1. Математика и логика:
- 96.2% на MATH-500 (выше OpenAI o1) - 77.5% на AIME 2024 (математическая олимпиада)
2. Программирование:
- 94-й процентиль на Codeforces - Значительное превосходство в LiveCodeBench над GPT-4 и Claude
3. Компьютерное зрение: - 74.9% на MathVista - 70% на MMMU (мультимодальное понимание).
1. Long-CoT: для сложных задач, требующих глубокого анализа. 2. Short-CoT: оптимизированная версия для повседневных задач.
Основные характеристики модели: - Работа с контекстом до 128K токенов - Улучшенные алгоритмы обучения с подкреплением - Эффективное объединение возможностей работы с текстом и изображениями.
Интересно, что короткая версия модели (Short-CoT) превосходит GPT-4 и Claude 3.5 в некоторых задачах более чем на 550%.
Модель показывает сильные результаты в различных областях:
1. Математика и логика:
- 96.2% на MATH-500 (выше OpenAI o1) - 77.5% на AIME 2024 (математическая олимпиада)
2. Программирование:
- 94-й процентиль на Codeforces - Значительное превосходство в LiveCodeBench над GPT-4 и Claude
3. Компьютерное зрение: - 74.9% на MathVista - 70% на MMMU (мультимодальное понимание).
BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Founder Pavel Durov says tech is meant to set you free And while money initially moved into stocks in the morning, capital moved out of safe-haven assets. The price of the 10-year Treasury note fell Friday, sending its yield up to 2% from a March closing low of 1.73%. Oh no. There’s a certain degree of myth-making around what exactly went on, so take everything that follows lightly. Telegram was originally launched as a side project by the Durov brothers, with Nikolai handling the coding and Pavel as CEO, while both were at VK. Given the pro-privacy stance of the platform, it’s taken as a given that it’ll be used for a number of reasons, not all of them good. And Telegram has been attached to a fair few scandals related to terrorism, sexual exploitation and crime. Back in 2015, Vox described Telegram as “ISIS’ app of choice,” saying that the platform’s real use is the ability to use channels to distribute material to large groups at once. Telegram has acted to remove public channels affiliated with terrorism, but Pavel Durov reiterated that he had no business snooping on private conversations. Russians and Ukrainians are both prolific users of Telegram. They rely on the app for channels that act as newsfeeds, group chats (both public and private), and one-to-one communication. Since the Russian invasion of Ukraine, Telegram has remained an important lifeline for both Russians and Ukrainians, as a way of staying aware of the latest news and keeping in touch with loved ones.
from tr