1. Long-CoT: для сложных задач, требующих глубокого анализа. 2. Short-CoT: оптимизированная версия для повседневных задач.
Основные характеристики модели: - Работа с контекстом до 128K токенов - Улучшенные алгоритмы обучения с подкреплением - Эффективное объединение возможностей работы с текстом и изображениями.
Интересно, что короткая версия модели (Short-CoT) превосходит GPT-4 и Claude 3.5 в некоторых задачах более чем на 550%.
Модель показывает сильные результаты в различных областях:
1. Математика и логика:
- 96.2% на MATH-500 (выше OpenAI o1) - 77.5% на AIME 2024 (математическая олимпиада)
2. Программирование:
- 94-й процентиль на Codeforces - Значительное превосходство в LiveCodeBench над GPT-4 и Claude
3. Компьютерное зрение: - 74.9% на MathVista - 70% на MMMU (мультимодальное понимание).
1. Long-CoT: для сложных задач, требующих глубокого анализа. 2. Short-CoT: оптимизированная версия для повседневных задач.
Основные характеристики модели: - Работа с контекстом до 128K токенов - Улучшенные алгоритмы обучения с подкреплением - Эффективное объединение возможностей работы с текстом и изображениями.
Интересно, что короткая версия модели (Short-CoT) превосходит GPT-4 и Claude 3.5 в некоторых задачах более чем на 550%.
Модель показывает сильные результаты в различных областях:
1. Математика и логика:
- 96.2% на MATH-500 (выше OpenAI o1) - 77.5% на AIME 2024 (математическая олимпиада)
2. Программирование:
- 94-й процентиль на Codeforces - Значительное превосходство в LiveCodeBench над GPT-4 и Claude
3. Компьютерное зрение: - 74.9% на MathVista - 70% на MMMU (мультимодальное понимание).
BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Continuing its crackdown against entities allegedly involved in a front-running scam using messaging app Telegram, Sebi on Thursday carried out search and seizure operations at the premises of eight entities in multiple locations across the country. The message was not authentic, with the real Zelenskiy soon denying the claim on his official Telegram channel, but the incident highlighted a major problem: disinformation quickly spreads unchecked on the encrypted app. Investors took profits on Friday while they could ahead of the weekend, explained Tom Essaye, founder of Sevens Report Research. Saturday and Sunday could easily bring unfortunate news on the war front—and traders would rather be able to sell any recent winnings at Friday’s earlier prices than wait for a potentially lower price at Monday’s open. The last couple days have exemplified that uncertainty. On Thursday, news emerged that talks in Turkey between the Russia and Ukraine yielded no positive result. But on Friday, Reuters reported that Russian President Vladimir Putin said there had been some “positive shifts” in talks between the two sides. The SC urges the public to refer to the SC’s I nvestor Alert List before investing. The list contains details of unauthorised websites, investment products, companies and individuals. Members of the public who suspect that they have been approached by unauthorised firms or individuals offering schemes that promise unrealistic returns
from us