1. Long-CoT: для сложных задач, требующих глубокого анализа. 2. Short-CoT: оптимизированная версия для повседневных задач.
Основные характеристики модели: - Работа с контекстом до 128K токенов - Улучшенные алгоритмы обучения с подкреплением - Эффективное объединение возможностей работы с текстом и изображениями.
Интересно, что короткая версия модели (Short-CoT) превосходит GPT-4 и Claude 3.5 в некоторых задачах более чем на 550%.
Модель показывает сильные результаты в различных областях:
1. Математика и логика:
- 96.2% на MATH-500 (выше OpenAI o1) - 77.5% на AIME 2024 (математическая олимпиада)
2. Программирование:
- 94-й процентиль на Codeforces - Значительное превосходство в LiveCodeBench над GPT-4 и Claude
3. Компьютерное зрение: - 74.9% на MathVista - 70% на MMMU (мультимодальное понимание).
1. Long-CoT: для сложных задач, требующих глубокого анализа. 2. Short-CoT: оптимизированная версия для повседневных задач.
Основные характеристики модели: - Работа с контекстом до 128K токенов - Улучшенные алгоритмы обучения с подкреплением - Эффективное объединение возможностей работы с текстом и изображениями.
Интересно, что короткая версия модели (Short-CoT) превосходит GPT-4 и Claude 3.5 в некоторых задачах более чем на 550%.
Модель показывает сильные результаты в различных областях:
1. Математика и логика:
- 96.2% на MATH-500 (выше OpenAI o1) - 77.5% на AIME 2024 (математическая олимпиада)
2. Программирование:
- 94-й процентиль на Codeforces - Значительное превосходство в LiveCodeBench над GPT-4 и Claude
3. Компьютерное зрение: - 74.9% на MathVista - 70% на MMMU (мультимодальное понимание).
The last couple days have exemplified that uncertainty. On Thursday, news emerged that talks in Turkey between the Russia and Ukraine yielded no positive result. But on Friday, Reuters reported that Russian President Vladimir Putin said there had been some “positive shifts” in talks between the two sides. During the operations, Sebi officials seized various records and documents, including 34 mobile phones, six laptops, four desktops, four tablets, two hard drive disks and one pen drive from the custody of these persons. "He has kind of an old-school cyber-libertarian world view where technology is there to set you free," Maréchal said. Telegram has gained a reputation as the “secure” communications app in the post-Soviet states, but whenever you make choices about your digital security, it’s important to start by asking yourself, “What exactly am I securing? And who am I securing it from?” These questions should inform your decisions about whether you are using the right tool or platform for your digital security needs. Telegram is certainly not the most secure messaging app on the market right now. Its security model requires users to place a great deal of trust in Telegram’s ability to protect user data. For some users, this may be good enough for now. For others, it may be wiser to move to a different platform for certain kinds of high-risk communications. Channels are not fully encrypted, end-to-end. All communications on a Telegram channel can be seen by anyone on the channel and are also visible to Telegram. Telegram may be asked by a government to hand over the communications from a channel. Telegram has a history of standing up to Russian government requests for data, but how comfortable you are relying on that history to predict future behavior is up to you. Because Telegram has this data, it may also be stolen by hackers or leaked by an internal employee.
from ms