Telegram Group & Telegram Channel
🚀 Китайская большая языковая модель DeepSeek-V3 конкурентоспособная

В последнее время на слуху DeepSeek, под капотом большая языковая модель DeepSeek-V3, которая является open-source model и обгоняет по тестам GPT-4o-0513.

DeepSeek-V3 содержит 600 миллиардов параметров и обучается на 14,8 триллионов токенов с использованием передовых методов.

🔥 Перейдем к тестам:
У меня есть интересная задача про Ханойские Башни.

Вкратце про задачу:
Это классическая математическая задача, где нужно переместить башню из разноразмерных дисков с одного стержня на другой, соблюдая два правила:

🟢За один ход можно брать только один верхний диск.
🟢Большой диск нельзя класть на меньший.

Усложненная версия с 4 стержнями дает свободу. Однако даже с дополнительным «буфером» оптимальное решение требует сложных маневров, а минимальное число шагов до сих пор изучается математиками.

🔗 Подробнее: тык сюда

📣Результаты:
ChatGPT 4o: В первом ответе предлагает подставить табличные значения и просто их вывести. Далее требую написать именно алгоритм. Получаю ответ и тестирую на значениях.

Итог: Задача решена некорректно, не удовлетворяются все условия задачи. При 5 дисках и 4 стержнях результат программы: 11. Верный ответ: 13.

DeepSeek-V3 в режиме DeepThink (R1): Начинает полностью анализировать задачу, находит корректное математическое обоснование, тестирует варианты, сверяет ответы и начинает набрасывать код, затем выводит нужную формулу и успешно применяет динамическое программирование для достижения результата.

Итог: Задача решена верно, код компактный. Все граничные условия соблюдены.

🚀 Нейронка: перейти

🔥 Projects & Events | VK 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/tanitavladimirovna/1865
Create:
Last Update:

🚀 Китайская большая языковая модель DeepSeek-V3 конкурентоспособная

В последнее время на слуху DeepSeek, под капотом большая языковая модель DeepSeek-V3, которая является open-source model и обгоняет по тестам GPT-4o-0513.

DeepSeek-V3 содержит 600 миллиардов параметров и обучается на 14,8 триллионов токенов с использованием передовых методов.

🔥 Перейдем к тестам:
У меня есть интересная задача про Ханойские Башни.

Вкратце про задачу:
Это классическая математическая задача, где нужно переместить башню из разноразмерных дисков с одного стержня на другой, соблюдая два правила:

🟢За один ход можно брать только один верхний диск.
🟢Большой диск нельзя класть на меньший.

Усложненная версия с 4 стержнями дает свободу. Однако даже с дополнительным «буфером» оптимальное решение требует сложных маневров, а минимальное число шагов до сих пор изучается математиками.

🔗 Подробнее: тык сюда

📣Результаты:
ChatGPT 4o: В первом ответе предлагает подставить табличные значения и просто их вывести. Далее требую написать именно алгоритм. Получаю ответ и тестирую на значениях.

Итог: Задача решена некорректно, не удовлетворяются все условия задачи. При 5 дисках и 4 стержнях результат программы: 11. Верный ответ: 13.

DeepSeek-V3 в режиме DeepThink (R1): Начинает полностью анализировать задачу, находит корректное математическое обоснование, тестирует варианты, сверяет ответы и начинает набрасывать код, затем выводит нужную формулу и успешно применяет динамическое программирование для достижения результата.

Итог: Задача решена верно, код компактный. Все граничные условия соблюдены.

🚀 Нейронка: перейти

🔥 Projects & Events | VK 🔥

BY Татьяна Пирожкова




Share with your friend now:
group-telegram.com/tanitavladimirovna/1865

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"We're seeing really dramatic moves, and it's all really tied to Ukraine right now, and in a secondary way, in terms of interest rates," Octavio Marenzi, CEO of Opimas, told Yahoo Finance Live on Thursday. "This war in Ukraine is going to give the Fed the ammunition, the cover that it needs, to not raise interest rates too quickly. And I think Jay Powell is a very tepid sort of inflation fighter and he's not going to do as much as he needs to do to get that under control. And this seems like an excuse to kick the can further down the road still and not do too much too soon." Sebi said data, emails and other documents are being retrieved from the seized devices and detailed investigation is in progress. Update March 8, 2022: EFF has clarified that Channels and Groups are not fully encrypted, end-to-end, updated our post to link to Telegram’s FAQ for Cloud and Secret chats, updated to clarify that auto-delete is available for group and channel admins, and added some additional links. And while money initially moved into stocks in the morning, capital moved out of safe-haven assets. The price of the 10-year Treasury note fell Friday, sending its yield up to 2% from a March closing low of 1.73%. Additionally, investors are often instructed to deposit monies into personal bank accounts of individuals who claim to represent a legitimate entity, and/or into an unrelated corporate account. To lend credence and to lure unsuspecting victims, perpetrators usually claim that their entity and/or the investment schemes are approved by financial authorities.
from no


Telegram Татьяна Пирожкова
FROM American