Telegram Group & Telegram Channel
🚀 Китайская большая языковая модель DeepSeek-V3 конкурентоспособная

В последнее время на слуху DeepSeek, под капотом большая языковая модель DeepSeek-V3, которая является open-source model и обгоняет по тестам GPT-4o-0513.

DeepSeek-V3 содержит 600 миллиардов параметров и обучается на 14,8 триллионов токенов с использованием передовых методов.

🔥 Перейдем к тестам:
У меня есть интересная задача про Ханойские Башни.

Вкратце про задачу:
Это классическая математическая задача, где нужно переместить башню из разноразмерных дисков с одного стержня на другой, соблюдая два правила:

🟢За один ход можно брать только один верхний диск.
🟢Большой диск нельзя класть на меньший.

Усложненная версия с 4 стержнями дает свободу. Однако даже с дополнительным «буфером» оптимальное решение требует сложных маневров, а минимальное число шагов до сих пор изучается математиками.

🔗 Подробнее: тык сюда

📣Результаты:
ChatGPT 4o: В первом ответе предлагает подставить табличные значения и просто их вывести. Далее требую написать именно алгоритм. Получаю ответ и тестирую на значениях.

Итог: Задача решена некорректно, не удовлетворяются все условия задачи. При 5 дисках и 4 стержнях результат программы: 11. Верный ответ: 13.

DeepSeek-V3 в режиме DeepThink (R1): Начинает полностью анализировать задачу, находит корректное математическое обоснование, тестирует варианты, сверяет ответы и начинает набрасывать код, затем выводит нужную формулу и успешно применяет динамическое программирование для достижения результата.

Итог: Задача решена верно, код компактный. Все граничные условия соблюдены.

🚀 Нейронка: перейти

🔥 Projects & Events | VK 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/tanitavladimirovna/1865
Create:
Last Update:

🚀 Китайская большая языковая модель DeepSeek-V3 конкурентоспособная

В последнее время на слуху DeepSeek, под капотом большая языковая модель DeepSeek-V3, которая является open-source model и обгоняет по тестам GPT-4o-0513.

DeepSeek-V3 содержит 600 миллиардов параметров и обучается на 14,8 триллионов токенов с использованием передовых методов.

🔥 Перейдем к тестам:
У меня есть интересная задача про Ханойские Башни.

Вкратце про задачу:
Это классическая математическая задача, где нужно переместить башню из разноразмерных дисков с одного стержня на другой, соблюдая два правила:

🟢За один ход можно брать только один верхний диск.
🟢Большой диск нельзя класть на меньший.

Усложненная версия с 4 стержнями дает свободу. Однако даже с дополнительным «буфером» оптимальное решение требует сложных маневров, а минимальное число шагов до сих пор изучается математиками.

🔗 Подробнее: тык сюда

📣Результаты:
ChatGPT 4o: В первом ответе предлагает подставить табличные значения и просто их вывести. Далее требую написать именно алгоритм. Получаю ответ и тестирую на значениях.

Итог: Задача решена некорректно, не удовлетворяются все условия задачи. При 5 дисках и 4 стержнях результат программы: 11. Верный ответ: 13.

DeepSeek-V3 в режиме DeepThink (R1): Начинает полностью анализировать задачу, находит корректное математическое обоснование, тестирует варианты, сверяет ответы и начинает набрасывать код, затем выводит нужную формулу и успешно применяет динамическое программирование для достижения результата.

Итог: Задача решена верно, код компактный. Все граничные условия соблюдены.

🚀 Нейронка: перейти

🔥 Projects & Events | VK 🔥

BY Татьяна Пирожкова




Share with your friend now:
group-telegram.com/tanitavladimirovna/1865

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

As the war in Ukraine rages, the messaging app Telegram has emerged as the go-to place for unfiltered live war updates for both Ukrainian refugees and increasingly isolated Russians alike. In addition, Telegram's architecture limits the ability to slow the spread of false information: the lack of a central public feed, and the fact that comments are easily disabled in channels, reduce the space for public pushback. DFR Lab sent the image through Microsoft Azure's Face Verification program and found that it was "highly unlikely" that the person in the second photo was the same as the first woman. The fact-checker Logically AI also found the claim to be false. The woman, Olena Kurilo, was also captured in a video after the airstrike and shown to have the injuries. It is unclear who runs the account, although Russia's official Ministry of Foreign Affairs Twitter account promoted the Telegram channel on Saturday and claimed it was operated by "a group of experts & journalists." The Russian invasion of Ukraine has been a driving force in markets for the past few weeks.
from de


Telegram Татьяна Пирожкова
FROM American