Telegram Group & Telegram Channel
🚀 Китайская большая языковая модель DeepSeek-V3 конкурентоспособная

В последнее время на слуху DeepSeek, под капотом большая языковая модель DeepSeek-V3, которая является open-source model и обгоняет по тестам GPT-4o-0513.

DeepSeek-V3 содержит 600 миллиардов параметров и обучается на 14,8 триллионов токенов с использованием передовых методов.

🔥 Перейдем к тестам:
У меня есть интересная задача про Ханойские Башни.

Вкратце про задачу:
Это классическая математическая задача, где нужно переместить башню из разноразмерных дисков с одного стержня на другой, соблюдая два правила:

🟢За один ход можно брать только один верхний диск.
🟢Большой диск нельзя класть на меньший.

Усложненная версия с 4 стержнями дает свободу. Однако даже с дополнительным «буфером» оптимальное решение требует сложных маневров, а минимальное число шагов до сих пор изучается математиками.

🔗 Подробнее: тык сюда

📣Результаты:
ChatGPT 4o: В первом ответе предлагает подставить табличные значения и просто их вывести. Далее требую написать именно алгоритм. Получаю ответ и тестирую на значениях.

Итог: Задача решена некорректно, не удовлетворяются все условия задачи. При 5 дисках и 4 стержнях результат программы: 11. Верный ответ: 13.

DeepSeek-V3 в режиме DeepThink (R1): Начинает полностью анализировать задачу, находит корректное математическое обоснование, тестирует варианты, сверяет ответы и начинает набрасывать код, затем выводит нужную формулу и успешно применяет динамическое программирование для достижения результата.

Итог: Задача решена верно, код компактный. Все граничные условия соблюдены.

🚀 Нейронка: перейти

🔥 Projects & Events | VK 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/tanitavladimirovna/1865
Create:
Last Update:

🚀 Китайская большая языковая модель DeepSeek-V3 конкурентоспособная

В последнее время на слуху DeepSeek, под капотом большая языковая модель DeepSeek-V3, которая является open-source model и обгоняет по тестам GPT-4o-0513.

DeepSeek-V3 содержит 600 миллиардов параметров и обучается на 14,8 триллионов токенов с использованием передовых методов.

🔥 Перейдем к тестам:
У меня есть интересная задача про Ханойские Башни.

Вкратце про задачу:
Это классическая математическая задача, где нужно переместить башню из разноразмерных дисков с одного стержня на другой, соблюдая два правила:

🟢За один ход можно брать только один верхний диск.
🟢Большой диск нельзя класть на меньший.

Усложненная версия с 4 стержнями дает свободу. Однако даже с дополнительным «буфером» оптимальное решение требует сложных маневров, а минимальное число шагов до сих пор изучается математиками.

🔗 Подробнее: тык сюда

📣Результаты:
ChatGPT 4o: В первом ответе предлагает подставить табличные значения и просто их вывести. Далее требую написать именно алгоритм. Получаю ответ и тестирую на значениях.

Итог: Задача решена некорректно, не удовлетворяются все условия задачи. При 5 дисках и 4 стержнях результат программы: 11. Верный ответ: 13.

DeepSeek-V3 в режиме DeepThink (R1): Начинает полностью анализировать задачу, находит корректное математическое обоснование, тестирует варианты, сверяет ответы и начинает набрасывать код, затем выводит нужную формулу и успешно применяет динамическое программирование для достижения результата.

Итог: Задача решена верно, код компактный. Все граничные условия соблюдены.

🚀 Нейронка: перейти

🔥 Projects & Events | VK 🔥

BY Татьяна Пирожкова




Share with your friend now:
group-telegram.com/tanitavladimirovna/1865

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The channel appears to be part of the broader information war that has developed following Russia's invasion of Ukraine. The Kremlin has paid Russian TikTok influencers to push propaganda, according to a Vice News investigation, while ProPublica found that fake Russian fact check videos had been viewed over a million times on Telegram. "Markets were cheering this economic recovery and return to strong economic growth, but the cheers will turn to tears if the inflation outbreak pushes businesses and consumers to the brink of recession," he added. Under the Sebi Act, the regulator has the power to carry out search and seizure of books, registers, documents including electronics and digital devices from any person associated with the securities market. Ukrainian forces successfully attacked Russian vehicles in the capital city of Kyiv thanks to a public tip made through the encrypted messaging app Telegram, Ukraine's top law-enforcement agency said on Tuesday. That hurt tech stocks. For the past few weeks, the 10-year yield has traded between 1.72% and 2%, as traders moved into the bond for safety when Russia headlines were ugly—and out of it when headlines improved. Now, the yield is touching its pandemic-era high. If the yield breaks above that level, that could signal that it’s on a sustainable path higher. Higher long-dated bond yields make future profits less valuable—and many tech companies are valued on the basis of profits forecast for many years in the future.
from tw


Telegram Татьяна Пирожкова
FROM American