Telegram Group & Telegram Channel
Генерим тексты в DeepSeek и Qwen2.5: моя твоя не понимай? Часть I

ИИ-редакция moab генерит до тысячи единиц контента в месяц (можем и больше). Мы опытным путем вывели идеальное (на текущий момент) сочетание ChatGPT и Claude, но тут на арену ворвался DeepSeek, а за ним и Qwen2.5, и мы не могли не сравнить их с проверенными «старичками».

Что проверяли:
1. Генерация структуры текста.
2.1. Генерация короткого текста без стилистических и с минимальными техническими требованиями — посмотреть, как модель пишет сама по себе на своих масках без наших идей, как сделать текст более приятным.
2.2. Генерация лонгрида с техническими и стилистическими требованиями.
3. Фактчек.

Это разные задачи, и нейросети справляются с ними по-разному.

Промты во все ИИ шли без изменений, это не совсем корректно для нормальной работы. Промт для Клода похож, но не идентичен промту для ГПТ. Мы можем в каждом ИИ получить результат получше, если подольше с ним поработаем. Но для теста было важно задавать единые промты.

1️⃣
Структура текста
Сводная таблица итогов работы Claude, ChatGPT, DeepSeek, Qwen и ради курьеза — Яндекс GPT.

Собственно, Яндекс ГПТ хуже всех и справился. Структура скудная, логика изложения хромает, требования промта не отработаны, заложено много объема на водянистые блоки (введение и заключение).

ChatGPT, Qwen и DeepSeek пришли голова в голову, выдав очень похожие и вполне приемлемые структуры.

Claude был наиболее логичен с точки зрения пользы для читателя. Не разливал воду в начале текста, сразу перешел к делу. Даже в малополезном пункте «Уход за обоями» (кто ухаживает за обоями, признавайтесь) дал внятные рекомендации, о чем написать.

Сеошники могут радостно и уверенно юзать ChatGPT, Qwen и DeepSeek, редакторы голосуют за Claude.

2️⃣ Короткий текст
Сводная таблица результатов генерации Claude, ChatGPT, DeepSeek, Qwen и Яндекс GPT.

Формально по числовым метрикам оценки текста — в лидерах ChatGPT, но текст от Claude читается более плавно и связно. И он более четко отрабатывает запросы читателя. К примеру, все нейросети кроме Клода обязательно подливали водички в начале каждого блока.

ChatGPT, DeepSeek, Qwen: много обобщающих фраз, меньше конкретики, чем у Клода, стиль текста совсем сухой, бедная лексика, сплошные списки. Очень характерный блок заключения в текстах — только Клод был прост и конкретен.

Текст от Яндекс ГПТ рассмотрению не подлежит. Вода, требования промта не выполнены.

По отзыву стороннего независимого редактора, меньше всего редачить придется текст от Claude.
Поэтому мы его и юзаем постоянно для генерации.

Из курьезов:
Claude изобрел слово «пампование» (от английского pump — помпа).
DeepSeek не справился со склонением: «Например, если ваши ресницы тонкие и редкие, остановитесь на объёмной туше».

Продолжение — лонгриды и фактчекинг — https://www.group-telegram.com/sg/ilyaiserson.com/292



group-telegram.com/ilyaiserson/291
Create:
Last Update:

Генерим тексты в DeepSeek и Qwen2.5: моя твоя не понимай? Часть I

ИИ-редакция moab генерит до тысячи единиц контента в месяц (можем и больше). Мы опытным путем вывели идеальное (на текущий момент) сочетание ChatGPT и Claude, но тут на арену ворвался DeepSeek, а за ним и Qwen2.5, и мы не могли не сравнить их с проверенными «старичками».

Что проверяли:
1. Генерация структуры текста.
2.1. Генерация короткого текста без стилистических и с минимальными техническими требованиями — посмотреть, как модель пишет сама по себе на своих масках без наших идей, как сделать текст более приятным.
2.2. Генерация лонгрида с техническими и стилистическими требованиями.
3. Фактчек.

Это разные задачи, и нейросети справляются с ними по-разному.

Промты во все ИИ шли без изменений, это не совсем корректно для нормальной работы. Промт для Клода похож, но не идентичен промту для ГПТ. Мы можем в каждом ИИ получить результат получше, если подольше с ним поработаем. Но для теста было важно задавать единые промты.

1️⃣
Структура текста
Сводная таблица итогов работы Claude, ChatGPT, DeepSeek, Qwen и ради курьеза — Яндекс GPT.

Собственно, Яндекс ГПТ хуже всех и справился. Структура скудная, логика изложения хромает, требования промта не отработаны, заложено много объема на водянистые блоки (введение и заключение).

ChatGPT, Qwen и DeepSeek пришли голова в голову, выдав очень похожие и вполне приемлемые структуры.

Claude был наиболее логичен с точки зрения пользы для читателя. Не разливал воду в начале текста, сразу перешел к делу. Даже в малополезном пункте «Уход за обоями» (кто ухаживает за обоями, признавайтесь) дал внятные рекомендации, о чем написать.

Сеошники могут радостно и уверенно юзать ChatGPT, Qwen и DeepSeek, редакторы голосуют за Claude.

2️⃣ Короткий текст
Сводная таблица результатов генерации Claude, ChatGPT, DeepSeek, Qwen и Яндекс GPT.

Формально по числовым метрикам оценки текста — в лидерах ChatGPT, но текст от Claude читается более плавно и связно. И он более четко отрабатывает запросы читателя. К примеру, все нейросети кроме Клода обязательно подливали водички в начале каждого блока.

ChatGPT, DeepSeek, Qwen: много обобщающих фраз, меньше конкретики, чем у Клода, стиль текста совсем сухой, бедная лексика, сплошные списки. Очень характерный блок заключения в текстах — только Клод был прост и конкретен.

Текст от Яндекс ГПТ рассмотрению не подлежит. Вода, требования промта не выполнены.

По отзыву стороннего независимого редактора, меньше всего редачить придется текст от Claude.
Поэтому мы его и юзаем постоянно для генерации.

Из курьезов:
Claude изобрел слово «пампование» (от английского pump — помпа).
DeepSeek не справился со склонением: «Например, если ваши ресницы тонкие и редкие, остановитесь на объёмной туше».

Продолжение — лонгриды и фактчекинг — https://www.group-telegram.com/sg/ilyaiserson.com/292

BY Ilya Iserson




Share with your friend now:
group-telegram.com/ilyaiserson/291

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

For Oleksandra Tsekhanovska, head of the Hybrid Warfare Analytical Group at the Kyiv-based Ukraine Crisis Media Center, the effects are both near- and far-reaching. NEWS Despite Telegram's origins, its approach to users' security has privacy advocates worried. Such instructions could actually endanger people — citizens receive air strike warnings via smartphone alerts. "We're seeing really dramatic moves, and it's all really tied to Ukraine right now, and in a secondary way, in terms of interest rates," Octavio Marenzi, CEO of Opimas, told Yahoo Finance Live on Thursday. "This war in Ukraine is going to give the Fed the ammunition, the cover that it needs, to not raise interest rates too quickly. And I think Jay Powell is a very tepid sort of inflation fighter and he's not going to do as much as he needs to do to get that under control. And this seems like an excuse to kick the can further down the road still and not do too much too soon."
from sg


Telegram Ilya Iserson
FROM American