Telegram Group & Telegram Channel
Генерим тексты в DeepSeek и Qwen2.5: моя твоя не понимай? Часть I

ИИ-редакция moab генерит до тысячи единиц контента в месяц (можем и больше). Мы опытным путем вывели идеальное (на текущий момент) сочетание ChatGPT и Claude, но тут на арену ворвался DeepSeek, а за ним и Qwen2.5, и мы не могли не сравнить их с проверенными «старичками».

Что проверяли:
1. Генерация структуры текста.
2.1. Генерация короткого текста без стилистических и с минимальными техническими требованиями — посмотреть, как модель пишет сама по себе на своих масках без наших идей, как сделать текст более приятным.
2.2. Генерация лонгрида с техническими и стилистическими требованиями.
3. Фактчек.

Это разные задачи, и нейросети справляются с ними по-разному.

Промты во все ИИ шли без изменений, это не совсем корректно для нормальной работы. Промт для Клода похож, но не идентичен промту для ГПТ. Мы можем в каждом ИИ получить результат получше, если подольше с ним поработаем. Но для теста было важно задавать единые промты.

1️⃣
Структура текста
Сводная таблица итогов работы Claude, ChatGPT, DeepSeek, Qwen и ради курьеза — Яндекс GPT.

Собственно, Яндекс ГПТ хуже всех и справился. Структура скудная, логика изложения хромает, требования промта не отработаны, заложено много объема на водянистые блоки (введение и заключение).

ChatGPT, Qwen и DeepSeek пришли голова в голову, выдав очень похожие и вполне приемлемые структуры.

Claude был наиболее логичен с точки зрения пользы для читателя. Не разливал воду в начале текста, сразу перешел к делу. Даже в малополезном пункте «Уход за обоями» (кто ухаживает за обоями, признавайтесь) дал внятные рекомендации, о чем написать.

Сеошники могут радостно и уверенно юзать ChatGPT, Qwen и DeepSeek, редакторы голосуют за Claude.

2️⃣ Короткий текст
Сводная таблица результатов генерации Claude, ChatGPT, DeepSeek, Qwen и Яндекс GPT.

Формально по числовым метрикам оценки текста — в лидерах ChatGPT, но текст от Claude читается более плавно и связно. И он более четко отрабатывает запросы читателя. К примеру, все нейросети кроме Клода обязательно подливали водички в начале каждого блока.

ChatGPT, DeepSeek, Qwen: много обобщающих фраз, меньше конкретики, чем у Клода, стиль текста совсем сухой, бедная лексика, сплошные списки. Очень характерный блок заключения в текстах — только Клод был прост и конкретен.

Текст от Яндекс ГПТ рассмотрению не подлежит. Вода, требования промта не выполнены.

По отзыву стороннего независимого редактора, меньше всего редачить придется текст от Claude.
Поэтому мы его и юзаем постоянно для генерации.

Из курьезов:
Claude изобрел слово «пампование» (от английского pump — помпа).
DeepSeek не справился со склонением: «Например, если ваши ресницы тонкие и редкие, остановитесь на объёмной туше».

Продолжение — лонгриды и фактчекинг — https://www.group-telegram.com/tr/ilyaiserson.com/292



group-telegram.com/ilyaiserson/291
Create:
Last Update:

Генерим тексты в DeepSeek и Qwen2.5: моя твоя не понимай? Часть I

ИИ-редакция moab генерит до тысячи единиц контента в месяц (можем и больше). Мы опытным путем вывели идеальное (на текущий момент) сочетание ChatGPT и Claude, но тут на арену ворвался DeepSeek, а за ним и Qwen2.5, и мы не могли не сравнить их с проверенными «старичками».

Что проверяли:
1. Генерация структуры текста.
2.1. Генерация короткого текста без стилистических и с минимальными техническими требованиями — посмотреть, как модель пишет сама по себе на своих масках без наших идей, как сделать текст более приятным.
2.2. Генерация лонгрида с техническими и стилистическими требованиями.
3. Фактчек.

Это разные задачи, и нейросети справляются с ними по-разному.

Промты во все ИИ шли без изменений, это не совсем корректно для нормальной работы. Промт для Клода похож, но не идентичен промту для ГПТ. Мы можем в каждом ИИ получить результат получше, если подольше с ним поработаем. Но для теста было важно задавать единые промты.

1️⃣
Структура текста
Сводная таблица итогов работы Claude, ChatGPT, DeepSeek, Qwen и ради курьеза — Яндекс GPT.

Собственно, Яндекс ГПТ хуже всех и справился. Структура скудная, логика изложения хромает, требования промта не отработаны, заложено много объема на водянистые блоки (введение и заключение).

ChatGPT, Qwen и DeepSeek пришли голова в голову, выдав очень похожие и вполне приемлемые структуры.

Claude был наиболее логичен с точки зрения пользы для читателя. Не разливал воду в начале текста, сразу перешел к делу. Даже в малополезном пункте «Уход за обоями» (кто ухаживает за обоями, признавайтесь) дал внятные рекомендации, о чем написать.

Сеошники могут радостно и уверенно юзать ChatGPT, Qwen и DeepSeek, редакторы голосуют за Claude.

2️⃣ Короткий текст
Сводная таблица результатов генерации Claude, ChatGPT, DeepSeek, Qwen и Яндекс GPT.

Формально по числовым метрикам оценки текста — в лидерах ChatGPT, но текст от Claude читается более плавно и связно. И он более четко отрабатывает запросы читателя. К примеру, все нейросети кроме Клода обязательно подливали водички в начале каждого блока.

ChatGPT, DeepSeek, Qwen: много обобщающих фраз, меньше конкретики, чем у Клода, стиль текста совсем сухой, бедная лексика, сплошные списки. Очень характерный блок заключения в текстах — только Клод был прост и конкретен.

Текст от Яндекс ГПТ рассмотрению не подлежит. Вода, требования промта не выполнены.

По отзыву стороннего независимого редактора, меньше всего редачить придется текст от Claude.
Поэтому мы его и юзаем постоянно для генерации.

Из курьезов:
Claude изобрел слово «пампование» (от английского pump — помпа).
DeepSeek не справился со склонением: «Например, если ваши ресницы тонкие и редкие, остановитесь на объёмной туше».

Продолжение — лонгриды и фактчекинг — https://www.group-telegram.com/tr/ilyaiserson.com/292

BY Ilya Iserson




Share with your friend now:
group-telegram.com/ilyaiserson/291

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The Dow Jones Industrial Average fell 230 points, or 0.7%. Meanwhile, the S&P 500 and the Nasdaq Composite dropped 1.3% and 2.2%, respectively. All three indexes began the day with gains before selling off. For Oleksandra Tsekhanovska, head of the Hybrid Warfare Analytical Group at the Kyiv-based Ukraine Crisis Media Center, the effects are both near- and far-reaching. For example, WhatsApp restricted the number of times a user could forward something, and developed automated systems that detect and flag objectionable content. "Someone posing as a Ukrainian citizen just joins the chat and starts spreading misinformation, or gathers data, like the location of shelters," Tsekhanovska said, noting how false messages have urged Ukrainians to turn off their phones at a specific time of night, citing cybersafety. Channels are not fully encrypted, end-to-end. All communications on a Telegram channel can be seen by anyone on the channel and are also visible to Telegram. Telegram may be asked by a government to hand over the communications from a channel. Telegram has a history of standing up to Russian government requests for data, but how comfortable you are relying on that history to predict future behavior is up to you. Because Telegram has this data, it may also be stolen by hackers or leaked by an internal employee.
from tr


Telegram Ilya Iserson
FROM American