Forwarded from Нейродвиж
ЛОЛ, похоже что DeepSeek всё же украли ChatGPT — OpenAI говорят, что у них есть пруфы использования их моделей для тренировки DeepSeek R1.
Если коротко, то китайцы использовали дистилляцию (большая модель тренирует меньшую модель как учитель).
На это указывает сразу несколько факторов:
— Моделька не просто думала, что она ChatGPT (это еще можно объяснить), она еще и цитировала политики OpenAI, которые в открытом доступе не очень часто встречаются;
— Если обращаться к DeepSeek на русском языке, то он будет писать, что он YandexGPT. Скорее всего, разработки Яндекса тоже покрали (но это не точно).
Параллельно Microsoft запустили своё расследование.
Если коротко, то китайцы использовали дистилляцию (большая модель тренирует меньшую модель как учитель).
На это указывает сразу несколько факторов:
— Моделька не просто думала, что она ChatGPT (это еще можно объяснить), она еще и цитировала политики OpenAI, которые в открытом доступе не очень часто встречаются;
— Если обращаться к DeepSeek на русском языке, то он будет писать, что он YandexGPT. Скорее всего, разработки Яндекса тоже покрали (но это не точно).
Параллельно Microsoft запустили своё расследование.
This media is not supported in your browser
VIEW IN TELEGRAM