group-telegram.com/ai_newz/3624
Create:
Last Update:
Last Update:
DeepSeek выпустили веса R1, своей reasoner модели
Как обычно, компания сначала релизит веса, и лишь потом техрепорты и бенчмарки. Так что пока что у нас есть лишь результаты Preview версии на LiveCodeBench, где R1-Preview тягается по качеству с o1. Важный контекст к табличке - в отличие от o1, мы не знаем насколько много компьюта использовали для получения таких результатов от R1. Если бенчили аналог low-compute режима OpenAI, то модель может в итоге оказаться сильнее чем o1.
Основана R1 на DeepSeek V3 (685 миллиардов параметров), так что требования для запуска модели такие же - 8xH200. Пока ждём техрепорта, можно поспекулировать в чём разница между R1 и R1-Zero.
Веса R1
Веса R1-Zero
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/dZyMiEkUIIrlexZucoiEiGwEwqj-FEY1rGEZg_NS1WyL998QBZ6y16IB3ClExqinR0vAffuezTMhbtF4_RY1m7fnPk9rIQI0S7pc9C6WrIp1IiPIooMdS9YMGgQGDxQ6IP5GzYqTMUgomFxhX9Pduhb9YmNlAHLRtH41csrnU21s6DIrHFnUOzK1vnJeCOdB-am8TTYeCRa1NZsMG0voMzrDg5nnMOHd_qjfE8-ysBxBHB5GuD4qsps1PL0cDbtWtpRgHL9mlcIBTRBQQRVJJMB-4WKJzy8BhTHDWarucyJePYvhM6tHT7Bjn1icu5AJmkRXULYa48WXPSY-kXpZKg.jpg)
Share with your friend now:
group-telegram.com/ai_newz/3624