Вышла в опенсорс и доступна по API DeepSeek R1 (https://github.com/deepseek-ai/DeepSeek-R1) - рассуждающая модель от китайцев (она уже была доступна на сайте, но то была preview версия).
Ближайшие аналоги: o1-mini и o1 от OpenAI.
🪙 Цены:
Deepseek R1 - 0.55/2.19 $ за 1М токенов
o1-mini - 3/12 $ за 1М токенов
o1 - 15/60 $ за 1М токенов
📈 Бенчмарки:
Везде сильнее чем o1-mini, а стоит почти в 6 раз дешевле!
Примерно на одном уровне с o1. Стоит дешевле в 30 раз...
Ну китайцы, ну молодцы, двигают ИИ вперед!
Но это все бенчмарки и надо ждать пока настоящие люди протестируют на своих задачах. Это можно сделать легко и самим - модель доступна, как и прежде, на сайте Deepseek (https://chat.deepseek.com/).
R1 основана на Deepseek 3, которая и так хороша в программировании. Ожидаю что она будет очень сильная, хоть и не на уровне o1.
🔫 И что?
А то, что:
- опенсорс нагоняет закрытые модели
- китайцы демпингуют и создают конкуренцию: разработчикам ИИ уже нельзя замедляться и тормозить, а то потеряют всё преимущество
- ИИ и дальше будет дешеветь, умнеть, и будет доступен даже без ВПН 🤣
👏 Всё? Нет!
Кроме того Deepseek выпустили дистиллированные из R1 модели! То есть их большая и умная R1 "обучала" маленькие модели (например Qwen-1,5B, Llama-8B) размышлять как она и o1 или o1-mini. Даже дистиллированная Qwen-1,5B сравнима с GPT-4o и Claude-3.5-Sonnet!!!
Буду тестить, ведь модели 1.5, 7, 8 легко можно запустить и на слабеньких ноутах без GPU.
Разбираем ИИ по полочкам: https://t.me/optifyhub