group-telegram.com/ai_newz/3117
Last Update:
Дешёвые, как грязь, LLM
API-провайдеры невероятно быстро снижают стоимость использования своих LLM. При отсутствии ярко выраженного лидера по качеству моделей, главным аргументом становится цена.
➖ Google с 12 августа дропает цены на Gemini Flash на 80%. Вот и реакция на GPT-4o mini, спустя две недели после релиза. Вот бы то же самое сделали с Pro 1.5.
➖ Новая версия GPT-4o упала в цене до $2.5 input/$10 output за миллион токенов, прошлые версии стоили $5 input/$15 output за миллион токенов. Последний месяц Claude 3.5 Sonnet и Llama 3.1 405B сильно поджимали OpenAI по цене, пришлось отвечать.
➖Deepseek релизит обещанный месяц назад Context Caching. Цены поражают: стоимость токенов при попадании в кэш падает не в 2x, как у гугла, а в 10x, при этом с бесплатным хранением. DeepSeek V2 и так произвёл эффект разорвавшейся бомбы на китайском рынке три месяца назад: модель была в разы дешевле конкурентов, при лучшем качестве. А сейчас нанесли добивающий удар.
С такими темпами цена за миллион токенов станет меньше цента менее чем через год. И будем мы мерять цены в долларах за миллиард токенов.
А помните, цены на GPT-4 доходили до $60 input/$120 output?
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/mzUBhv8t5TDIvRSVSUe10xOPbdnBq-2PQ4LLXS-efklVhMWUlQU-NFeSuWuVT4SX_pk3GsN0gqclPjtrFLuKgzM_xHRCq6UR54FlTjlXLlM4QWIT0bL6DOMeLQSYatwA4Duh7XA6db3ETNZjLRJX7vhmS88dGfE5SkvOYeWrMpYHTsyot5s8zxwvENH-3gYmDbn5x7jYUP5_H1ex-zR0XoOS1odm8iPOL0Aay7A0j_VnQNvsuwcbdLTTUmy0jDQ36TA7qQFHKFNCiYiR0wvlDUOtKAfG-57DyTgf2JbeYa1fVEfN3cQ_ZteFTxFy_amONP1U1NvBKdFBMhHEhbYV8A.jpg)
Share with your friend now:
group-telegram.com/ai_newz/3117