group-telegram.com/ai_newz/3117
Last Update:
Дешёвые, как грязь, LLM
API-провайдеры невероятно быстро снижают стоимость использования своих LLM. При отсутствии ярко выраженного лидера по качеству моделей, главным аргументом становится цена.
➖ Google с 12 августа дропает цены на Gemini Flash на 80%. Вот и реакция на GPT-4o mini, спустя две недели после релиза. Вот бы то же самое сделали с Pro 1.5.
➖ Новая версия GPT-4o упала в цене до $2.5 input/$10 output за миллион токенов, прошлые версии стоили $5 input/$15 output за миллион токенов. Последний месяц Claude 3.5 Sonnet и Llama 3.1 405B сильно поджимали OpenAI по цене, пришлось отвечать.
➖Deepseek релизит обещанный месяц назад Context Caching. Цены поражают: стоимость токенов при попадании в кэш падает не в 2x, как у гугла, а в 10x, при этом с бесплатным хранением. DeepSeek V2 и так произвёл эффект разорвавшейся бомбы на китайском рынке три месяца назад: модель была в разы дешевле конкурентов, при лучшем качестве. А сейчас нанесли добивающий удар.
С такими темпами цена за миллион токенов станет меньше цента менее чем через год. И будем мы мерять цены в долларах за миллиард токенов.
А помните, цены на GPT-4 доходили до $60 input/$120 output?
@ai_newz
BY эйай ньюз
![](https://photo.group-telegram.com/u/cdn4.cdn-telegram.org/file/I0T7PV7_aZrZesWmedfnhxLcrMyBJ3iFOGZFdWs6YFVFfom1CvkSG6FNONxF1uSWHzzRurW0G1olU186RvwL_aPVTjTkXwg8PC-LberEQXV4msfLL1xcxnz2jfvhnTzWpczcd0yPwtQzUEYhReZkE1qHLWdVTk0nX2MhvBEKpS22iR7VgKBFwGKNlmLYgeic2SmHZKd9p76s8RfwPRgdbLjkAMnT_AixLoqjq3qqxI2hTGYR2i2cMWMck_hZRGMKXdXbMbDbaFwX6JL7Qq1YGcRUtQmdkyXzma9T8uRhUtjj2B4AMFus0Nz_FLzczsIaWBhDQaS6tGfO2SnN1AZ3Gg.jpg)
Share with your friend now:
group-telegram.com/ai_newz/3117