Telegram Group & Telegram Channel
☁️  Тренд на активные тесты и интеграцию opensource-моделей становится виден всё чётче. Сегодня Yandex Cloud добавил в свой сервис Foundation Models опцию, которая позволяет запустить ML-модели на выделенных мощностях. Так можно развернуть не только разные версии YandexGPT, но и Qwen, Mixtral, DeepSeek, LLaMA и другие, которые «уже есть или появятся в будущем», рассказали в компании специально для @anti_agi

В выделенном режиме Dedicated Inference Endpoint клиент резервирует вычислительные мощности, подобрав конфигурацию после консультации со специалистами Яндекса. Так достигается стабильная работа сервиса даже при высоких нагрузках. Ещё на «выделенке» можно зафиксировать для работы определённые версии нейросетей для конкретных бизнес-задач.

В Foundation Models можно использовать сразу несколько запущенных моделей, комбинировать их или подбирать наиболее оптимальные для конкретной задачи. А «легитимность» работе с опенсорсом придаёт тот факт, что сервисы компании соответствуют индустриальным ИБ-стандартам и закону «О персональных данных».

Если говорить о пользе совсем «на пальцах»: новые модели появляются постоянно, и держать все из них на «горячем старте» в облаке нерационально. В случае с новой опцией клиенту не нужно самостоятельно готовить инфраструктуру, каждый раз настраивать работу модели и её мониторинг — всё сделают специалисты Яндекса.

🐷 Уточнили про деньги: за консультацию и подбор мощностей отдельно плату не берут. А сама стоимость конфигурации будет определяться индивидуально для каждого пользователя, конкретных тарифов пока нет.

ℹ️ Напомним, что ранее в начале февраля МТС представила платформу MWS GPT, которую позиционируют как «b2b-агрегатор языковых моделей». Там так же обещают «полный цикл работ с командой MWS» с упором на тесты и интеграцию opensource-моделей. Стоит это удовольствие 1,10 рубля за 1 тысячу токенов, что оказалось выше рынка по словам отдельных экспертов.

У самого Яндекса с сентября прошлого года есть AI Studio, которая объединяет нейросети YandexGPT и YandexART, технологии синтеза и распознавания речи, интерактивную среду для обучения нейросетей и другие ML-решения компании. Для интеграции там также доступны и сторонние LLM, но не на выделенных мощностях.

🔤🔤В Яндексе также напомнили, что сами участвуют в развитии opensource. Летом компания открыла исходный код YaFSDP — библиотеки, которая позволяет ускорить обучение больших языковых моделей до 25% и помогает сократить расходы на использование GPU.

Но вообще, конечно, ждём релиза какой-никакой, а открытой версии YandexGPT. Ну а пока наслаждаемся интеграциями с другими моделями: интересно, будут ли нас ждать новые коллаборации, вроде недавнего запуска модели DeepSeek Janus-Pro-7B в Шедевруме?
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/anti_agi/230
Create:
Last Update:

☁️  Тренд на активные тесты и интеграцию opensource-моделей становится виден всё чётче. Сегодня Yandex Cloud добавил в свой сервис Foundation Models опцию, которая позволяет запустить ML-модели на выделенных мощностях. Так можно развернуть не только разные версии YandexGPT, но и Qwen, Mixtral, DeepSeek, LLaMA и другие, которые «уже есть или появятся в будущем», рассказали в компании специально для @anti_agi

В выделенном режиме Dedicated Inference Endpoint клиент резервирует вычислительные мощности, подобрав конфигурацию после консультации со специалистами Яндекса. Так достигается стабильная работа сервиса даже при высоких нагрузках. Ещё на «выделенке» можно зафиксировать для работы определённые версии нейросетей для конкретных бизнес-задач.

В Foundation Models можно использовать сразу несколько запущенных моделей, комбинировать их или подбирать наиболее оптимальные для конкретной задачи. А «легитимность» работе с опенсорсом придаёт тот факт, что сервисы компании соответствуют индустриальным ИБ-стандартам и закону «О персональных данных».

Если говорить о пользе совсем «на пальцах»: новые модели появляются постоянно, и держать все из них на «горячем старте» в облаке нерационально. В случае с новой опцией клиенту не нужно самостоятельно готовить инфраструктуру, каждый раз настраивать работу модели и её мониторинг — всё сделают специалисты Яндекса.

🐷 Уточнили про деньги: за консультацию и подбор мощностей отдельно плату не берут. А сама стоимость конфигурации будет определяться индивидуально для каждого пользователя, конкретных тарифов пока нет.

ℹ️ Напомним, что ранее в начале февраля МТС представила платформу MWS GPT, которую позиционируют как «b2b-агрегатор языковых моделей». Там так же обещают «полный цикл работ с командой MWS» с упором на тесты и интеграцию opensource-моделей. Стоит это удовольствие 1,10 рубля за 1 тысячу токенов, что оказалось выше рынка по словам отдельных экспертов.

У самого Яндекса с сентября прошлого года есть AI Studio, которая объединяет нейросети YandexGPT и YandexART, технологии синтеза и распознавания речи, интерактивную среду для обучения нейросетей и другие ML-решения компании. Для интеграции там также доступны и сторонние LLM, но не на выделенных мощностях.

🔤🔤В Яндексе также напомнили, что сами участвуют в развитии opensource. Летом компания открыла исходный код YaFSDP — библиотеки, которая позволяет ускорить обучение больших языковых моделей до 25% и помогает сократить расходы на использование GPU.

Но вообще, конечно, ждём релиза какой-никакой, а открытой версии YandexGPT. Ну а пока наслаждаемся интеграциями с другими моделями: интересно, будут ли нас ждать новые коллаборации, вроде недавнего запуска модели DeepSeek Janus-Pro-7B в Шедевруме?

BY Неискусственный интеллект




Share with your friend now:
group-telegram.com/anti_agi/230

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

False news often spreads via public groups, or chats, with potentially fatal effects. In view of this, the regulator has cautioned investors not to rely on such investment tips / advice received through social media platforms. It has also said investors should exercise utmost caution while taking investment decisions while dealing in the securities market. Such instructions could actually endanger people — citizens receive air strike warnings via smartphone alerts. In addition, Telegram's architecture limits the ability to slow the spread of false information: the lack of a central public feed, and the fact that comments are easily disabled in channels, reduce the space for public pushback. During the operations, Sebi officials seized various records and documents, including 34 mobile phones, six laptops, four desktops, four tablets, two hard drive disks and one pen drive from the custody of these persons.
from ca


Telegram Неискусственный интеллект
FROM American