Telegram Group & Telegram Channel
☁️  Тренд на активные тесты и интеграцию opensource-моделей становится виден всё чётче. Сегодня Yandex Cloud добавил в свой сервис Foundation Models опцию, которая позволяет запустить ML-модели на выделенных мощностях. Так можно развернуть не только разные версии YandexGPT, но и Qwen, Mixtral, DeepSeek, LLaMA и другие, которые «уже есть или появятся в будущем», рассказали в компании специально для @anti_agi

В выделенном режиме Dedicated Inference Endpoint клиент резервирует вычислительные мощности, подобрав конфигурацию после консультации со специалистами Яндекса. Так достигается стабильная работа сервиса даже при высоких нагрузках. Ещё на «выделенке» можно зафиксировать для работы определённые версии нейросетей для конкретных бизнес-задач.

В Foundation Models можно использовать сразу несколько запущенных моделей, комбинировать их или подбирать наиболее оптимальные для конкретной задачи. А «легитимность» работе с опенсорсом придаёт тот факт, что сервисы компании соответствуют индустриальным ИБ-стандартам и закону «О персональных данных».

Если говорить о пользе совсем «на пальцах»: новые модели появляются постоянно, и держать все из них на «горячем старте» в облаке нерационально. В случае с новой опцией клиенту не нужно самостоятельно готовить инфраструктуру, каждый раз настраивать работу модели и её мониторинг — всё сделают специалисты Яндекса.

🐷 Уточнили про деньги: за консультацию и подбор мощностей отдельно плату не берут. А сама стоимость конфигурации будет определяться индивидуально для каждого пользователя, конкретных тарифов пока нет.

ℹ️ Напомним, что ранее в начале февраля МТС представила платформу MWS GPT, которую позиционируют как «b2b-агрегатор языковых моделей». Там так же обещают «полный цикл работ с командой MWS» с упором на тесты и интеграцию opensource-моделей. Стоит это удовольствие 1,10 рубля за 1 тысячу токенов, что оказалось выше рынка по словам отдельных экспертов.

У самого Яндекса с сентября прошлого года есть AI Studio, которая объединяет нейросети YandexGPT и YandexART, технологии синтеза и распознавания речи, интерактивную среду для обучения нейросетей и другие ML-решения компании. Для интеграции там также доступны и сторонние LLM, но не на выделенных мощностях.

🔤🔤В Яндексе также напомнили, что сами участвуют в развитии opensource. Летом компания открыла исходный код YaFSDP — библиотеки, которая позволяет ускорить обучение больших языковых моделей до 25% и помогает сократить расходы на использование GPU.

Но вообще, конечно, ждём релиза какой-никакой, а открытой версии YandexGPT. Ну а пока наслаждаемся интеграциями с другими моделями: интересно, будут ли нас ждать новые коллаборации, вроде недавнего запуска модели DeepSeek Janus-Pro-7B в Шедевруме?
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/anti_agi/230
Create:
Last Update:

☁️  Тренд на активные тесты и интеграцию opensource-моделей становится виден всё чётче. Сегодня Yandex Cloud добавил в свой сервис Foundation Models опцию, которая позволяет запустить ML-модели на выделенных мощностях. Так можно развернуть не только разные версии YandexGPT, но и Qwen, Mixtral, DeepSeek, LLaMA и другие, которые «уже есть или появятся в будущем», рассказали в компании специально для @anti_agi

В выделенном режиме Dedicated Inference Endpoint клиент резервирует вычислительные мощности, подобрав конфигурацию после консультации со специалистами Яндекса. Так достигается стабильная работа сервиса даже при высоких нагрузках. Ещё на «выделенке» можно зафиксировать для работы определённые версии нейросетей для конкретных бизнес-задач.

В Foundation Models можно использовать сразу несколько запущенных моделей, комбинировать их или подбирать наиболее оптимальные для конкретной задачи. А «легитимность» работе с опенсорсом придаёт тот факт, что сервисы компании соответствуют индустриальным ИБ-стандартам и закону «О персональных данных».

Если говорить о пользе совсем «на пальцах»: новые модели появляются постоянно, и держать все из них на «горячем старте» в облаке нерационально. В случае с новой опцией клиенту не нужно самостоятельно готовить инфраструктуру, каждый раз настраивать работу модели и её мониторинг — всё сделают специалисты Яндекса.

🐷 Уточнили про деньги: за консультацию и подбор мощностей отдельно плату не берут. А сама стоимость конфигурации будет определяться индивидуально для каждого пользователя, конкретных тарифов пока нет.

ℹ️ Напомним, что ранее в начале февраля МТС представила платформу MWS GPT, которую позиционируют как «b2b-агрегатор языковых моделей». Там так же обещают «полный цикл работ с командой MWS» с упором на тесты и интеграцию opensource-моделей. Стоит это удовольствие 1,10 рубля за 1 тысячу токенов, что оказалось выше рынка по словам отдельных экспертов.

У самого Яндекса с сентября прошлого года есть AI Studio, которая объединяет нейросети YandexGPT и YandexART, технологии синтеза и распознавания речи, интерактивную среду для обучения нейросетей и другие ML-решения компании. Для интеграции там также доступны и сторонние LLM, но не на выделенных мощностях.

🔤🔤В Яндексе также напомнили, что сами участвуют в развитии opensource. Летом компания открыла исходный код YaFSDP — библиотеки, которая позволяет ускорить обучение больших языковых моделей до 25% и помогает сократить расходы на использование GPU.

Но вообще, конечно, ждём релиза какой-никакой, а открытой версии YandexGPT. Ну а пока наслаждаемся интеграциями с другими моделями: интересно, будут ли нас ждать новые коллаборации, вроде недавнего запуска модели DeepSeek Janus-Pro-7B в Шедевруме?

BY Неискусственный интеллект




Share with your friend now:
group-telegram.com/anti_agi/230

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

In addition, Telegram's architecture limits the ability to slow the spread of false information: the lack of a central public feed, and the fact that comments are easily disabled in channels, reduce the space for public pushback. Official government accounts have also spread fake fact checks. An official Twitter account for the Russia diplomatic mission in Geneva shared a fake debunking video claiming without evidence that "Western and Ukrainian media are creating thousands of fake news on Russia every day." The video, which has amassed almost 30,000 views, offered a "how-to" spot misinformation. Despite Telegram's origins, its approach to users' security has privacy advocates worried. "There are several million Russians who can lift their head up from propaganda and try to look for other sources, and I'd say that most look for it on Telegram," he said. On February 27th, Durov posted that Channels were becoming a source of unverified information and that the company lacks the ability to check on their veracity. He urged users to be mistrustful of the things shared on Channels, and initially threatened to block the feature in the countries involved for the length of the war, saying that he didn’t want Telegram to be used to aggravate conflict or incite ethnic hatred. He did, however, walk back this plan when it became clear that they had also become a vital communications tool for Ukrainian officials and citizens to help coordinate their resistance and evacuations.
from us


Telegram Неискусственный интеллект
FROM American