Telegram Group & Telegram Channel
Опенсорса много не бывает. Сегодня VK запустил инициативу OpenVK, в рамках которой будет выкладывать в open source свои проекты по нескольким направлениям, включая ИИ. Пока основной площадкой будет GitHub, но в перспективе компания готовится работать и с отечественными Git-платформами.

На старте разработчики опубликовали исходный код платформы Tarantool для создания высоконагруженных приложений, системы StatsHouse для визуализации данных для мониторинга, дизайн-системы VKUI для создания удобных интерфейсов и ряд других. А оформлено всё это как у Яндекса, на отдельном лендинге со ссылками и описанием (хотя источники вдохновения у обоих понятно какие).

🤖 В OpenVK также будут доступны ИИ-модели и библиотеки для их создания. Но о собственной open source LLM пока речи не идёт, что выглядит удивительно после того парада моделей, который мы наблюдали в исполнении MTS AI, Т-Банка и Сбера. Кажется, как и в Яндексе, в VK свои карты раскрывать не спешат.

Зато уже доступна модель EmoSpeech для синтеза речи, обученная на фонемных последовательностях. Она позволяет придать искусственной речи правильные эмоциональные оттенки при озвучке текста нейросетями. Интегрировать решение можно с любой моделью Text-to-Speech, а при наличии датасета — обучить работе с нужным языком (по умолчанию работает только с английским).

У Яндекса тоже есть инструмент для генерации речи, но в открытый доступ компания выложила не его исходный код, а свои правила работы с технологией. Но там речь всё-таки идёт о вопросах взаимодействия с реальными дикторами и генерации контента с их голосами.

💻 Отдельно отметим, что среди опенсорс-разработок VK также будут доступны энкодеры. Их используют для задач обработки естественного языка, таких как классификация и семантический поиск. Энкодеры преобразует текст в семантические представления, которые помогают системе понять смысл текста, а не просто искать совпадения по словам.

Это позволяет эффективно работать с перефразированием и синонимами. На основе семантических представлений можно легко обучить мощные классификаторы для определения, например, токсичности или спама в тексте (трепещите, боты в комментариях!)
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/antidigital/8719
Create:
Last Update:

Опенсорса много не бывает. Сегодня VK запустил инициативу OpenVK, в рамках которой будет выкладывать в open source свои проекты по нескольким направлениям, включая ИИ. Пока основной площадкой будет GitHub, но в перспективе компания готовится работать и с отечественными Git-платформами.

На старте разработчики опубликовали исходный код платформы Tarantool для создания высоконагруженных приложений, системы StatsHouse для визуализации данных для мониторинга, дизайн-системы VKUI для создания удобных интерфейсов и ряд других. А оформлено всё это как у Яндекса, на отдельном лендинге со ссылками и описанием (хотя источники вдохновения у обоих понятно какие).

🤖 В OpenVK также будут доступны ИИ-модели и библиотеки для их создания. Но о собственной open source LLM пока речи не идёт, что выглядит удивительно после того парада моделей, который мы наблюдали в исполнении MTS AI, Т-Банка и Сбера. Кажется, как и в Яндексе, в VK свои карты раскрывать не спешат.

Зато уже доступна модель EmoSpeech для синтеза речи, обученная на фонемных последовательностях. Она позволяет придать искусственной речи правильные эмоциональные оттенки при озвучке текста нейросетями. Интегрировать решение можно с любой моделью Text-to-Speech, а при наличии датасета — обучить работе с нужным языком (по умолчанию работает только с английским).

У Яндекса тоже есть инструмент для генерации речи, но в открытый доступ компания выложила не его исходный код, а свои правила работы с технологией. Но там речь всё-таки идёт о вопросах взаимодействия с реальными дикторами и генерации контента с их голосами.

💻 Отдельно отметим, что среди опенсорс-разработок VK также будут доступны энкодеры. Их используют для задач обработки естественного языка, таких как классификация и семантический поиск. Энкодеры преобразует текст в семантические представления, которые помогают системе понять смысл текста, а не просто искать совпадения по словам.

Это позволяет эффективно работать с перефразированием и синонимами. На основе семантических представлений можно легко обучить мощные классификаторы для определения, например, токсичности или спама в тексте (трепещите, боты в комментариях!)

BY Нецифровая экономика




Share with your friend now:
group-telegram.com/antidigital/8719

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Messages are not fully encrypted by default. That means the company could, in theory, access the content of the messages, or be forced to hand over the data at the request of a government. In this regard, Sebi collaborated with the Telecom Regulatory Authority of India (TRAI) to reduce the vulnerability of the securities market to manipulation through misuse of mass communication medium like bulk SMS. On December 23rd, 2020, Pavel Durov posted to his channel that the company would need to start generating revenue. In early 2021, he added that any advertising on the platform would not use user data for targeting, and that it would be focused on “large one-to-many channels.” He pledged that ads would be “non-intrusive” and that most users would simply not notice any change. Soloviev also promoted the channel in a post he shared on his own Telegram, which has 580,000 followers. The post recommended his viewers subscribe to "War on Fakes" in a time of fake news. Such instructions could actually endanger people — citizens receive air strike warnings via smartphone alerts.
from fr


Telegram Нецифровая экономика
FROM American