group-telegram.com/antidigital/8719
Last Update:
Опенсорса много не бывает. Сегодня VK запустил инициативу OpenVK, в рамках которой будет выкладывать в open source свои проекты по нескольким направлениям, включая ИИ. Пока основной площадкой будет GitHub, но в перспективе компания готовится работать и с отечественными Git-платформами.
На старте разработчики опубликовали исходный код платформы Tarantool для создания высоконагруженных приложений, системы StatsHouse для визуализации данных для мониторинга, дизайн-системы VKUI для создания удобных интерфейсов и ряд других. А оформлено всё это как у Яндекса, на отдельном лендинге со ссылками и описанием (хотя источники вдохновения у обоих понятно какие).
Зато уже доступна модель EmoSpeech для синтеза речи, обученная на фонемных последовательностях. Она позволяет придать искусственной речи правильные эмоциональные оттенки при озвучке текста нейросетями. Интегрировать решение можно с любой моделью Text-to-Speech, а при наличии датасета — обучить работе с нужным языком (по умолчанию работает только с английским).
У Яндекса тоже есть инструмент для генерации речи, но в открытый доступ компания выложила не его исходный код, а свои правила работы с технологией. Но там речь всё-таки идёт о вопросах взаимодействия с реальными дикторами и генерации контента с их голосами.
Это позволяет эффективно работать с перефразированием и синонимами. На основе семантических представлений можно легко обучить мощные классификаторы для определения, например, токсичности или спама в тексте (трепещите, боты в комментариях!)