Telegram Group & Telegram Channel
Опенсорса много не бывает. Сегодня VK запустил инициативу OpenVK, в рамках которой будет выкладывать в open source свои проекты по нескольким направлениям, включая ИИ. Пока основной площадкой будет GitHub, но в перспективе компания готовится работать и с отечественными Git-платформами.

На старте разработчики опубликовали исходный код платформы Tarantool для создания высоконагруженных приложений, системы StatsHouse для визуализации данных для мониторинга, дизайн-системы VKUI для создания удобных интерфейсов и ряд других. А оформлено всё это как у Яндекса, на отдельном лендинге со ссылками и описанием (хотя источники вдохновения у обоих понятно какие).

🤖 В OpenVK также будут доступны ИИ-модели и библиотеки для их создания. Но о собственной open source LLM пока речи не идёт, что выглядит удивительно после того парада моделей, который мы наблюдали в исполнении MTS AI, Т-Банка и Сбера. Кажется, как и в Яндексе, в VK свои карты раскрывать не спешат.

Зато уже доступна модель EmoSpeech для синтеза речи, обученная на фонемных последовательностях. Она позволяет придать искусственной речи правильные эмоциональные оттенки при озвучке текста нейросетями. Интегрировать решение можно с любой моделью Text-to-Speech, а при наличии датасета — обучить работе с нужным языком (по умолчанию работает только с английским).

У Яндекса тоже есть инструмент для генерации речи, но в открытый доступ компания выложила не его исходный код, а свои правила работы с технологией. Но там речь всё-таки идёт о вопросах взаимодействия с реальными дикторами и генерации контента с их голосами.

💻 Отдельно отметим, что среди опенсорс-разработок VK также будут доступны энкодеры. Их используют для задач обработки естественного языка, таких как классификация и семантический поиск. Энкодеры преобразует текст в семантические представления, которые помогают системе понять смысл текста, а не просто искать совпадения по словам.

Это позволяет эффективно работать с перефразированием и синонимами. На основе семантических представлений можно легко обучить мощные классификаторы для определения, например, токсичности или спама в тексте (трепещите, боты в комментариях!)
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/antidigital/8719
Create:
Last Update:

Опенсорса много не бывает. Сегодня VK запустил инициативу OpenVK, в рамках которой будет выкладывать в open source свои проекты по нескольким направлениям, включая ИИ. Пока основной площадкой будет GitHub, но в перспективе компания готовится работать и с отечественными Git-платформами.

На старте разработчики опубликовали исходный код платформы Tarantool для создания высоконагруженных приложений, системы StatsHouse для визуализации данных для мониторинга, дизайн-системы VKUI для создания удобных интерфейсов и ряд других. А оформлено всё это как у Яндекса, на отдельном лендинге со ссылками и описанием (хотя источники вдохновения у обоих понятно какие).

🤖 В OpenVK также будут доступны ИИ-модели и библиотеки для их создания. Но о собственной open source LLM пока речи не идёт, что выглядит удивительно после того парада моделей, который мы наблюдали в исполнении MTS AI, Т-Банка и Сбера. Кажется, как и в Яндексе, в VK свои карты раскрывать не спешат.

Зато уже доступна модель EmoSpeech для синтеза речи, обученная на фонемных последовательностях. Она позволяет придать искусственной речи правильные эмоциональные оттенки при озвучке текста нейросетями. Интегрировать решение можно с любой моделью Text-to-Speech, а при наличии датасета — обучить работе с нужным языком (по умолчанию работает только с английским).

У Яндекса тоже есть инструмент для генерации речи, но в открытый доступ компания выложила не его исходный код, а свои правила работы с технологией. Но там речь всё-таки идёт о вопросах взаимодействия с реальными дикторами и генерации контента с их голосами.

💻 Отдельно отметим, что среди опенсорс-разработок VK также будут доступны энкодеры. Их используют для задач обработки естественного языка, таких как классификация и семантический поиск. Энкодеры преобразует текст в семантические представления, которые помогают системе понять смысл текста, а не просто искать совпадения по словам.

Это позволяет эффективно работать с перефразированием и синонимами. На основе семантических представлений можно легко обучить мощные классификаторы для определения, например, токсичности или спама в тексте (трепещите, боты в комментариях!)

BY Нецифровая экономика




Share with your friend now:
group-telegram.com/antidigital/8719

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

This ability to mix the public and the private, as well as the ability to use bots to engage with users has proved to be problematic. In early 2021, a database selling phone numbers pulled from Facebook was selling numbers for $20 per lookup. Similarly, security researchers found a network of deepfake bots on the platform that were generating images of people submitted by users to create non-consensual imagery, some of which involved children. Markets continued to grapple with the economic and corporate earnings implications relating to the Russia-Ukraine conflict. “We have a ton of uncertainty right now,” said Stephanie Link, chief investment strategist and portfolio manager at Hightower Advisors. “We’re dealing with a war, we’re dealing with inflation. We don’t know what it means to earnings.” The channel appears to be part of the broader information war that has developed following Russia's invasion of Ukraine. The Kremlin has paid Russian TikTok influencers to push propaganda, according to a Vice News investigation, while ProPublica found that fake Russian fact check videos had been viewed over a million times on Telegram. Telegram has become more interventionist over time, and has steadily increased its efforts to shut down these accounts. But this has also meant that the company has also engaged with lawmakers more generally, although it maintains that it doesn’t do so willingly. For instance, in September 2021, Telegram reportedly blocked a chat bot in support of (Putin critic) Alexei Navalny during Russia’s most recent parliamentary elections. Pavel Durov was quoted at the time saying that the company was obliged to follow a “legitimate” law of the land. He added that as Apple and Google both follow the law, to violate it would give both platforms a reason to boot the messenger from its stores. Telegram users are able to send files of any type up to 2GB each and access them from any device, with no limit on cloud storage, which has made downloading files more popular on the platform.
from it


Telegram Нецифровая экономика
FROM American