Telegram Group Search
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Silero VAD v5, в 3 раза быстрее, теперь с поддержкой 6 000+ языков!

- Поддержка 6 000+ языков;
- TorchScript стал в 3 раза быстрее, ONNX на 10%;
- Существенно повышена устойчивость на шумных данных;
- Рост качества на 5-7%;
- Переход на фиксированный размер окна;
- Добавлены метрики на 9 датасетах (7 публичных, 2 приватных);

🔗 https://github.com/snakers4/silero-vad/releases/tag/v5.0
🚀
Silero News
🚀 Silero VAD v5, в 3 раза быстрее, теперь с поддержкой 6 000+ языков! - Поддержка 6 000+ языков; - TorchScript стал в 3 раза быстрее, ONNX на 10%; - Существенно повышена устойчивость на шумных данных; - Рост качества на 5-7%; - Переход на фиксированный размер…
Раз наш VAD, будучи полезной тулзой (судя даже по цитатам в пейперах), дошёл наконец-то до версии близкой к ультимативной, то мы аж запулили его в PIP:

- https://pypi.org/project/silero-vad/5.1/

Забавно, что имя silero-vad там уже было занято, но люди по доброте душевной отдали его нам "обратно".

Как использовать через pip:

- https://github.com/snakers4/silero-vad?tab=readme-ov-file#fast-start
Media is too big
VIEW IN TELEGRAM
Поэма «Облако на кухне» придумана человеком, написана, озвучена и нарисована машиной. Использованы отечественные нейросети.
Особенности фонетики якутского языка для синтеза речи

Недавно мы закончили проект по синтезу якутского языка.

Хотя мы не можем выложить модели в общий доступ, соображениями на тему того, как можно делать синтез якутского языка мы поделиться можем.

🐱 Под котом катом вы узнаете:

- Как звучит синтез на якутском языке;
- Чем отличается якутский алфавит от русского и какие "дополнительные" звуки там есть;
- Как работать с ударениями на якутском языке;
- Как якутский синтез речи говорит на русском с якутским акцентом;

⭐️ https://habr.com/ru/articles/837364/
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Мы тут недавно докатили новое поколение STT моделей у себя. Под это запилили сравнение метрик.

🤯 Мы думали, что будет ситуация в духе "lie down and rot", то есть грубо говоря на каждый наш рубль Сбер тратит 1 000 рублей, но наша новая "медленная" модель (конечно, она не рекуррентная) нас очень сильно удивила. Как все проснутся, опубликую статью на Хабре.

🧪 Мы раскатили её в нашего тестового бота для распознавания - @silero_audio_bot.

⚙️ Ещё будут раскачены наработки по улучшению потоковой сегментации аудио, но это отдельно ещё накатим.
Добавил новые модели к сравнению, чтобы окончательно закрыть вопрос про непродуктовые решения (и без меня их тыкали, там всё не очень, несмотря на инвестиции и маркетинг). Разница между CTC и RNN-T сократилась.

У нас есть большой чанк новых данных, поэтому полагаю, что можно будет рассчитывать ещё на хороший прирост, на Хабр постить пока не буду.

Очевидные выводы:

- Наша прошлая модель всё ещё лучше;
- Конвергенция метрик;
- Видно, каких данных много и на чём тренировалось;
- Видно, что на бизнес-доменах метрики ниже, но в целом очень достойно;

Что реально удивило - поведение на пранк-звонках. По сути первый раз реально вижу в действии пользу большого пре-трейна после многих лет муссирования мантры в статьях.
Forwarded from Silero News
🚨⚠️🚨 Главный релиз года - HD голоса 🚨⚠️🚨

📌 Попробовать просто - или галкой в паке, или командой /hd в боте.

🤫 Мы держали это в глубоком секрете, но это наконец случилось.

🎁 Держите подарок, мы успели к праздникам!

🆕 Встречайте HD голоса! Они теперь прямо почти как настоящие. Яркие, хлёсткие, чистые, эмоциональные!

🆕 Всего мы добавили 1082 HD голоса для ~25 паков. Из них 284 совсем новые, то есть их раньше не было в SD-версии.

⚙️ Пока мы сделали их доступными для всех пользователей бота, но новую генерацию нельзя начать, не закончив старую.

🎄 И самое главное - это только начало. Открывать все карты не буду, но это далеко не всё xD

⬇️ Пример:
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Silero TTS (озвучка, текст в голос)
Forwarded from Alamerd | WarCraft
Media is too big
VIEW IN TELEGRAM
У наших друзей из Silero вышло большое обновление. Было добавлено более 1000 HD голосов, 300 из которых совершенно новые!

Ссылка на бота
Forwarded from Silero News
🎁 Вы думали, что это всё? 🎁

❤️‍🔥 Чисто на хайпе добавили пак с голосами из MiSide! Поздравляем наших соотечественников с большим успехом! Там много вариаций голоса главной тяночки (✿˵•́ ω •̀˵)

💎 Добавили HD-версии голосов в следующие паки: Jo Jo, My Little Pony, Red Alert 2, Genshin.

✍️ Добавили голоса писаря из Stronghold по вашим просьбам. Плюс мелкие правки.

😱 Топовым 25 HD-голосам ... мы добавили эмоции в синтез. Теперь у каждого из них доступны от 1 до 3 дополнительных эмоций на голос!

⬇️ Полный список эмоций первым сообщением в треде:
Please open Telegram to view this post
VIEW IN TELEGRAM
Делаем проект Фонда Бортника по разработке модели синтеза речи языков России и СНГ

🔎 Ищем людей, у которых два родных языка (русский и второй родной), которые бы помогли нам с рядом вещей:

- Помощь в поиске актуальных текстов на родном языке;
- Запись голоса (как на русском, так и на втором родном языке);
- Минимальные консультации по фонетике, ударениям и грамматике.

Наша основная задача - сделать удобный, быстрый, устойчивый, качественный и нетребовательный к вычислительным ресурсам синтез на самых популярных у нас в стране и в ближайшем зарубежье языках.

По итогу проекта планируется публикация общедоступных моделей синтеза языка под свободной лицензией (MIT).

✉️ Контакты для связи, условия участия и детали оговариваем в каждом случае отдельно
2025/01/15 07:34:27
Back to Top
HTML Embed Code: