silero_news Telegram Group

🚀 Silero VAD v5, в 3 раза быстрее, теперь с поддержкой 6 000+ языков!

- Поддержка 6 000+ языков;
- TorchScript стал в 3 раза быстрее, ONNX на 10%;
- Существенно повышена устойчивость на шумных данных;
- Рост качества на 5-7%;
- Переход на фиксированный размер окна;
- Добавлены метрики на 9 датасетах (7 публичных, 2 приватных);

🔗 https://github.com/snakers4/silero-vad/releases/tag/v5.0

2.3K viewsAlexander, edited 19:21

Silero News

⬆️

https://habr.com/ru/articles/825208/

⬆️

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

Наш публичный детектор голоса стал быстрее в 3 раза (*), качественнее, устойчивее и теперь работает на 6 000 языках

Сравнение качества версий v5, v4 и v3.1 Мы уже рассказывали про наш детектор голоса на Хабре тут , тут и тут . Кратко опишу, что стало лучше в этот раз: Поддержка 6 000+...

2.0K viewsAlexander, 20:53

Silero News

🚀

2.1K viewsAlexander, 07:28

Silero News

🚀 Silero VAD v5, в 3 раза быстрее, теперь с поддержкой 6 000+ языков! - Поддержка 6 000+ языков; - TorchScript стал в 3 раза быстрее, ONNX на 10%; - Существенно повышена устойчивость на шумных данных; - Рост качества на 5-7%; - Переход на фиксированный размер…

Раз наш VAD, будучи полезной тулзой (судя даже по цитатам в пейперах), дошёл наконец-то до версии близкой к ультимативной, то мы аж запулили его в PIP:

- https://pypi.org/project/silero-vad/5.1/

Забавно, что имя silero-vad там уже было занято, но люди по доброте душевной отдали его нам "обратно".

Как использовать через pip:

- https://github.com/snakers4/silero-vad?tab=readme-ov-file#fast-start

PyPI

silero-vad

Voice Activity Detector (VAD) by Silero

2.9K viewsAlexander, 13:31

Silero News

Forwarded from Нейроделикатесы💡

1:14

Media is too big

VIEW IN TELEGRAM

Поэма «Облако на кухне» придумана человеком, написана, озвучена и нарисована машиной. Использованы отечественные нейросети.

1.6K viewsAlexander, 07:20

Silero News

Особенности фонетики якутского языка для синтеза речи

Недавно мы закончили проект по синтезу якутского языка.

Хотя мы не можем выложить модели в общий доступ, соображениями на тему того, как можно делать синтез якутского языка мы поделиться можем.

🐱

Под ~~котом~~ катом вы узнаете:

- Как звучит синтез на якутском языке;
- Чем отличается якутский алфавит от русского и какие "дополнительные" звуки там есть;
- Как работать с ударениями на якутском языке;
- Как якутский синтез речи говорит на русском с якутским акцентом;

⭐️ https://habr.com/ru/articles/837364/

Please open Telegram to view this post

VIEW IN TELEGRAM

2.7K viewsAlexander, edited 16:47

Silero News

🚀 Мы тут недавно докатили новое поколение STT моделей у себя. Под это запилили сравнение метрик.

🤯 Мы думали, что будет ситуация в духе "lie down and rot", то есть грубо говоря на каждый наш рубль Сбер тратит 1 000 рублей, но наша новая "медленная" модель (конечно, она не рекуррентная) нас очень сильно удивила. Как все проснутся, опубликую статью на Хабре.

🧪 Мы раскатили её в нашего тестового бота для распознавания - @silero_audio_bot.

⚙️ Ещё будут раскачены наработки по улучшению потоковой сегментации аудио, но это отдельно ещё накатим.

1.6K viewsAlexander, 04:01

Silero News

Сравнение систем распознавания русского языка 2024

⬆️

https://habr.com/ru/articles/849932/

⬆️

Если у вас есть аккаунт с правом голоса, то можете поддержать статью своим ⬆️

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

Сравнение систем распознавания русского языка 2024

После значительной паузы, опять пришло время обновить наше исследование ( прошлое , позапрошлое ) качества систем распознавания русского языка. Опять же, мы не думали, что добежим до этого момента и...

1.9K viewsAlexander, edited 04:05

Silero News

Добавил новые модели к сравнению, чтобы окончательно закрыть вопрос про непродуктовые решения (и без меня их тыкали, там всё не очень, несмотря на инвестиции и маркетинг). Разница между CTC и RNN-T сократилась.

У нас есть большой чанк новых данных, поэтому полагаю, что можно будет рассчитывать ещё на хороший прирост, на Хабр постить пока не буду.

Очевидные выводы:

- Наша прошлая модель всё ещё лучше;
- Конвергенция метрик;
- Видно, каких данных много и на чём тренировалось;
- Видно, что на бизнес-доменах метрики ниже, но в целом очень достойно;

Что реально удивило - поведение на пранк-звонках. По сути первый раз реально вижу в действии пользу большого пре-трейна после многих лет муссирования мантры в статьях.

1.3K viewsAlexander, edited 18:21

Silero News

Forwarded from Silero News

🚨⚠️🚨 Главный релиз года - HD голоса 🚨⚠️🚨

📌 Попробовать просто - или галкой в паке, или командой /hd в боте.

🤫 Мы держали это в глубоком секрете, но это наконец случилось.

🎁 Держите подарок, мы успели к праздникам!

🆕 Встречайте HD голоса! Они теперь прямо почти как настоящие. Яркие, хлёсткие, чистые, эмоциональные!

🆕 Всего мы добавили 1082 HD голоса для ~25 паков. Из них 284 совсем новые, то есть их раньше не было в SD-версии.

⚙️ Пока мы сделали их доступными для всех пользователей бота, но новую генерацию нельзя начать, не закончив старую.

🎄 И самое главное - это только начало. Открывать все карты не буду, но это далеко не всё xD

⬇️ Пример:

Please open Telegram to view this post

VIEW IN TELEGRAM

925 viewsAlexander, 18:25

Silero News

Forwarded from Silero TTS (озвучка, текст в голос)

0:04

979 viewsAlexander, 18:25

Silero News

Forwarded from Alamerd | WarCraft

0:38

Media is too big

VIEW IN TELEGRAM

У наших друзей из Silero вышло большое обновление. Было добавлено более 1000 HD голосов, 300 из которых совершенно новые!

Ссылка на бота

1.0K viewsAlexander, 09:24

Silero News

Forwarded from Silero News

🎁 Вы думали, что это всё? 🎁

❤️‍🔥 Чисто на хайпе добавили пак с голосами из MiSide! Поздравляем наших соотечественников с большим успехом! Там много вариаций голоса главной тяночки (✿˵•́ ω •̀˵)

💎 Добавили HD-версии голосов в следующие паки: Jo Jo, My Little Pony, Red Alert 2, Genshin.

✍️ Добавили голоса писаря из Stronghold по вашим просьбам. Плюс мелкие правки.

😱 Топовым 25 HD-голосам ... мы добавили эмоции в синтез. Теперь у каждого из них доступны от 1 до 3 дополнительных эмоций на голос!

⬇️ Полный список эмоций первым сообщением в треде:

Please open Telegram to view this post

VIEW IN TELEGRAM

851 viewsAlexander, 15:31

Silero News

Делаем проект Фонда Бортника по разработке модели синтеза речи языков России и СНГ

🔎 Ищем людей, у которых два родных языка (русский и второй родной), которые бы помогли нам с рядом вещей:

- Помощь в поиске актуальных текстов на родном языке;
- Запись голоса (как на русском, так и на втором родном языке);
- Минимальные консультации по фонетике, ударениям и грамматике.

Наша основная задача - сделать удобный, быстрый, устойчивый, качественный и нетребовательный к вычислительным ресурсам синтез на самых популярных у нас в стране и в ближайшем зарубежье языках.

По итогу проекта планируется публикация общедоступных моделей синтеза языка под свободной лицензией (MIT).

✉️ Контакты для связи, условия участия и детали оговариваем в каждом случае отдельно

1.1K viewsAlexander, 11:04

Silero News

Делаем проект Фонда Бортника по разработке модели синтеза речи языков России и СНГ 🔎 Ищем людей, у которых два родных языка (русский и второй родной), которые бы помогли нам с рядом вещей: - Помощь в поиске актуальных текстов на родном языке; - Запись голоса…

🤷‍♂️

Удивительно мало татар в обращениях (ноль).

По идее они должны быть на первом месте, чисто статистически, среди именно постоянного населения РФ.

496 viewsAlexander, edited 06:45

2025/01/15 07:34:27
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>