Notice: file_put_contents(): Write of 13365 bytes failed with errno=28 No space left on device in /var/www/group-telegram/post.php on line 50
Psy Eyes | Telegram Webview: Psy_Eyes/1209 -
Telegram Group & Telegram Channel
Есть крутой опенсорсный text-2-speech (TTS) проект Coqui. У них в наличии имеется сайт, на котором много голосовых пресетов, есть настройка скорости произношения, легко клонировать речь и генерить на её основе фразы на разных языках.

Также у них репо на гитхабе Coqui TTS, которое используется разными проектами, как база для работы голосом. Тут есть поддержка Bark для клонирования, предобученные модели на 1100+ языков, Tortoise для быстрого инференса, API, и смешивание голосов. Можно натренить модель на своих данных, если нужно. Однако эта модель по качеству генераций уступает той, что на сайте — XTTS, которая после пробника перекрыта платкой.

Теперь они выложили веса XTTS в открытый доступ. Что имеем:

* клонирование голоса по 3 секундам (больше-лучше)
* генерация клонированным голосом на по тексту разных языках
* качество в 24khz

Camenduru уже запилил колаб. Заодно вот модель Wav2Lip для липсинка... Собираем в режиме лего опенсорсный Heygen.

Сайт Coqui
Демо (HF)
Демо (колаб)
Гитхаб
Веса на HF



group-telegram.com/Psy_Eyes/1209
Create:
Last Update:

Есть крутой опенсорсный text-2-speech (TTS) проект Coqui. У них в наличии имеется сайт, на котором много голосовых пресетов, есть настройка скорости произношения, легко клонировать речь и генерить на её основе фразы на разных языках.

Также у них репо на гитхабе Coqui TTS, которое используется разными проектами, как база для работы голосом. Тут есть поддержка Bark для клонирования, предобученные модели на 1100+ языков, Tortoise для быстрого инференса, API, и смешивание голосов. Можно натренить модель на своих данных, если нужно. Однако эта модель по качеству генераций уступает той, что на сайте — XTTS, которая после пробника перекрыта платкой.

Теперь они выложили веса XTTS в открытый доступ. Что имеем:

* клонирование голоса по 3 секундам (больше-лучше)
* генерация клонированным голосом на по тексту разных языках
* качество в 24khz

Camenduru уже запилил колаб. Заодно вот модель Wav2Lip для липсинка... Собираем в режиме лего опенсорсный Heygen.

Сайт Coqui
Демо (HF)
Демо (колаб)
Гитхаб
Веса на HF

BY Psy Eyes


Share with your friend now:
group-telegram.com/Psy_Eyes/1209

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

These administrators had built substantial positions in these scrips prior to the circulation of recommendations and offloaded their positions subsequent to rise in price of these scrips, making significant profits at the expense of unsuspecting investors, Sebi noted. Elsewhere, version 8.6 of Telegram integrates the in-app camera option into the gallery, while a new navigation bar gives quick access to photos, files, location sharing, and more. Sebi said data, emails and other documents are being retrieved from the seized devices and detailed investigation is in progress. As the war in Ukraine rages, the messaging app Telegram has emerged as the go-to place for unfiltered live war updates for both Ukrainian refugees and increasingly isolated Russians alike. "We as Ukrainians believe that the truth is on our side, whether it's truth that you're proclaiming about the war and everything else, why would you want to hide it?," he said.
from id


Telegram Psy Eyes
FROM American