This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
OCTAVE (Omni-Capable Text and Voice Engine)
На полянке генерации голосов и вообще голосовых вводов\выводов становится довольно жарко и интересно.
Тут вот Hume AI разродился Октавой.
Это "speech-language model" с интересными фишками типа создания голоса и личности "на лету", генерацию голосов промптами и всяко-разно другое. Мне понравился сербский акцент и бруклинский таксист.
Можно сказать, что это ChatGPT Advanced Voice Mode, Elevenlabs Voice Design и Google NotebookLM в одном флаконе - просматривается некий будущий вижен, а не только голос в чатике.
Поглядите тут, сравнение с LLM тоже интересно:
https://www.hume.ai/blog/introducing-octave
На основе очень короткого аудиофрагмента (~5 с) OCTAVE не только имитирует голос говорящего, но и в значительной степени перенимает его эмоционально.
Аудиофейки на марше..
@cgevent
На полянке генерации голосов и вообще голосовых вводов\выводов становится довольно жарко и интересно.
Тут вот Hume AI разродился Октавой.
Это "speech-language model" с интересными фишками типа создания голоса и личности "на лету", генерацию голосов промптами и всяко-разно другое. Мне понравился сербский акцент и бруклинский таксист.
Можно сказать, что это ChatGPT Advanced Voice Mode, Elevenlabs Voice Design и Google NotebookLM в одном флаконе - просматривается некий будущий вижен, а не только голос в чатике.
Поглядите тут, сравнение с LLM тоже интересно:
https://www.hume.ai/blog/introducing-octave
На основе очень короткого аудиофрагмента (~5 с) OCTAVE не только имитирует голос говорящего, но и в значительной степени перенимает его эмоционально.
Аудиофейки на марше..
@cgevent
group-telegram.com/cgevent/10706
Create:
Last Update:
Last Update:
OCTAVE (Omni-Capable Text and Voice Engine)
На полянке генерации голосов и вообще голосовых вводов\выводов становится довольно жарко и интересно.
Тут вот Hume AI разродился Октавой.
Это "speech-language model" с интересными фишками типа создания голоса и личности "на лету", генерацию голосов промптами и всяко-разно другое. Мне понравился сербский акцент и бруклинский таксист.
Можно сказать, что это ChatGPT Advanced Voice Mode, Elevenlabs Voice Design и Google NotebookLM в одном флаконе - просматривается некий будущий вижен, а не только голос в чатике.
Поглядите тут, сравнение с LLM тоже интересно:
https://www.hume.ai/blog/introducing-octave
На основе очень короткого аудиофрагмента (~5 с) OCTAVE не только имитирует голос говорящего, но и в значительной степени перенимает его эмоционально.
Аудиофейки на марше..
@cgevent
На полянке генерации голосов и вообще голосовых вводов\выводов становится довольно жарко и интересно.
Тут вот Hume AI разродился Октавой.
Это "speech-language model" с интересными фишками типа создания голоса и личности "на лету", генерацию голосов промптами и всяко-разно другое. Мне понравился сербский акцент и бруклинский таксист.
Можно сказать, что это ChatGPT Advanced Voice Mode, Elevenlabs Voice Design и Google NotebookLM в одном флаконе - просматривается некий будущий вижен, а не только голос в чатике.
Поглядите тут, сравнение с LLM тоже интересно:
https://www.hume.ai/blog/introducing-octave
На основе очень короткого аудиофрагмента (~5 с) OCTAVE не только имитирует голос говорящего, но и в значительной степени перенимает его эмоционально.
Аудиофейки на марше..
@cgevent
BY Метаверсище и ИИще
Share with your friend now:
group-telegram.com/cgevent/10706