group-telegram.com/nn_for_science/1034
Last Update:
An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion
Ребята из Тель Авивского Университета интересно подошли к проблеме генерации картинок из текста.
Они решили поставить задачу следующим образом: как мы можем использовать модели, управляемые языком, чтобы превратить кошку в картину или представить новый продукт на основе нашей любимой игрушки?
Используя всего 3-5 изображений какой-нибудь концепции, например, объекта или стиля, они научились представлять эту концепцию с помощью новых "слов" в пространстве эмбедингов замороженной модели "текст-изображение". Эти "слова" могут быть составлены в предложения на естественном языке.
Работа основана на общедоступных латентных диффузионных моделях.
На сайте проекта ещё несколько прикольных примеров такой генерации, а ещё понятное и подробнее описание принципов работы модели.
📖 Статья 🤖 Код (обещают soon)
BY AI для Всех
Share with your friend now:
group-telegram.com/nn_for_science/1034