кстати, не обязательно строго повторять существующие рендеры, можно немного отпустить ControlNet и получать варианты
This media is not supported in your browser
VIEW IN TELEGRAM
Опубликовал модель, качать тут:
https://civitai.com/models/1401415
, а здесь пример workflow:
https://civitai.com/models/1401477
#comfyui
https://civitai.com/models/1401415
, а здесь пример workflow:
https://civitai.com/models/1401477
#comfyui
Наконец добрался до того, чтобы протестировать новые функции ChatGPT по работе с изображениями (если вы проспали последнюю неделю, то там теперь можно словами редактировать и создавать практически любые картинки), и выглядит всё это очень круто. Но давайте копать глубже, и смотреть, какие есть недостатки. Сравнивать буду с #comfyui на двух примерах:
1. Зимний рендер
2. Заполнение пустого интерьера мебелью
1. Зимний рендер
2. Заполнение пустого интерьера мебелью
первая картинка - оригинальный рендер с 3D модели в Blender
вторая картинка - ChatGPT
третья - SDXL в ComfyUI
очевидно, что ChatGPT гораздо реалистичней, это и понятно, все-таки конкуренту (SDXL) уже кажется больше двух лет.
если же говорить об очевидных недостатках, то ChatGPT пока очень медленный, генерация занимает минут 5-10, тогда как SDXL справляется с работой за секунды.
вторая картинка - ChatGPT
третья - SDXL в ComfyUI
очевидно, что ChatGPT гораздо реалистичней, это и понятно, все-таки конкуренту (SDXL) уже кажется больше двух лет.
если же говорить об очевидных недостатках, то ChatGPT пока очень медленный, генерация занимает минут 5-10, тогда как SDXL справляется с работой за секунды.
This media is not supported in your browser
VIEW IN TELEGRAM
Но если присмотреться, то можно увидеть еще один косяк, ChatGPT меняет пропорции изображения - там нет никакого ControlNet и потому для него тяжело сохранить всё ровно так, как на исходнике, а это важно, так как детали в любом случае во многих местах некорректные, и их надо стереть в Photoshop, чтобы просветить оригинал и его чуть подогнать по цветам и яркости, и этого с картинкой от ChatGPT сделать не получится. Из-за чего как будто вообще пропадает смысл пользоваться моделью для именно таких задач.
второй пример, берём 4 картинки, пустой интерьер, стол, ковер и диван, и всё это дело совмещаем в одну композицию
изображение 1: результат работы ChatGPT
изображение 2: Flux Redux в ComfyUI
изображение 2: Flux Redux в ComfyUI
This media is not supported in your browser
VIEW IN TELEGRAM
В этом случае у ChatGPT большой плюс в том, что workflow крайне простое, закидываете всё вместе и говорите, что делать. Но та же проблема, исходное помещение меняется в деталях и пропорциях. Я бы не сказал, что для этой задачи такие изменения критичны, например, если мы хотим на начальном этапе проекта просто прикинуть, как будет выглядеть интерьер, то представление об этом ChatGPT даёт.
И да, с некоторыми сложными предметами не справляется пока никакая модель, ковёр другой и там, и там, но GPT поближе к оригиналу. Также GPT лучше подгоняет освещение в сцене.
И да, с некоторыми сложными предметами не справляется пока никакая модель, ковёр другой и там, и там, но GPT поближе к оригиналу. Также GPT лучше подгоняет освещение в сцене.
This media is not supported in your browser
VIEW IN TELEGRAM
в #comfyui пропорции интерьера и его оригинальные детали, понятное дело, на месте. Но тут уже по скорости преимущества нет, так как вставлять предметы надо по очереди, а не разом как в ChatGPT, и каждый раз ждать рендер. Кроме того, такой workflow можно собрать только на Flux, а он не быстрый сам по себе.
В интернете сейчас очень много постов в стиле "Photoshop мёртв" - теперь можно редактировать картинки и даже видео в LLM (пока Gemini и ChatGPT, но и остальные подтянутся). Тут история в том, что даже если точность поправят в будущем, то ввод команд с помощью текста или голоса ни для какого сложного редактирования не подойдёт. Собственно и люди в офисе таким образом между собой не общаются: чтобы что-то нормально объяснить нужны эскизы, маски, пометки... короче условный функционал фотошопа, иначе никто не поймет задачи, ни человек, ни AI (даже если последний будет умнее человека, тут проблема не в интеллекте, а в том, что не всё можно сформулировать словами за разумное время). Так что AI модели мало, нужен графический интерфейс, то есть AI внутри аналогов Photoshop, Revit, Rhino и всего остального.
Но, в целом, конечно круто, у меня еще есть несколько идей на тему того, что можно сделать с этими новым ChatGPT
Но, в целом, конечно круто, у меня еще есть несколько идей на тему того, что можно сделать с этими новым ChatGPT