Telegram Group & Telegram Channel
Картинки! (лучше открыть статью и листать там в конце)

Как читать каждую строчку:
— первые 3 изображения: это генерации без поиска (брали первый попавшийся случайный шум), с увеличивающимся количеством шагов
— вторые 3 изображения: лучшее (согласно верификаторам) изображение с применением масштабирования поиска на инференсе

Как видно по первой картинке, метод работает для разных моделей, и не требует никакой тренировки (если верификатор уже есть) — просто нужно больше генераций.

На второй и третьей картинах разница между третьим изображением (30 шагов) и пятым (960) по вычислениям — в 32 раза. А с шестым в 96.

На последней — такая же, но шагов другое количество (28 и 896/2688).

====

Что значит на практике:
— скоро во многих сервисах ожидаю появления VIP-версии генераций, которые стоят дороже. Скорее всего какой-то вариант первого способа масштабирования уже есть сейчас (сгенерируй K и выбери 1-2 лучших), но тут предлагается ещё 3 способа, которые легко запрограммировать
— вероятно, рост в цене будет не в 30-90 раз (хотя для профессиональных моделей вполне), так как есть интересная статья про LLM, где показывается, что сделать больше генераций дешёвыми и маленькими моделями — лучше, чем меньше генераций большими и дорогими
— такой подход применим и для видео, где стоимость контента может быть существенно выше. Интересно будет увидеть такую услугу за $100-200 за минуту качественного видео в 2025м.
— тренировать классифиактор/ранжировщик, который выбирает лучшие картинки из набора (или не обязательно картинки, ведь можно делать оценку шума прямо в середине процесса генерации) — очень важно, ждем а) моделей б) статей

Критика статьи:
— авторы везде замеряли автоматические метрики, и (иногда) их же и оптимизировали, так что не удивителен рост. Жаль, что нет хотя бы одного замера Эло-рейтинга на реальных людях :(



group-telegram.com/seeallochnaya/2222
Create:
Last Update:

Картинки! (лучше открыть статью и листать там в конце)

Как читать каждую строчку:
— первые 3 изображения: это генерации без поиска (брали первый попавшийся случайный шум), с увеличивающимся количеством шагов
— вторые 3 изображения: лучшее (согласно верификаторам) изображение с применением масштабирования поиска на инференсе

Как видно по первой картинке, метод работает для разных моделей, и не требует никакой тренировки (если верификатор уже есть) — просто нужно больше генераций.

На второй и третьей картинах разница между третьим изображением (30 шагов) и пятым (960) по вычислениям — в 32 раза. А с шестым в 96.

На последней — такая же, но шагов другое количество (28 и 896/2688).

====

Что значит на практике:
— скоро во многих сервисах ожидаю появления VIP-версии генераций, которые стоят дороже. Скорее всего какой-то вариант первого способа масштабирования уже есть сейчас (сгенерируй K и выбери 1-2 лучших), но тут предлагается ещё 3 способа, которые легко запрограммировать
— вероятно, рост в цене будет не в 30-90 раз (хотя для профессиональных моделей вполне), так как есть интересная статья про LLM, где показывается, что сделать больше генераций дешёвыми и маленькими моделями — лучше, чем меньше генераций большими и дорогими
— такой подход применим и для видео, где стоимость контента может быть существенно выше. Интересно будет увидеть такую услугу за $100-200 за минуту качественного видео в 2025м.
— тренировать классифиактор/ранжировщик, который выбирает лучшие картинки из набора (или не обязательно картинки, ведь можно делать оценку шума прямо в середине процесса генерации) — очень важно, ждем а) моделей б) статей

Критика статьи:
— авторы везде замеряли автоматические метрики, и (иногда) их же и оптимизировали, так что не удивителен рост. Жаль, что нет хотя бы одного замера Эло-рейтинга на реальных людях :(

BY Сиолошная







Share with your friend now:
group-telegram.com/seeallochnaya/2222

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"The argument from Telegram is, 'You should trust us because we tell you that we're trustworthy,'" Maréchal said. "It's really in the eye of the beholder whether that's something you want to buy into." Friday’s performance was part of a larger shift. For the week, the Dow, S&P 500 and Nasdaq fell 2%, 2.9%, and 3.5%, respectively. The gold standard of encryption, known as end-to-end encryption, where only the sender and person who receives the message are able to see it, is available on Telegram only when the Secret Chat function is enabled. Voice and video calls are also completely encrypted. Stocks dropped on Friday afternoon, as gains made earlier in the day on hopes for diplomatic progress between Russia and Ukraine turned to losses. Technology stocks were hit particularly hard by higher bond yields. Telegram does offer end-to-end encrypted communications through Secret Chats, but this is not the default setting. Standard conversations use the MTProto method, enabling server-client encryption but with them stored on the server for ease-of-access. This makes using Telegram across multiple devices simple, but also means that the regular Telegram chats you’re having with folks are not as secure as you may believe.
from es


Telegram Сиолошная
FROM American