Telegram Group & Telegram Channel
Картинки! (лучше открыть статью и листать там в конце)

Как читать каждую строчку:
— первые 3 изображения: это генерации без поиска (брали первый попавшийся случайный шум), с увеличивающимся количеством шагов
— вторые 3 изображения: лучшее (согласно верификаторам) изображение с применением масштабирования поиска на инференсе

Как видно по первой картинке, метод работает для разных моделей, и не требует никакой тренировки (если верификатор уже есть) — просто нужно больше генераций.

На второй и третьей картинах разница между третьим изображением (30 шагов) и пятым (960) по вычислениям — в 32 раза. А с шестым в 96.

На последней — такая же, но шагов другое количество (28 и 896/2688).

====

Что значит на практике:
— скоро во многих сервисах ожидаю появления VIP-версии генераций, которые стоят дороже. Скорее всего какой-то вариант первого способа масштабирования уже есть сейчас (сгенерируй K и выбери 1-2 лучших), но тут предлагается ещё 3 способа, которые легко запрограммировать
— вероятно, рост в цене будет не в 30-90 раз (хотя для профессиональных моделей вполне), так как есть интересная статья про LLM, где показывается, что сделать больше генераций дешёвыми и маленькими моделями — лучше, чем меньше генераций большими и дорогими
— такой подход применим и для видео, где стоимость контента может быть существенно выше. Интересно будет увидеть такую услугу за $100-200 за минуту качественного видео в 2025м.
— тренировать классифиактор/ранжировщик, который выбирает лучшие картинки из набора (или не обязательно картинки, ведь можно делать оценку шума прямо в середине процесса генерации) — очень важно, ждем а) моделей б) статей

Критика статьи:
— авторы везде замеряли автоматические метрики, и (иногда) их же и оптимизировали, так что не удивителен рост. Жаль, что нет хотя бы одного замера Эло-рейтинга на реальных людях :(



group-telegram.com/seeallochnaya/2222
Create:
Last Update:

Картинки! (лучше открыть статью и листать там в конце)

Как читать каждую строчку:
— первые 3 изображения: это генерации без поиска (брали первый попавшийся случайный шум), с увеличивающимся количеством шагов
— вторые 3 изображения: лучшее (согласно верификаторам) изображение с применением масштабирования поиска на инференсе

Как видно по первой картинке, метод работает для разных моделей, и не требует никакой тренировки (если верификатор уже есть) — просто нужно больше генераций.

На второй и третьей картинах разница между третьим изображением (30 шагов) и пятым (960) по вычислениям — в 32 раза. А с шестым в 96.

На последней — такая же, но шагов другое количество (28 и 896/2688).

====

Что значит на практике:
— скоро во многих сервисах ожидаю появления VIP-версии генераций, которые стоят дороже. Скорее всего какой-то вариант первого способа масштабирования уже есть сейчас (сгенерируй K и выбери 1-2 лучших), но тут предлагается ещё 3 способа, которые легко запрограммировать
— вероятно, рост в цене будет не в 30-90 раз (хотя для профессиональных моделей вполне), так как есть интересная статья про LLM, где показывается, что сделать больше генераций дешёвыми и маленькими моделями — лучше, чем меньше генераций большими и дорогими
— такой подход применим и для видео, где стоимость контента может быть существенно выше. Интересно будет увидеть такую услугу за $100-200 за минуту качественного видео в 2025м.
— тренировать классифиактор/ранжировщик, который выбирает лучшие картинки из набора (или не обязательно картинки, ведь можно делать оценку шума прямо в середине процесса генерации) — очень важно, ждем а) моделей б) статей

Критика статьи:
— авторы везде замеряли автоматические метрики, и (иногда) их же и оптимизировали, так что не удивителен рост. Жаль, что нет хотя бы одного замера Эло-рейтинга на реальных людях :(

BY Сиолошная







Share with your friend now:
group-telegram.com/seeallochnaya/2222

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Telegram does offer end-to-end encrypted communications through Secret Chats, but this is not the default setting. Standard conversations use the MTProto method, enabling server-client encryption but with them stored on the server for ease-of-access. This makes using Telegram across multiple devices simple, but also means that the regular Telegram chats you’re having with folks are not as secure as you may believe. What distinguishes the app from competitors is its use of what's known as channels: Public or private feeds of photos and videos that can be set up by one person or an organization. The channels have become popular with on-the-ground journalists, aid workers and Ukrainian President Volodymyr Zelenskyy, who broadcasts on a Telegram channel. The channels can be followed by an unlimited number of people. Unlike Facebook, Twitter and other popular social networks, there is no advertising on Telegram and the flow of information is not driven by an algorithm. One thing that Telegram now offers to all users is the ability to “disappear” messages or set remote deletion deadlines. That enables users to have much more control over how long people can access what you’re sending them. Given that Russian law enforcement officials are reportedly (via Insider) stopping people in the street and demanding to read their text messages, this could be vital to protect individuals from reprisals. The last couple days have exemplified that uncertainty. On Thursday, news emerged that talks in Turkey between the Russia and Ukraine yielded no positive result. But on Friday, Reuters reported that Russian President Vladimir Putin said there had been some “positive shifts” in talks between the two sides. In addition, Telegram's architecture limits the ability to slow the spread of false information: the lack of a central public feed, and the fact that comments are easily disabled in channels, reduce the space for public pushback.
from no


Telegram Сиолошная
FROM American