Telegram Group Search
Please open Telegram to view this post
VIEW IN TELEGRAM
#ml

Я на досуге немного поковырялся с оптимизацией 3-D укладки коробок. И решил наработки в open-source выложить, вдруг кому-то будет интересно поиграться с решением.

Сразу предупреждаю, в основном код написан Claude (мой вклад в рост энтропии интернета), но направлял его все-таки я сам (и местами подправлял код).

Что в итоге есть в решении:
- 5 алгоритмов упаковки (Weight-Aware, Extreme Points, LAFF, Corner Points, SFC)
- Проверка физических ограничений и поддержки
- 3D визуализация результатов в реальном времени (на картинке как раз она)
- Расчет эффективности использования пространства
- Анализ распределения веса
- Интерактивный веб-интерфейс на Streamlit
- Загрузка пользовательских коробок и выгрузка результатов

В общем, смотрите, ставьте звездочки и не ругайстесь, коли что не так)
#random

Год движется к своему завершению. Пора, полагаю, подвести итоги:
1. Дочка пошла в детский сад;
2. Канал подрос на ~200 человек (спасибо всем тем, кто меня читает!);
3. На работе очень плотно прошел год. Выступал, заставлял выступать других, писал материалы, ездил на конференции, преподавал. И даже немного успел поработать в процессе.
+ Посчитал количество внешних выступлений по нашему направлению. Вышло почти 1 раз в две недели (чуть реже, но близко);
4. Я наконец-то закончил курс по сценарному мастерству (осталось еще два, лол);
5. В первый раз выступил со стендапом. И еще попробовал себе в roast battle формате;
6. Написал приличное количество рассказов (просто так и для конкурсов), сценарий комикса (для конкурса), сценарий короткометражки. Напечатался в трех местах (правда, одна из публикаций - это стихи);
7. Прошел еще немного курсов по писательскому мастерству. Было про остросюжетную прозу, про стендап, сейчас начался курс про пьесы;
8. Остался жив и даже в своем уме. Что уже немало ;)
Думал поменять аватарку на что-то новое. Какой вариант вам нравится больше?
Какую аватарку взять? Нумерация по картинкам выше (слева-направо, сверху-вниз)

Котик 1 - 4
👍👍 4%
Котик 2 - 7
👍👍 8%
Котик 3 - 2
👍 2%
Котик 4 - 13
👍👍👍 14%
Котик 5 - 7
👍👍 8%
Котик 6 - 13
👍👍👍 14%
Оставь старого кота! - 47
👍👍👍👍👍👍👍👍 51%
👥 93 человека уже проголосовало.
#audio

Коль у нас новый год, держите небольшую прохладную историю про взлом Жепы Алисы (ну как взлом, просто эксперимент с обходом детского режима).

В прошлом году (несколько дней назад), когда салаты еще нарезались, а не доедались, мы с сыном друзей (Ярослав, привет!) от нечего делать (и от праведного гнева Ярослава из-за того, что Алиса не дает детям слушать Linkin Park) решили попробовать обойти детский режим.

Идея была простой. Вероятно, там стоит классификатор голоса (ребенок/взрослый). А это значит, что нужно понять, что определяет "детский" голос. Логичным предположением был тембр и высота голоса. Поэтому наш военный совет выбрал основной целью атаки изменение голоса.

Качать приложение для изменения голоса мне было лень. Потому быстро была сделана проверка концепции в виде озвучки текста голосом рандомного персонажа в silero. Но, увы, разработчики сделали так, что воспроизведение с устройства Алису не триггерит.

Потому пришлось искать обходные пути. К счастью, мы быстро придумали обходной путь в виде первого обращения к Алисе человеком и последующего запуска синтетического голоса для запроса. Но, увы, и здесь нас ждала засада. Модель не хотела воспринимать запись за взрослого.

Мы уже было отчаялись. Но оставалась еще одна идея. А что, если мы попробуем разные голоса (мало ли, вдруг там есть что-то для их разделения или оценки их естественности)? Наш маневр оказался успешным, враг в лице Алисы не заметил наших гусар у себя в тылу.

"Нашими гусарами" оказался синтетический голос гугл-переводчика. То есть, итоговый рецепт победы получился такой: обращение к Алисе детским голосом (чтобы активировать считывание) + остальной текст, озвученный гугл-переводчиком.

Впрочем, я думаю, что это когда-то поправят. А может быть нам просто повезло (еще я буду тратить больге времени на более разнообразные эксперименты, свое эго я уже почесал, хехе). Ну и, конечно же, это все в ознакомительных целях. Дети, не слушайте глупых взрослых (вроде меня), детский режим спасает вас от внезапного столкновения со взрослой реальностью (и потенциальным выходом на работу, чего стоит избегать всеми детскими силами).

В итоге, данный рецепт позволил запустить столь желанный Liknin Park. И мы, довольные стратегическим гением уровня Сунь-Цзы, весело выдвинулись в новый 2025 год. Следующей нашей целью было оперативное опустошение запасов салатов. Но это уже другая история...

P.S. Результаты прошлого голосования я увидел. Старый кот остается! (люблю демократию, ведь мне буквально ничего не нужно делать по итогам голосования)
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Вот вам пример видеогенерации, от которого у меня немного закипел мозг.

Мы тут извращаемся в промптах, пытаясь заставить двигаться камеру или персонажа.
Но.
Оказывается, можно попросить ИИ добавить на видео гринскрин (этим я вас не удивлю) и, внимание, маркеры для трекинга камеры (а вот этим удивлю). Для того, чтобы потом оттрекать камеру в AE или Нюке, восстановить движение объектов в 3Д, убрать фон и навалить сверху нормальной графики или футажа.
В общем все, как на съемках с парой супервазеров, мешком маркеров, тейпов, рулеток, далее по списку. Только промптом!

И судя по этому примеру у Veo2 (пока крайней мере у него, но думаю и у остальных) в голове есть реальная модель 3Д мира и вполне себе эвклидово пространство, ибо это работает и условная фотограмметрия не ломается.

Я в шоке. А вы не поленитесь, почитайте нехилый такой промпт, где написано про маркеры, гринскрин и прочую супервайзерскую требуху (тут есть момент, чтобы писать такой промпт, надо как бы быть в супервайзерской теме, но об этом в другой раз).

Я уж не знаю, на чему учили Veo2, но то, что это вообще работает, приводит меня в восторг.

Подробности тут.

Кто совсем ничего не понял: здесь только девушка (см. промпт). Среднее видео демонстрирует добавление созданной человеком модели (андроид, G) в сцену, созданную ИИ, а нижнее - объединение созданного ИИ персонажа (девушки) в созданную человеком сцену (сакура и небесное пространство). В обоих случаях необходимы данные с камеры, полученные в результате работы ИИ.

Попробуйте в Клинге что ли...

@cgevent
Lovecraft goes brrr

P.S. Лавкрафта читать люблю, оттого шутка даже смешнее.
Forwarded from CodeCamp
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AI для Всех (Artemii)
🌪️ WeatherNext: AI революция в прогнозировании погоды продолжается!

Друзья, помните мы обсуждали GenCast? Эта работа получила практическое продолжение. Google DeepMind и Google Research представили - WeatherNext, новое семейство AI-моделей, которое предсказывают погоду лучше, чем все остальные существующие методы!

Самое главное - прогнозы уже доступны

🌍 Главный вызов, с которым столкнулись разработчики:
Погодные системы невероятно хаотичны и даже малейшая неточность в измерениях может привести к серьезным ошибкам в прогнозе (и это не говоря об эффекте бабочки). Но команда AI инженеров нашла решение!

📊 WeatherNext предлагает два мощных инструмента:

WeatherNext Graph:
- Создает один сверхточный прогноз
- Обновляется каждые 6 часов
- Прогнозирует на 10 дней вперед
- Идеален для задач, где нужна максимальная определенность

WeatherNext Gen:
- Генерирует ансамбль из 50 возможных сценариев
- Обновляется каждые 12 часов
- Заглядывает на 15 дней вперед
- Незаменим для отслеживания циклонов и экстремальных явлений

⚡️ Преимущества перед традиционными методами:
- Гораздо выше скорость обработки данных
- Значительно точнее физических моделей

🚀 Доступ к технологии:
Google открыл WeatherNext через Google Cloud - прогнозы обновляются 4 раза в день, плюс доступны исторические данные для исследований и анализа.

Это не просто очередное технологическое достижение - это инструмент, который поможет сотням исследователей -> помочь тысячам инженеров -> помочь миллиардам людей лучше подготовиться к капризам погоды и сделать наш мир немного безопаснее! 🌏

Доступ к прогнозам тут
Почитать подробнее
2025/02/04 03:06:08
Back to Top
HTML Embed Code: