Telegram Group & Telegram Channel
# Поиск работы: разбор тестового задания Planetfarms

Дано видео на пол минуты с камеры на капоте радиоуправляемой машинки. Нужно следить за машинкой, которая едет впереди. Координаты этой машинки на первом кадре даны. Видео непростое: камера прыгает, цель пропадает из кадра, вылезает много объектов включая вторую идентичную машинку. Для выполнения надо использовать предобученную модель детекции, Faster-RCNN. Нельзя ничего обучать. Было указано, что задание примерно на пару часов.

Посмотрел видео. Было не очень понятно, сколько на нем нужно трекать эту машинку, поэтому я решил делать, пока не получится отслеживать в течение всего видео.

Я не работал с детекцией, поэтому полез изучать, кто такой Faster-RCNN. Разобравшись попробовал запустить на паре кадров. Сеть принимает на вход изображение, а выдает кучу ббоксов (bounding box, прямоугольники вокруг объектов) для найденных объектов, а так же вероятности, что объект относится к одному из 1000 классов Imagenet. Окей, но надо обрабатывать не изображения, а видео. Пришлось работать с видео как с последовательностью изображений.

Начальная позиция машинки дана, так что ближайший к ней ббокс и нужно трекать. Главная проблема вот в сопоставлении. Есть куча ббоксов на фрейме 1, куча ббоксов на фрейме 2. Нужно определить, какие пары относятся к одним и тем же сущностям.

Очевидно, что два ближайших ббокса это один объект. Близость определяем по евклидовому расстоянию между центрами. Погуглил и оказалось, что я изобрел centroid tracker. Сразу вылезла тонна проблем. Например: машинка подъезжает близко, а потом резко отъезжает. Трекинг "перескакивает" на капот машины с камерой и успешно следит за ним до конца видео. Или машинка подпрыгивает на кочке и трекинг переключается на какое-нибудь дерево. Или когда две машинки подъезжают слишком близко и трекинг "перепрыгивает" на вторую. Наконец, непонятно что делать, когда машинка совсем пропадает из кадра.

Сначала я потюнил параметры модели и подобрал порог отсева ббоксов по вероятностям. Далее отсеял лишние ббоксы грубыми эвристиками. На видео дорога всегда в маленьком прямоугольнике в центре кадра. Обрезал все ббоксы, которые в него не попадают. Отфильтровал все слишком вытянутые в ширину или высоту ббоксы, потому что мы знаем, что машинка такой не бывает. Стало лучше.

Далее изменил метрику расстояния. Надо было учесть, что если ббокс t1 по форме похож на t2, то более вероятно, что это ббоксы одной сущности. Поэтому я стал считать расстояние между векторами из координат верхнего левого и нижнего правого углов, вида (x1, y1, x2, y2). Это учитывает форму ббоксов, расстояние между похожими меньше. Немного помогло.



group-telegram.com/boris_again/1208
Create:
Last Update:

# Поиск работы: разбор тестового задания Planetfarms

Дано видео на пол минуты с камеры на капоте радиоуправляемой машинки. Нужно следить за машинкой, которая едет впереди. Координаты этой машинки на первом кадре даны. Видео непростое: камера прыгает, цель пропадает из кадра, вылезает много объектов включая вторую идентичную машинку. Для выполнения надо использовать предобученную модель детекции, Faster-RCNN. Нельзя ничего обучать. Было указано, что задание примерно на пару часов.

Посмотрел видео. Было не очень понятно, сколько на нем нужно трекать эту машинку, поэтому я решил делать, пока не получится отслеживать в течение всего видео.

Я не работал с детекцией, поэтому полез изучать, кто такой Faster-RCNN. Разобравшись попробовал запустить на паре кадров. Сеть принимает на вход изображение, а выдает кучу ббоксов (bounding box, прямоугольники вокруг объектов) для найденных объектов, а так же вероятности, что объект относится к одному из 1000 классов Imagenet. Окей, но надо обрабатывать не изображения, а видео. Пришлось работать с видео как с последовательностью изображений.

Начальная позиция машинки дана, так что ближайший к ней ббокс и нужно трекать. Главная проблема вот в сопоставлении. Есть куча ббоксов на фрейме 1, куча ббоксов на фрейме 2. Нужно определить, какие пары относятся к одним и тем же сущностям.

Очевидно, что два ближайших ббокса это один объект. Близость определяем по евклидовому расстоянию между центрами. Погуглил и оказалось, что я изобрел centroid tracker. Сразу вылезла тонна проблем. Например: машинка подъезжает близко, а потом резко отъезжает. Трекинг "перескакивает" на капот машины с камерой и успешно следит за ним до конца видео. Или машинка подпрыгивает на кочке и трекинг переключается на какое-нибудь дерево. Или когда две машинки подъезжают слишком близко и трекинг "перепрыгивает" на вторую. Наконец, непонятно что делать, когда машинка совсем пропадает из кадра.

Сначала я потюнил параметры модели и подобрал порог отсева ббоксов по вероятностям. Далее отсеял лишние ббоксы грубыми эвристиками. На видео дорога всегда в маленьком прямоугольнике в центре кадра. Обрезал все ббоксы, которые в него не попадают. Отфильтровал все слишком вытянутые в ширину или высоту ббоксы, потому что мы знаем, что машинка такой не бывает. Стало лучше.

Далее изменил метрику расстояния. Надо было учесть, что если ббокс t1 по форме похож на t2, то более вероятно, что это ббоксы одной сущности. Поэтому я стал считать расстояние между векторами из координат верхнего левого и нижнего правого углов, вида (x1, y1, x2, y2). Это учитывает форму ббоксов, расстояние между похожими меньше. Немного помогло.

BY Борис опять


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/boris_again/1208

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

In February 2014, the Ukrainian people ousted pro-Russian president Viktor Yanukovych, prompting Russia to invade and annex the Crimean peninsula. By the start of April, Pavel Durov had given his notice, with TechCrunch saying at the time that the CEO had resisted pressure to suppress pages criticizing the Russian government. Telegram was founded in 2013 by two Russian brothers, Nikolai and Pavel Durov. The War on Fakes channel has repeatedly attempted to push conspiracies that footage from Ukraine is somehow being falsified. One post on the channel from February 24 claimed without evidence that a widely viewed photo of a Ukrainian woman injured in an airstrike in the city of Chuhuiv was doctored and that the woman was seen in a different photo days later without injuries. The post, which has over 600,000 views, also baselessly claimed that the woman's blood was actually makeup or grape juice. At its heart, Telegram is little more than a messaging app like WhatsApp or Signal. But it also offers open channels that enable a single user, or a group of users, to communicate with large numbers in a method similar to a Twitter account. This has proven to be both a blessing and a curse for Telegram and its users, since these channels can be used for both good and ill. Right now, as Wired reports, the app is a key way for Ukrainians to receive updates from the government during the invasion. In view of this, the regulator has cautioned investors not to rely on such investment tips / advice received through social media platforms. It has also said investors should exercise utmost caution while taking investment decisions while dealing in the securities market.
from br


Telegram Борис опять
FROM American