Telegram Group & Telegram Channel
Forwarded from Nikita Trifonov
1е место public LB
Мое решение - стэкинг, где на первом уровне обычная модель, на втором уровне - модель, которая улучшает предсказания первой, эксплуатируя лик
Модель первого уровня - coverhunter (https://arxiv.org/pdf/2306.09025v1 , код модели из https://github.com/alanngnet/CoverHunterMPS с минорными твиками). Вместо лоссов из статьи использовал аркфейс с margin, зависящей от кол-ва примеров класса. Реализовал аугментации из статьи - XYMasking, сдвиг спектрограммы по вертикали, изменение скорости, изменение громкости. Модель первого уровня довел примерно до 0.608 public LB

Суть лика - айдишники в test_ids.npy не зашафлены, треки, которые являются каверами друг друга, идут непосредственно друг за другом. Это легко увидеть, если посчитать эмбеддинги моделью первого уровня для первой тысячи треков из test_ids.npy и построить матрицу попарных расстояний между ними (см. картинку). То есть взаимное расположение айдишников в test_ids.npy - важная фича, если треки следуют непосредственно друг за другом, они скорее всего являются кавером, а если между ними 2000 других айдишников - точно нет. Заэксплуатиривоть это можно разными способами, например CatBoostRanker на двух фичах - расстояние между эмбеддингами и расстояние между айдишниками - давал порядка 0.98 public LB. Я ожидал, что больше людей найдет лик, поэтому оверкиллил эту часть: обучал u-net, которому на вход подается матрица попарных расстояний, а выход трактуем как матрицу скоров (одна строка - один трек, для которого нужно найти каверы, а сами значения в строке - это скоры треков, находящихся слева и справа от данного в списке айдишников). Использовал лосс для задачи ранжирования из pytorchltr; реализовал маскирование, чтобы учитывать для каждого трека ровно по 100 соседей слева и справа из списка айдишников; аугментацию для трейна за счет шаффлинга порядка клик и порядка треков внутри клик.



group-telegram.com/abacabadabacaba404/68
Create:
Last Update:

1е место public LB
Мое решение - стэкинг, где на первом уровне обычная модель, на втором уровне - модель, которая улучшает предсказания первой, эксплуатируя лик
Модель первого уровня - coverhunter (https://arxiv.org/pdf/2306.09025v1 , код модели из https://github.com/alanngnet/CoverHunterMPS с минорными твиками). Вместо лоссов из статьи использовал аркфейс с margin, зависящей от кол-ва примеров класса. Реализовал аугментации из статьи - XYMasking, сдвиг спектрограммы по вертикали, изменение скорости, изменение громкости. Модель первого уровня довел примерно до 0.608 public LB

Суть лика - айдишники в test_ids.npy не зашафлены, треки, которые являются каверами друг друга, идут непосредственно друг за другом. Это легко увидеть, если посчитать эмбеддинги моделью первого уровня для первой тысячи треков из test_ids.npy и построить матрицу попарных расстояний между ними (см. картинку). То есть взаимное расположение айдишников в test_ids.npy - важная фича, если треки следуют непосредственно друг за другом, они скорее всего являются кавером, а если между ними 2000 других айдишников - точно нет. Заэксплуатиривоть это можно разными способами, например CatBoostRanker на двух фичах - расстояние между эмбеддингами и расстояние между айдишниками - давал порядка 0.98 public LB. Я ожидал, что больше людей найдет лик, поэтому оверкиллил эту часть: обучал u-net, которому на вход подается матрица попарных расстояний, а выход трактуем как матрицу скоров (одна строка - один трек, для которого нужно найти каверы, а сами значения в строке - это скоры треков, находящихся слева и справа от данного в списке айдишников). Использовал лосс для задачи ранжирования из pytorchltr; реализовал маскирование, чтобы учитывать для каждого трека ровно по 100 соседей слева и справа из списка айдишников; аугментацию для трейна за счет шаффлинга порядка клик и порядка треков внутри клик.

BY adapt compete evolve or die


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/abacabadabacaba404/68

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Stocks dropped on Friday afternoon, as gains made earlier in the day on hopes for diplomatic progress between Russia and Ukraine turned to losses. Technology stocks were hit particularly hard by higher bond yields. Sebi said data, emails and other documents are being retrieved from the seized devices and detailed investigation is in progress. These entities are reportedly operating nine Telegram channels with more than five million subscribers to whom they were making recommendations on selected listed scrips. Such recommendations induced the investors to deal in the said scrips, thereby creating artificial volume and price rise. A Russian Telegram channel with over 700,000 followers is spreading disinformation about Russia's invasion of Ukraine under the guise of providing "objective information" and fact-checking fake news. Its influence extends beyond the platform, with major Russian publications, government officials, and journalists citing the page's posts. The S&P 500 fell 1.3% to 4,204.36, and the Dow Jones Industrial Average was down 0.7% to 32,943.33. The Dow posted a fifth straight weekly loss — its longest losing streak since 2019. The Nasdaq Composite tumbled 2.2% to 12,843.81. Though all three indexes opened in the green, stocks took a turn after a new report showed U.S. consumer sentiment deteriorated more than expected in early March as consumers' inflation expectations soared to the highest since 1981.
from jp


Telegram adapt compete evolve or die
FROM American