Не задумывались, почему у нас до сих пор роботы такие тупые неумелые? Дело в том что, универсальный робот-помощник по дому или, например, робот-доставщик должен уметь выполнять целый набор разных задач в реальном мире. А текущие Reinforcement Learning (RL) методы зачастую могут эффективно обучить робота делать только одну задачу, и даже это требует дофига времени и ресурсов. Как вы, наверное, знаете, в мире RL до сих пор нет устоявшегося подхода предобучения на большом датасете (как, например ImageNet) и быстрого дообучения на конкретных задачах.
Поэтому, ученые из отдела робототехники в Google придумали, как тренироваться на предзаписанных данных (offline Reinforcement Learning) собранных разными роботами, выполнявшими различные задачи, так чтобы потом легко обучить многозадачного агента, и который бы мог легко дообучиться для новой задачи.
Не задумывались, почему у нас до сих пор роботы такие тупые неумелые? Дело в том что, универсальный робот-помощник по дому или, например, робот-доставщик должен уметь выполнять целый набор разных задач в реальном мире. А текущие Reinforcement Learning (RL) методы зачастую могут эффективно обучить робота делать только одну задачу, и даже это требует дофига времени и ресурсов. Как вы, наверное, знаете, в мире RL до сих пор нет устоявшегося подхода предобучения на большом датасете (как, например ImageNet) и быстрого дообучения на конкретных задачах.
Поэтому, ученые из отдела робототехники в Google придумали, как тренироваться на предзаписанных данных (offline Reinforcement Learning) собранных разными роботами, выполнявшими различные задачи, так чтобы потом легко обучить многозадачного агента, и который бы мог легко дообучиться для новой задачи.
Продолжение ниже ↓
BY эйай ньюз
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
That hurt tech stocks. For the past few weeks, the 10-year yield has traded between 1.72% and 2%, as traders moved into the bond for safety when Russia headlines were ugly—and out of it when headlines improved. Now, the yield is touching its pandemic-era high. If the yield breaks above that level, that could signal that it’s on a sustainable path higher. Higher long-dated bond yields make future profits less valuable—and many tech companies are valued on the basis of profits forecast for many years in the future. Official government accounts have also spread fake fact checks. An official Twitter account for the Russia diplomatic mission in Geneva shared a fake debunking video claiming without evidence that "Western and Ukrainian media are creating thousands of fake news on Russia every day." The video, which has amassed almost 30,000 views, offered a "how-to" spot misinformation. What distinguishes the app from competitors is its use of what's known as channels: Public or private feeds of photos and videos that can be set up by one person or an organization. The channels have become popular with on-the-ground journalists, aid workers and Ukrainian President Volodymyr Zelenskyy, who broadcasts on a Telegram channel. The channels can be followed by an unlimited number of people. Unlike Facebook, Twitter and other popular social networks, there is no advertising on Telegram and the flow of information is not driven by an algorithm. Some privacy experts say Telegram is not secure enough In the United States, Telegram's lower public profile has helped it mostly avoid high level scrutiny from Congress, but it has not gone unnoticed.
from tw