group-telegram.com/ai_newz/401
Last Update:
Не задумывались, почему у нас до сих пор роботы такие тупые неумелые? Дело в том что, универсальный робот-помощник по дому или, например, робот-доставщик должен уметь выполнять целый набор разных задач в реальном мире. А текущие Reinforcement Learning (RL) методы зачастую могут эффективно обучить робота делать только одну задачу, и даже это требует дофига времени и ресурсов.
Как вы, наверное, знаете, в мире RL до сих пор нет устоявшегося подхода предобучения на большом датасете (как, например ImageNet) и быстрого дообучения на конкретных задачах.
Поэтому, ученые из отдела робототехники в Google придумали, как тренироваться на предзаписанных данных (offline Reinforcement Learning) собранных разными роботами, выполнявшими различные задачи, так чтобы потом легко обучить многозадачного агента, и который бы мог легко дообучиться для новой задачи.
Продолжение ниже ↓
BY эйай ньюз
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
Share with your friend now:
group-telegram.com/ai_newz/401