Telegram Group Search
📚 Machine learning mastery

🔗 Github

@datascienceiot
Super beginner-friendly book on Linear Algebra

🔗 Book

@datascienceiot
Welcome to Ollama's Prompt Engineering Interactive Tutorial

🔗 Github

@datascienceiot
🖥 www.group-telegram.com/haskell_tg - Haskell входит в число наиболее востребованных функциональных языков программирования.

В нашем новом канале, вы найдете множество уроков, книг и гайдов для погружения в этот мощный язык с нуля.

Отличная возможность не только выучить новый язык, но и возможность прокачать свои навыки программирования.

www.group-telegram.com/haskell_tg - стоит подписаться!
Please open Telegram to view this post
VIEW IN TELEGRAM
Computational Geometry

📕 Book

@datascienceiot
Harvard's "Advanced Complex Analysis"

📓Course

@datascienceiot
Calculus 1 for Honours Mathematics

🔗 Book

@datascienceiot
OpenAI o1 System Card

🔗 System Card

@datascienceiot
Справочник по науке о данных Python

📕 Github

@datascienceiot
🔥 Огромная бесплатная книга по SQL! (500+ страниц!)

🔗 Ссылка: *клик*

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Reinforcement Learning: An Overview

📕 Book

@datascienceiot
Российская наука на NeurIPS 2024

На международной конференции NeurIPS, которая стартовала 10 декабря в Ванкувере, ученые из AIRI (российский научно-исследовательский институт искусственного интеллекта) и Сбера представили рекордные 17 научных работ. В их числе исследования в области квантовой химии, оптимизации AI-алгоритмов и методов обучения больших моделей.

Как отметил Старший вице-президент Сбера, руководитель блока «Технологическое развитие» Андрей Белевцев — этот успех подчеркивает конкурентоспособность российской науки в области искусственного интеллекта на мировой арене.

@datascienceiot
Forwarded from Machinelearning
📌Монография "Reinforcement Learning: An Overview"

Исчерпывающий материал по обучению с подкреплением (Reinforcement Learning, RL), в котором подробно описываются различные модели среды, задачи оптимизации, исследуется определение компромисса между теорией и практической эксплуатаций RL.

Отдельно рассматриваются смежные темы: распределенное RL, иерархическое RL, обучение вне политики и VLM.

В работе представлен обзор алгоритмов RL:

🟢SARSA;
🟢Q-learning;
🟢REINFORCE;
🟢A2C;
🟢TRPO/PPO;
🟢DDPG;
🟢Soft actor-critic;
🟢MBRL.

Автор - Kevin Murphy, главный научный сотрудник и руководитель команды из 28 ресечеров и инженеров в Google Deepmind. Группа работает над генеративными моделями (диффузия и LLM), RL, робототехникой, байесовским выводом и другими темами.

Кевин опубликовал более 140 статей на рецензируемых конференциях и в журналах, а также 3 учебника по ML, опубликованных в 2012, 2022 и 2023 годах издательством MIT Press. (Книга 2012 года была удостоена премии ДеГроота как лучшая книга в области статистической науки).

🔜 Монография опубликована в открытом доступе 9 декабря 2024 года.


@ai_machinelearning_big_data

#AI #ML #Book #RL
Please open Telegram to view this post
VIEW IN TELEGRAM
MIT's "Foundations of Reinforcement Learning & Interactive Decision Making"

PDF: arxiv.org/pdf/2312.16730

@datascienceiot
Machine Learning in Action

📕 Книга

@datascienceiot
Introduction to Data Science

📚 Book

#book #beginner #r

@datascienceiot
DATA SCIENCE ROADMAP

🔗 Github

@datascienceiot
Introduction to Data Science – Lecture Material

🔗 Github

@datascienceiot
Practitioner Guide for Creating Effective Prompts in Large Language Models

🔗 Paper

@datascienceiot
2025/06/13 18:51:15
Back to Top
HTML Embed Code: