nn_for_science Telegram Group

AI для Всех

ChatGPT Tasks

Начал пользоваться Tasks - это новая функция в ChatGPT, которая позволяет создавать задачи и выполнять их в определенное время.

Что бы пользоваться, в меню моделей нужно выбрать GPT 4o tasks.

Например, можно ставить напоминалки. А еще ChatGPT умеет ходить в интернет, и соответственно можно делать summary какой-то веб-страницы каждое утро. Причем, в цепочки, задачи пока что объединять нельзя. Сейчас поясню:

Я себе сделал задачу: каждое утро заходи на HuggingFace Daily papers и присылай мне обзор. Если бы задачи можно было объединять в цепочки действий, я мог бы попросить его прочитать pdf каждой статьи и сделать более подробный разбор.

В целом, довольно удобно. На текущий момент у меня стоят:
- Напоминалка поливать монстеру (chatty лучше меня знает насколько часто)
- каждое утро присылать мой текущий todo
- раз в неделю просить меня вести журнал эмоционального состояния
- каждый вечер присылать мне новые слова на иврите

А вы что себе придумали (бы)?

8.2K viewsArtemii, 21:40

AI для Всех

🚀 Грандиозный AI-проект Stargate: $500 млрд на будущее искусственного интеллекта

Невероятные новости из мира AI! OpenAI и ведущие технологические гиганты объединяются в амбициозном проекте, который может изменить будущее искусственного интеллекта 🌟

📊 Ключевые факты:
- Инвестиции: $500 млрд за 4 года
- Первый транш: $100 млрд уже готов к deployment
- Главные партнеры: SoftBank (финансы) и OpenAI (операции)
- Технологические титаны: Arm, Microsoft, NVIDIA, Oracle

🏗️ Что планируется:
- Масштабное строительство AI-инфраструктуры в США
- Первая площадка уже строится в Техасе
- Создание тысяч рабочих мест
- Развитие стратегических AI-возможностей

🤝 Особенности коллаборации:
- Oracle, NVIDIA и OpenAI объединяют усилия для создания передовых вычислительных систем
- Продолжение успешного партнерства OpenAI-NVIDIA с 2016 года
- Расширение сотрудничества с Microsoft Azure

💫 Главная цель проекта - развитие AGI (искусственного общего интеллекта) на благо всего человечества. Stargate обещает стать ключевым шагом к этой амбициозной цели!

Анонс

10.4K viewsArtemii, edited 23:09

AI для Всех

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

ChatGPT теперь умеет создавать приложения.
Как я сделал приложение для изучения языка за пару минут

🔥 Важное обновление от OpenAI: Canvas теперь умеет делать артефакты, как у Claude! Это значит, что вы можете не просто писать код, но и сразу получать работающие проекты.

Я протестировал эту фичу и хочу рассказать, как с её помощью сделал приложение для изучения языка.

💡 Как это работает?

1️⃣ Генерируем идею и задачу
Сначала я попросил GPT-4o придумать детальный промпт для создания приложения. Хотел что-то простое: карточки с иностранными словами, переводом и кнопкой "выучено". GPT-4o справился на отлично!

2️⃣ Создаём артефакт с Canvas
Скопировал промпт, открыл Canvas и выбрал модель o1. Через минуту у меня было готовое приложение! А главное, Canvas сразу рендерит результат. Я тут же посмотрел, как всё выглядит — всё очень удобно и работает.

3️⃣ Результат: мини-приложение
Теперь у меня есть простое и полезное приложение для изучения языка. Я могу добавлять новые слова, повторять их и отслеживать прогресс. Всё это буквально за пару минут работы.

Попробуйте сами и убедитесь, как это круто! 🚀

Анонс

71.8K viewsArtemii, 20:55

AI для Всех

Архитектуры, вдохновленные нейронауками, для AI Safety

Сотни миллиардов в AGi, опенсорсный deepseek и агенты с доступом к командной строке. А ещё помните, учёные обнаружили, что между биологическим мозгом и нейросетками больше сходств, чем мы думали. Похожие архитектуры, механизмы передачи информации и даже структуры обработки данных. Тревожники типа меня (Ginger) дуреют, конечно... И бесспорно, эта волна несёт тонны возможностей. Перед тем, как накрыло, неплохо бы черпнуть мудрости у природы - на этот раз для повышения надежности и безопасности ИИ.

Человеческий мозг может показаться не самой лучшей моделью для разработки безопасных систем ИИ: мы развязываем войны, вредим планете, имеем когнитивные искажения, застреваем в эмоциональных травмах. Однако у него есть свойства, которые все же стоит перенять для безопасности ИИ. Мозг миллионы лет эволюционировал, чтобы функционировать в сложной и непредсказуемой среде для успеха нашего биологического вида. Пока справляется.

Команда NeuroAI Safety уверена, что пока это лучший эталон, что у нас есть, и разработала дорожную карту на 88 страниц, в которой изложила, куда стоит направить совместные усилия:

1. Реверс-инжиниринг сенсорных систем
Мозг превосходит нейросети в обработке сенсорных сигналов: зрение, слух и тактильные ощущения. За обработку информации отвечает масса специализированных модулей (сенсорные коры, гиппокамп и тд).
В рамках этого проекта исследуются способы декодирования представлений, используемых мозгом для обработки сложных данных и извлечения ключевых сигналов из шума.

2. Создание цифровых близнецов с телесной моделью
Человеческий интеллект не существует в вакууме, он зависит от тела и его взаимодействия с миром. Этот проект направлен на создание цифровых двойников, которые могут “чувствовать” и “действовать”, интегрируя сенсорно-моторные данные, подобно мозгу. Это улучшит понимание того, как обучать системы ИИ через взаимодействие с физическим или симулированным окружением.

3. Создание биофизически достоверных моделей мозга.
Современные ИИ-архитектуры сильно упрощают реальный мозг. Этот проект предлагает строить модели, учитывающие биофизические параметры (динамику ионных каналов, нейронные связи). Эти модели помогут выявить, как биологические ограничения и структуры мозга повышают его устойчивость.

4. Разработка когнитивных архитектур следующего поколения
Когнитивные процессы человека сложны и плохо изучены: память, внимание, адаптивное поведение, обучение на ошибках. Задача этого проекта использовать аналоги типа дофаминовой регуляции для обучения ИИ “мыслить на перспективу” и избегать решений с долгосрочными негативными последствиями.

5. Использование данных мозга для дообучения ИИ
Команда NeuroAI Safety исследует, как записи нейронной активности человека могут улучшить дообучение ИИ, помогая моделям улавливать ключевые паттерны или игнорировать нерелевантную информацию.

6. Реконструкция функции потерь мозга
В машинном обучении модели оптимизируют функцию потерь, но что делает мозг? Мы знаем, что человеческий мозг невероятно эффективен в предсказании действий других для социальной координации. Этот проект изучает “функцию потерь” мозга (например, цели обучения), чтобы ИИ тоже безопасно взаимодействовал с людьми.

7. Использование методов нейронаук для интерпретации ИИ
Как интерпретировать решения ИИ? Мозг использует методы “вычитки” информации (например, через когнитивные карты). Этот проект изучает, как механизмы из нейронаук могут помочь объяснять внутренние процессы в нейронных сетях.

Методы
Команда делает акцент на междисциплинарности: используются данные ЭЭГ, fMRI, биофизическое моделирование, реверс-инжиниринг и анализ когнитивных процессов.

Следующие шаги: к чему готовиться?
Фокус (в т.ч инвесторов) может сдвинуться в сторону скоординированных, масштабных усилий по развитию нейротехнологий на стыке разработки ИИ, безопасности ИИ, и нейронаук.

Так что, если вы не верили Лекуну в 2022, можно уже начинать.

Док: NeuroAI Safety или arxiv
На фото: смотровая площадка, серфер Гаретт Макнамару впервые покоряет 24-метрового пайп монстра в Назаре

7.1K viewsGinger Spacetail, 12:52

AI для Всех

У меня такое ощущение, что существуют две параллельные вселенные.

В одной, ИИ помогает делать работу в разы быстрее (особенно это заметно в сфере разработки софта, но так же и в отделах продаж и маркетинга).

А в другой, ИИ не умнее кошки 🤣

🤣

Мое мнение, что разница между этими вселенными в способности видеть экспоненциальный рост.

Про это хорошо Тим Урбан еще 10 лет назад писал, рекомендую почитать.

Напомню основные тезисы:

1. Экспоненциальное развитие
В 2015 году говорили о скором экспоненциальном росте ИИ. К 2025 году это стало реальностью — прогресс ускоряется, особенно в генеративных моделях и прототипах AGI.

2. От узкого к общему
В 2015 году ИИ решал только узкие задачи. В 2025 году ИИ демонстрирует универсальность (general), применяясь в сложных и разных областях.

3. Трансформация индустрий
Развитие ИИ изменило мир: медицина, финансы, творчество, разработка софта — всё развивается быстрее и эффективнее.

4. Опасности и дискуссии
Риски сверхразумного ИИ (ASI), о которых предупреждали в 2015 году, теперь в центре внимания. Этические вопросы и контроль — главные темы глобальных дебатов.

А где мы будем в 2035?

Please open Telegram to view this post

VIEW IN TELEGRAM

6.8K viewsArtemii, edited 16:13

AI для Всех

Open R1: Открытый пайплайн DeepSeek-R1

Главная задача проекта: восстановить недостающие части пайплайна DeepSeek-R1 и сделать его open-source.

Основные компоненты:

- src/open_r1: скрипты для обучения, оценки моделей и генерации синтетических данных

- Makefile: команды для каждого этапа пайплайна

План действий на основе публикации DeepSeek-R1:

- Репликация R1-Distill путем выделения высококачественного корпуса из DeepSeek-R1

- Воспроизведение чистого RL-пайплайна для R1-Zero. Вероятно, это будет включать в себя создание новых крупномасштабных датасетов для математики, рассуждений и кода.

- Демонстрация перехода от базовой модели к RL-настройке используя многоступенчатый процесс обучения.

Проект в процессе разработки - присоединяйтесь! 🤖🚀

🫥

Pipeline

📖

DeepSeek-R1 tech report

Please open Telegram to view this post

VIEW IN TELEGRAM

7.8K viewsKirill, 09:12

AI для Всех

Еще на шаг ближе к сингулярности: ИИ оптимизирует собственный код! 🤖💨

Пока стоки NVIDIA стремительно летят вниз (как по мне - временно), спешу поделиться потрясающей новостью из мира искусственного интеллекта! Помните популярный open-source проект llama.cpp, который позволяет запускать мощные AI модели локально? Так вот, его только что ускорили в два раза - и самое удивительное здесь то, что оптимизацию в основном написал… DeepSeek R1! 🚀

В чём суть прорыва:
- Скорость web-версии (WASM) увеличилась вдвое
- Разработчик использовал DeepSeek-R1 для написания 99% оптимизационного кода
- Улучшения подтверждены на разных типах моделей
- Точность осталась на прежнем уровне

Давайте взглянем на цифры! 📊
- Некоторые операции ускорились в 2.8 раза
- Стабильное ускорение более чем в 2 раза для моделей разного размера
- При этом точность не пострадала от такого апгрейда

Почему это важно? 🤔
У нас появилось еще одно свидетельство того, что ИИ теперь способен оптимизировать свой собственный код! Причём речь идёт о сложных низкоуровневых оптимизациях, с которыми не каждый опытный программист справится.

Реакция сообщества просто огонь! 💭 Один из разработчиков метко заметил: "Представьте, если такое начнёт происходить по всей инфраструктуре кода..." И правда, захватывающая перспектива!

Ссылка на PR

16.8K viewsArtemii, edited 20:38

AI для Всех

DeepSeek: непропорционально громкая веха в развитии ИИ 🚀

Друзья, сегодня поговорим об одном из самых громких событий в мире ИИ этого года — компании DeepSeek и её последних достижениях, которые всколыхнули весь технологический мир.

Что такое DeepSeek? 🤔

DeepSeek — это китайская AI-компания (отпочковавшиеся от трейдингового квант фонда), которая недавно выпустила две важные модели: DeepSeek-V3 и R1. Особенно интересно то, что им удалось достичь результатов, близких к ведущим американским моделям, но с меньшими затратами и со значительно большим количеством шума (сток NVIDIA улетел на 17% вниз).

Как это работает? ⚙️

DeepSeek использует следующий подход в обучении своих моделей:

1️⃣ Базовая предварительная тренировка на огромном объёме текстовых данных
2️⃣ Инновационное использование reinforcement learning для улучшения способностей к рассуждению (как у OpenAI)
3️⃣ Особый акцент на "мышлении вслух" — модель показывает ход своих рассуждений (и это очень удобно, для отладки и для коррекции)

Почему это важно? 🌟

По мнению Дарио Амодея (CEO Anthropic), значимость DeepSeek заключается в нескольких ключевых моментах:

• Это первый случай, когда китайская компания показала такой уровень инноваций в области ИИ
• DeepSeek на тренде - стоимость разработки мощных ИИ-моделей постепенно снижается (но это не только в Китае, это у всех), что в свою очередь значит что за те же деньги, тееерь можно сделать более умную модель.
• Это усиливает конкуренцию между США и Китаем в сфере ИИ

Что дальше? 🔮

Развитие DeepSeek поднимает важные вопросы о будущем ИИ:

- К 2026-2027 годам мы можем увидеть ИИ-системы, превосходящие человеческий интеллект во многих областях
- Возникает вопрос о балансе сил между странами в области ИИ-технологий
- Становится актуальной тема контроля за распространением технологий

Важно понимать: успех DeepSeek не означает революцию в экономике разработки ИИ. Скорее, это ожидаемый этап развития технологий. Но сам факт, что китайская компания первой продемонстрировала такой прогресс, имеет огромное геополитическое значение.

Выводы 📝

DeepSeek показывает, что мир ИИ становится всё более конкурентным и интернациональным. Это не просто технологическое достижение — это показатель того, как быстро развивается отрасль и как важно следить за инновациями в этой сфере.

Что думаете об этих достижениях? Как по-вашему, какие перспективы открывает развитие таких технологий? Делитесь мнением в комментариях! 💭

Эссе Дарио
Illustrated DeepSeek

Советую прочитать обе ссылки целиком и в оригинале

7.0K viewsArtemii, 19:33

AI для Всех

🌪️ GenCast: Тихая AI Революция в Прогнозировании Погоды продолжается! Команда Google DeepMind представила GenCast - новейшую AI-модель, которая предсказывает погоду с невероятной точностью на 15 дней вперед! 🎯 🤔 Почему это важно: - Изменение климата делает…

🌪️ WeatherNext: AI революция в прогнозировании погоды продолжается!

Друзья, помните мы обсуждали GenCast? Эта работа получила практическое продолжение. Google DeepMind и Google Research представили - WeatherNext, новое семейство AI-моделей, которое предсказывают погоду лучше, чем все остальные существующие методы!

Самое главное - прогнозы уже доступны

🌍 Главный вызов, с которым столкнулись разработчики:
Погодные системы невероятно хаотичны и даже малейшая неточность в измерениях может привести к серьезным ошибкам в прогнозе (и это не говоря об эффекте бабочки). Но команда AI инженеров нашла решение!

📊 WeatherNext предлагает два мощных инструмента:

WeatherNext Graph:
- Создает один сверхточный прогноз
- Обновляется каждые 6 часов
- Прогнозирует на 10 дней вперед
- Идеален для задач, где нужна максимальная определенность

WeatherNext Gen:
- Генерирует ансамбль из 50 возможных сценариев
- Обновляется каждые 12 часов
- Заглядывает на 15 дней вперед
- Незаменим для отслеживания циклонов и экстремальных явлений

⚡️ Преимущества перед традиционными методами:
- Гораздо выше скорость обработки данных
- Значительно точнее физических моделей

🚀 Доступ к технологии:
Google открыл WeatherNext через Google Cloud - прогнозы обновляются 4 раза в день, плюс доступны исторические данные для исследований и анализа.

Это не просто очередное технологическое достижение - это инструмент, который поможет сотням исследователей -> помочь тысячам инженеров -> помочь миллиардам людей лучше подготовиться к капризам погоды и сделать наш мир немного безопаснее! 🌏

Доступ к прогнозам тут
Почитать подробнее

7.0K viewsArtemii, edited 15:56

AI для Всех

Как AI-компании изменят мир: самое важное 🤖💼

Представьте компанию будущего, где вместо людей работают AI. Звучит как sci-fi? А вот и нет — такие компании могут появиться раньше, чем мы думаем (если верить YC, так вообще уже в этом году). И они будут радикально отличаться от всего, что мы знаем сейчас.

Вот вам супер краткий пересказ поста Дваркеша Пателя (довольно популярного в AI кругах блогера). Рекомендую прочитать в оригинале, там много шуток про AI Сатью (CEO Microsoft).

Главная фишка не в том, что каждый AI будет супер-умным. Самое интересное начинается, когда мы смотрим на их коллективные преимущества:

1. Копирование талантов 📋
Хотите миллион инженеров уровня главного архитектора Google? Просто скопируйте одного топового AI-специалиста. Никаких годов обучения и поиска редких талантов — только стоимость вычислений.

2. Единый мега-мозг 🧠
Представьте CEO, который реально знает всё, что происходит в компании. AI-руководитель сможет анализировать каждое решение, каждую метрику, каждый разговор с клиентом. И главное — мгновенно делиться этими знаниями со всеми копиями себя.

3. Эволюция на стероидах 🚀
Обычные компании не могут просто взять и клонировать свою успешную культуру или процессы. AI-компании смогут. Нашли успешную модель работы? Размножайте её бесконечно, улучшайте и адаптируйте под новые задачи.

4. Суперскорость принятия решений ⚡
AI-CEO сможет за пару минут просчитать тысячи сценариев развития компании на годы вперед. Причем не примерно, а с учетом всех данных о рынке, клиентах и конкурентах.

Это не научная фантастика про далекое будущее — первые шаги к таким компаниям мы видим уже сейчас. Готовы к новой эре бизнеса?

P.S. А самое интересное — как это изменит конкуренцию. Ведь если одна компания научится так работать раньше других...

6.1K viewsArtemii, 04:20

AI для Всех

🤖

Золотая коллекция авторских каналов про нейросети, сохраняйте!

Собрал для вас редкие и полезные каналы про нейронки:

Tips AI | IT & AI — пишет про интересные сервисы AI и IT технологий! Всегда актуальное, проверенное и немного с юмором.

Бурый — коллекционер нейросетей, тестит всё на себе и делится лучшими бесплатными нейронками.

Силиконовый Мешок — Авторский канал нейроиспытателя Артема Субботина про искусственный интеллект приносящий прибыль.

Сергей Булаев AI 🤖 - создание полезного контента и продуктов с помощью ИИ. Открываем эру миллиардных компаний из трёх человек.

НейроProfit — авторский канал с проверенными инструментами для бизнеса, учебы и работы. Конкретика, кейсы и пошаговые инструкции – все, чтобы вы смогли использовать ИИ эффективно уже сегодня.

#промо

Please open Telegram to view this post

VIEW IN TELEGRAM

5.3K viewsArtemii, edited 16:05

AI для Всех

The End of Search, The Beginning of Research 🔍

Привет, друзья! Хочу поделиться интересным постом от Ethan Mollick - известного профессора Уортонской школы бизнеса, который пишет одни из самых глубоких материалов про ИИ в своем блоге One Useful Thing.

Давайте разберем, что происходит 👇

Революция происходит на наших глазах: в 2025 году у нас есть две ключевые технологии ИИ - Reasoners (системы-мыслители) и автономные агенты 🤖

Что такое Reasoners? 🧠
Это новый подход к ИИ, где модель сначала "думает", а потом отвечает. В отличие от обычных чат-ботов, которые генерируют текст на лету, Reasoners проводят внутренний анализ задачи. Чем дольше они размышляют, тем качественнее результат. За последние месяцы мы видели впечатляющий прогресс: от OpenAI o1 к o3, китайский DeepSeek r1, да и Google подтянулся со своим первым Reasoner'ом.

Что такое агенты? 🎯
Это ИИ с конкретной целью и автономностью в её достижении. OpenAI недавно выпустила Оператора - пожалуй, самого продвинутого универсального агента. Правда, пока что он часто спотыкается о простые задачи - например, не может скачать файл из-за ограничений безопасности. Но! В узких специализациях агенты уже творят чудеса (от себя добавлю, что мы в Страйпе наблюдаем взрывной рост agentic commerce, когда ИИ агенты идут и покупают, то что вам надо, за вас).

Deep Research - где всё сходится ✨
OpenAI объединила мощь Reasoner'а (модель o3) со специализированным агентом для исследований. Результат поражает:

- 5 минут работы = 13 страниц глубокого анализа
- Только качественные академические источники
- Точные цитаты с прямыми ссылками
- "Любопытное" исследование: ИИ активно углубляется в интересные находки

Google тоже выпустила Deep Research, но пока что это больше похоже на работу хорошего студента: много источников, но анализ поверхностный. Впрочем, зная темпы развития, этот разрыв скоро сократится.

Что дальше? 🚀
Узкоспециализированные агенты уже могут заменить работу целых команд экспертов. OpenAI утверждает, что их система способна справиться с 15% высокоценных исследовательских проектов и 9% особо сложных. Звучит амбициозно, но мой опыт тестирования подтверждает - цифры не с потолка.

Сэм пишет, что Deep Research скорее всего уже способен заменить какой-то процент рабочей силы в мировой экономике.

Эксперты не останутся без работы - их роль эволюционирует от исполнителей к "дирижерам", направляющим и проверяющим работу ИИ (как например, программисты теперь «дирижируют» Курсором). Но стоит ожидать, что людей для такой работы нужно будет значительно меньше.

На январь 2025 года мы еще далеки от универсальных ИИ-агентов, но уже очень близки к тому, чтобы ИИ превзошел 95% людей в работе белых воронничков. Включая soft skills (да-да, я уверен, что работающих AI-менеджеров мы увидим раньше, чем AI-слесарей).

Как думаете, как это изменит вашу профессию? 🤔

Блог-пост

7.7K viewsArtemii, 20:06

AI для Всех

Калифорнийский Университет запускает AI-систему: что важно знать 🎓

Калифорнийский государственный университет объявил о внедрении AI во все 23 кампуса. Что это значит на практике:

Основные изменения 📚
• ChatGPT Edu станет доступен для всех студентов и преподавателей – это специальная версия с расширенными возможностями для образования
• Появится единый AI Commons Hub с инструментами для обучения и исследований
• Запускаются программы стажировок с ведущими tech-компаниями

Почему это действительно важно 🔍
1. Масштаб: это крупнейшее внедрение AI в образовании (460 000+ студентов)
2. Практический подход: студенты получают реальные навыки работы с AI, востребованные на рынке
3. Доступность: все инструменты бесплатны для студентов и преподавателей

Интересный факт: сейчас более 50% AI-специалистов в США – иностранцы. CSU планирует изменить эту статистику, готовя местные кадры.

Анонс от CSU
Анонс от OpenAI

76.9K viewsArtemii, 22:16

AI для Всех

🌐 Первый международный отчет по безопасности ИИ: ключевые выводы

Отчет подготовлен 100 независимыми экспертами из 33 стран и сфокусирован на трех ключевых вопросах:

- Что может ИИ общего назначения?
- Какие риски с ним связаны?
- Как эти риски можно снизить?

Важно: отчет не дает конкретных политических рекомендаций, а предоставляет научную основу для принятия решений и международного диалога о безопасности продвинутого ИИ.

Ключевые выводы:

📈 Стремительный рост возможностей ИИ: от написания текстов до создания программ и фотореалистичных изображений. Последние модели демонстрируют значительный прогресс в научном мышлении.

🤖 Компании активно инвестируют в разработку ИИ-агентов — систем, способных автономно действовать и планировать с минимальным контролем человека.

⚠️ Уже подтверждены риски: мошенничество, генерация NSFW-контента, предвзятость моделей, проблемы надежности и конфиденциальности.

🎯 Новые угрозы: масштабное влияние на рынок труда, ИИ-хакинг, биологические атаки. Эксперты расходятся в оценках сроков реализации этих рисков — от десятилетий до нескольких лет.

⚖️ Дилемма для регуляторов: выбор между преждевременными ограничениями и риском остаться неподготовленными к резким скачкам в развитии ИИ.

Отчет станет основой для обсуждения на Саммите по ИИ, который пройдет в Париже 10 - 11 февраля

📝

Отчёт

Please open Telegram to view this post

VIEW IN TELEGRAM

6.2K viewsKirill, 19:08

AI для Всех

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

ИИ открыл новый способ считать. Но вы всё равно продолжите пользоваться калькулятором

ИИ должен упростить нашу жизнь, да? Ну так вот, вместо того, чтобы просто запомнить, что 2+2=4, GPT-J делает что-то похожее на тригонометрический ритуал. Он кодирует числа на многомерной спирали, раскладывает в базис косинусов, а сложение выполняет через преобразования, которые нормальный человек даже на экзамене по линалу не вспомнит.

Исследователи попытались разобраться, как LLM складывают числа, и обнаружили, что модели вроде GPT-J-6B кодируют и обнаружили метод, который назвали Clock algorithm, потому что сложение выполняется как сложение углов: через cos(a), cos(b) → cos(a+b) и напоминает сложение углов на циферблате.

Векторные представления чисел исследовали через остаточный поток модели, прогоняя GPT-J-6B на всех числах из диапазона [0,360]. Спектральный анализ показал, что представление разрежено в пространстве Фурье, а главная компонента PCA оказалась линейной. А что у нас такое периодическое и линейное? Спираль!🌀

x = r cos t
y = r sin t
y = c t

Проверили это гипотезу, подбирая параметры спирали для представления каждого числа. Оказалось, что токены, представляющие суммы (a+b), хорошо описываются этой же основой, что говорит о реальном использовании модели такого механизма.

🛠️ Как проверить, что модель действительно так считает?
✔️ Intervention patching: заменили активации слоёв модели на вычисленные вручную спиральные представления и обнаружили, что это почти так же хорошо, как полная подмена слоя! Значит, модель действительно использует эту структуру.
✔️ Разделение ролей между слоями: слои MLP 14-18 формируют спиральное представление (a+b), а слои 19-27 считывают его и поднимают соответствующий токен в логитах.
✔️ Разбор нейронов: используя атрибуционные техники, исследователи выяснили, что активации нейронов MLP тоже следуют периодическим паттернам, что дополнительно подтверждает гипотезу о геликоидальном (спиральном) сложении.

Почему это важно?
Оказывается, вместо того, чтобы просто запоминать суммы, модель самостоятельно выучивает сложную, но универсальную алгоритмическую структуру! Этот же метод ранее встречался в исследованиях модульного сложения в трансформерах, который раньше описывал Neel Nanda. LLM не просто таблицы с вероятностями, а какие-то самоорганизующиеся вычислительные системы.
В любом случае, может, машинное обучение и не всегда дает интуитивно понятные решения, но точно умеет находить красивые и неожиданные пути.

🔗 Источники:
📜 arxiv
📝 Блог
💻 Код

8.6K viewsGinger Spacetail, 05:46

AI для Всех

Пульс влияния ИИ на общество: Экономический Индекс Anthropic

Компания Anthropic объявила о запуске Экономического Индекса Anthropic — инициативы, направленной на изучение влияния ИИ на рынки труда и экономику.

Первый отчет Индекса анализирует миллионы анонимных интеракций на платформе Claude.ai, предоставляя данные о том, как ИИ интегрируется в реальные задачи современной экономики.

Основные выводы отчета:

- ИИ активно используется в задачах разработки программного обеспечения и технического письма.

- Более трети профессий (около 36%) применяют ИИ как минимум в четверти своих задач, тогда как примерно 4% профессий используют его в трех четвертях задач.

- ИИ чаще используется для дополнения человеческих возможностей (57%), чем для полной автоматизации задач (43%).

- Применение ИИ более распространено в профессиях со средним и высоким уровнем заработной платы, таких как программисты и дата-сайентисты, и менее — в низко- и высокооплачиваемых ролях.

Anthropic также открывает доступ к данным, которые использовались для составления отчёта

💻 Блог

📝

Отчёт

💾 Датасет

Please open Telegram to view this post

VIEW IN TELEGRAM

6.1K viewsKirill, 19:43

AI для Всех

🤖 Когда много думать — вредно.

Свежайшее исследование показало, что слишком много размышлений (у LLM) не просто тратит ресурсы впустую — оно ухудшает результат!

Исследователи обнаружили, что если заставлять модели “думать” больше, чем нужно, их точность падает, а вычислительные затраты растут.

В ходе эксперимента исследователи выбрали решения с меньшим уровнем “избыточного размышления” и добились удивительных результатов:
🔹 Точность выросла на 30%
🔹 Расходы на вычисления снизились на 43%

Это означает, что чрезмерное рассуждение вредит не только людям, но и нейросетям.

На волне успехов reasoning моделей я решил послушать «Думай медленно, решай быстро» и оказалось, что книжка 2011 года просто нашпигована инсайтами на 2025 год!

Один из таких инсайтов - чтобы создать действительно умные ИИ-размышления, нужно учесть один важный фактор: лень (ну или если формально, то стремление системы потреблять как можно меньше ресурсов).

В когнитивной науке давно известно, что наш мозг использует два типа мышления:
🧠 Система 1 — интуитивная, быстрая, автоматическая.
🧐 Система 2 — медленная, аналитическая, но… максимально экономная.

Система 2 включается только тогда, когда это действительно необходимо. Но, что еще более важно в контексте исследования про overthinking, она не просто потребляет много ресурсов, но и старается их минимизировать.

Если применить это к ИИ, то уже в ближайшее время мы будем наблюдать новый класс “разумных” моделей, которые:
- Будут рассуждать только тогда, когда это оправдано, экономя вычислительные мощности.
- Гибко регулировать глубину анализа, избегая излишней сложности.
- И скорее всего будут минимизировать количество токенов на размышления, сохраняя качество ответов

Таким образом, чтобы вывести ИИ на новый уровень, недостаточно просто заставить его “думать сильнее”. Надо научить его думать эффективнее.

Следующий прорыв в AI, скорее всего, придёт из когнитивистики, социальной психологии и педагогики — дисциплин, которые десятилетиями изучают, как люди думают и учатся.

Статья про overthinking

5.9K viewsArtemii, 23:12

AI для Всех

SWE-Lancer: OpenAI всерьез взялись за ИИ-програмиста

Многие спорят, сможет ли ИИ полноценно заменять разработчиков. Новый эксперимент OpenAI — SWE-Lancer — показывает, насколько мы приблизились к этому будущему.

Исследователи взяли 1 488 реальных задач из фриланс-проекта Expensify на Upwork и показали их передовым ИИ-моделям, чтобы узнать, сколько денег они способны “заработать”. И тут всё серьёзно: за каждую решённую задачу — настоящая выплата, общий призовой фонд — $1 млн!

Задачи собирали для двух сценариев:
1. IC (Individual Contributor) Tasks — ИИ пишет решение задачи и тесты как в реальном продукте .
2. Задачи менеджера — ИИ оценивает несколько предложений решения проблемы и выбирает лучшее, как реальный тимлид.

Оказалось, что даже крутые системы вроде GPT-4о и Claude 3.5 Sonnet (на о3 почему то не проверяли) собрали лишь часть возможной суммы: лучший результат — около $400 000. Цифра внушительная, но говорит о том, что им ещё есть к чему стремиться.

Что тут измеряют и почему это важно?

• Сложность задач. Простые мелочи стоят $50, а большие фичи — до $32 000. Эта разница чётко показывает уровень навыков ИИ.
• Подход к работе. Одни модели лучше выбирают готовые решения (как тимлид), другие — активнее пишут код.
• Путь к улучшению. Раз видим, где ИИ “недозаработал”, мы понимаем, какие умения прокачивать — например, работать сразу с несколькими файлами или тщательнее тестировать.

Пока ИИ хорош в точечных задачах и быстрых решениях, но когда дело доходит до больших, “раскиданных” по проекту проблем, начинаются пробуксовки.

Куда всё идёт?

С большой вероятностью — к тому, что модели продолжат совершенствоваться, научатся быстрее и глубже понимать проекты, а значит и зарабатывать всё ближе к заветным $1 млн. Людям же в этом процессе роль конкурентов видимо не достанется.

SWE-Lancer наглядно демонстрирует, что современные модели не так уж и далеки от полного захвата фриланса. Пока же мы видим, что живой разработчик и его навыки остаются незаменимы, но, как гласит одна из заповедей: “what you can measure - you can improve”.

Статья

5.7K viewsArtemii, edited 15:43

AI для Всех

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

Без математики в мире искусственного интеллекта никуда.

Однако стандартные учебные программы часто не дают никакой интуиции и визуального смысла.
В итоге остается использовать калькулятор и бежать, едва завидев формулы...

Проект Popmath решил исправить ситуацию и подготовил наполненные 2D и 3D анимациями 4-х месячные онлайн-курсы через Zoom, которые позволяют ознакомиться с предметом намного проще и побороть математическую тревожность:

🟧 [Математика для взрослых] — для желающих получить прочную математическую базу с полного нуля. Предварительные знания не требуются.

🟥 [Линейная алгебра] — для тех, кто хочет разобраться в предмете поглубже и выйти за рамки базовых знаний математики.

Старт групп: середина марта

Вопросы ➡️ @popmath_support

#реклама

3.7K viewsArtemii, 09:07

AI для Всех

🚀💰 AI-революция в глобальной экономике: анализ годового письма Stripe 2024

Привет, друзья! Сегодня мы погрузимся в анализ свежего годового письма Stripe за 2024 год и убедимся, что AI трансформирует мировую экономику прямо у нас на глазах.

Эпоха AI-экономики наступила!

Stripe не стесняется называть происходящее настоящим "AI-бумом" — и неспроста! Всё больше компаний перестраивают свои бизнес-модели вокруг больших языковых моделей (LLM) и других прорывных технологий машинного обучения. Это касается не только гигантов уровня OpenAI или Anthropic, но и стартапов, которые буквально за считанные месяцы выходят на выручку в миллионы долларов.

Реальные примеры взрывного роста:

- Perplexity: AI-поисковик, обрабатывающий сотни миллионов запросов ежемесячно (основан в 2022 году)
- Cursor: интегрированная с AI-инструментами платформа для разработчиков (заработали $100M меньше чем за 3 года существования)
- Lovable и Bolt: стартапы, $17M за 3 месяца и $20М за 2 месяца соответственно
- Специализированные решения: AI-помощники в медицине (Abridge, Nabla), недвижимости (Studeo), дизайне (SketchPro) и других областях

AI-агенты: новый рубеж финансовых технологий

Одна из самых, на мой взгляд, взрывных разработок Stripe — создание инфраструктуры для "агентных" платежных систем. AI-системы уже самостоятельно проводят транзакции (Perplexity и Payman) в рамках заданных лимитов и правил — без непосредственного участия человека!

Это открывает захватывающие возможности:
- Автоматическое пополнение складских запасов
- "Умное" продление подписок
- Оптимизация регулярных бизнес-расходов
- Мгновенная оплата услуг от имени пользователя (с его разрешения)

AI как двигатель традиционного бизнеса

Искусственный интеллект помогает не только в сфере технологий. Stripe годами использует вполне себе классические ML-модели для:
- Борьбы с мошенничеством (например, Radar, который автоматически выявляет подозрительные транзакции)
- Повышения конверсии платежей (умные алгоритмы снижают количество отказов при оплате)
- Оптимизации финансовых потоков

Даже старейшие и консервативные организации присоединяются к цифровой трансформации! Университет Оксфорда, Англиканская церковь, гиганты вроде Hershey и PepsiCo внедряют интеллектуальные платежные системы и видят результаты: выше уровень авторизаций, меньше отказов, больше выручка.

Другие ключевые тренды из письма Stripe

Stablecoins: будущее глобальных финансов
Stripe уверен, что стабильные криптовалюты станут следующей ступенью эволюции денег:
- Ускорят и удешевят международные переводы
- Обеспечат доступ к доллару в странах с нестабильной экономикой
- Создадут фундамент для новых финансовых операций в глобальном масштабе

Вертикальные SaaS-платформы для малого бизнеса
Растет популярность узкоспециализированных решений:
- Интегрированные платформы для ресторанов, клиник, салонов красоты, пиццерий и тп
- Комбинация платежей, CRM, логистики и AI в едином интерфейсе
- Возможность запустить бизнес буквально за недели, а не месяцы

Экономические вызовы Европы 🇪🇺
Письмо затрагивает разрыв в продуктивности между США и Европой:
- Необходимость снижения бюрократических барьеров
- Создание более благоприятной среды для стартапов
- Реформы для привлечения венчурного капитала

Взгляд в будущее: AI меняет всё прямо сейчас

Stripe прогнозирует, что 2025 год станет переломным для AI-экономики. Мы увидим:
- Еще больше предпринимателей, делающих ставку на AI-решения
- Прорыв в повседневных сервисах с интеллектуальными помощниками
- Формирование принципиально новых бизнес-моделей и рынков

Очень рекомендую прочитать письмо целиком!

2.1K viewsArtemii, 16:32

2025/03/01 03:37:24
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>