Telegram Group Search
Kurva, Veo 3 vygenerovalo typický život českých bobrů. A řeknu vám, není to žádná sladkost 😁

Autor, kurva 😂

ooo donacik na sbírku (zbývá ještě 5 225.71)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Шокуюча новина: «думаючі» моделі насправді... не думають 😱

Apple несподівано випустили дослідження, в якому вони вивчали, як працює ланцюжок думок в популярних CoT-моделях типу Gemini 2.5 Pro, OpenAI o3 та DeepSeek R1.

Тестували на логічних головоломках, як от Ханойські вежі або загадка про вовка, козу та капусту, поступово ускладнюючи їх.

Результат ВБИВ 💀

🪙 TL;DR: усі моделі намагаються удаати, що «думають», але насправді просто шукають схожі задачки у своїй базі даних. AGI не буде, канал закривається;

🪙 Знайшлася цікава проблема overthinking (це вони підгледіли у людей): якщо задачка досить проста, модель швидко знаходить відповідь, а потім ще якийсь час палить кредити, перевіряючи інші варіанти, через що іноді помилково видає неправильну відповідь;

🪙 Моделі з великим бюджетом на роздуми не так ефективні, як здається — якщо задачка буде занадто складною, нейромережі просто почнуть швидше «опускати руки». Навіть нескінченний бюджет на роздуми не допоможе пробити бар'єр складності;

🪙 Few-shot промтинг (це коли ви даєте приклади вирішення вашої задачі) з цим типом моделей неефективний: якщо розписати покроковий алгоритм розв'язання, модель не подужає надскладну для неї задачу;

🪙 Ну й найцікавіше: моделі майже ідеально поралися з задачками Хайноської вежі, навіть у ситуаціях, де для вирішення потрібно було прописати 100+ (!) кроків. Натомість у надпростій задачці, де треба перевезти вовка, козу та капусту через річку, моделі верзли дурниці вже на 4 кроці. Розгадка проста: дитяча загадка з річкою не так часто зустрічалася у тренувальному датасеті моделей.

Цікаво, що Apple підкололи усіх своїх конкурентів +- за добу до WWDC 2025. А самі щось покажуть завтра? 😁

ооо донат на збір (лишилося 5 025.71)
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Дубайський зоопарк навчив своїх папуг стильно флексити 💃

🔥 — ШІ
😁 — Правда, мій теж так вміє

ооо донат на збір (лишилося 4 925.71)
Please open Telegram to view this post
VIEW IN TELEGRAM
Подивився WWDC, або «я згаяв півтори години життя, щоб вам не довелося»

У цьому році преза не дуже, тому найцікавіше:

🪙 Новий «скляний» дизайн на всіх девайсах, виглядає круто, але неіронічно нагадує Windows Vista зі стилем Aero Glass;

🪙 У дзвінків та повідомлень з'явиться автопереклад. Тільки текстом, губу закатайте. Не розумію, чому Apple так довго викатує настільки банальні фічі, як переклад тексту. Для розуміння — особисто знаю трьох людей, які читають цей канал через автопереклад самого Телеграм;

🪙 Якщо ви сплатили замовлення через Apple Pay, там же можна буде трекати статус пакунка;

🪙 У MacOS завезли віджет, який показує статус доставки їжі. Це для мене 😁

🪙 Через Spotlight можна швидко створювати команди та автоматизації, такий собі n8n на мінімалках. Фіча прикольна, ще й працює з локальними LLM! Тепер я зможу одним кліком відправляти кожен допис на перевірку орфографії, наприклад;

🪙 А ще гаджети Apple навчилися виконувати процеси фоном і це реально РЕВОЛЮЦІЯ. Знали б ви, скільки відосів я не зміг вчасно відправити в Телеграм, бо перейшов у інший додаток, а айфон тупо зупинив завантаження (на цьому місці власникам Android офіційно дозволяється посміятися);

🪙 Ще в Xcode завезли ШІ-асистента для роботи з кодом. Якщо хтось користується Xcode — відпишіть у коментарях 😁

Що мене розірвало: презентацію буквально почали з завуальованих вибачень Крейга Федерігі за те, що «ШІ компанії потребує більше часу на доробку, аби відповідати високим стандартам якості».

А ще Apple відкрили доступ до своїх LLM та інших моделей стороннім розробникам. Хоча логічніше було б визнати провал та навпаки — відкрити iOS для сторонніх LLM.

iPhone все більше перетворюється на просто телефон з прикольним дизайном, чогось революційного чекати вже не доводиться.

ооо донат на збір (лишилося 3 179.17)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube пропонує іншу назву для нового дизайну iOS 😱😱😱

З невідомих причин, Apple змінили розташування тексту на превʼю 😧

ооо донат на збір (лишилося 3 079.17)
Please open Telegram to view this post
VIEW IN TELEGRAM
Схоже, у ChatGPT серйозні проблеми — сервіс працює зі збоями з самого ранку.

Значить, чекаємо сьогодні новий реліз 👌

ооо донат на збір (лишилося 3 009.17)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Я. НАРЕШТІ. ЗАМОВИВ. ПІЦУ!!! 🍔🍔🍔

Вчора у відкриту бету вийшов Project Mariner — це браузерний агент від Google (типу як Operator), який поки що доступний тільки підписникам Ultra за 250$. Завдяки вашій підтримці у мене якраз є активна підписка ❤️

Так ось, це офіційно НАЙКРАЩИЙ агент з тих, що я тестував, бенчмарк з піцею офіційно пройдено:

🪙 ВОНО РОЗУМНЕ: Gemini додумався використовувати фільтри для гострої піци, якщо не міг знайти Діабло. Ба більше, коли він запнувся на полі з адресою (Домінос використовує оцю систему, де потрібно обрати назву вулиці зі списку), Gemini викупив, що писати повну назву вулиці — не варіант, тож написав частину та обрав потрібну у списку 😱

🪙 Англійською працює взагалі ідеально, але я ускладнив задачу — переключив сайт Домінос на солов'їну й почав писати інструкції теж українською. І цей чортяка все одно впорався! 😖

🪙 Якщо він десь помиляється чи робить зайвий клік/свап, він зі словами «Ото я дибіл» виправляє себе;

🪙 Працює дуже швидко: відео прискорено лише у 2 рази;

🪙 Але все ще не повністю автономний — коли агент відчуває, що до закінчення таски лишився один крок, він запросить підтвердження в дусі «А ти не передумав?». Хоча це скоріше правильне рішення і хай так і лишається.

Пішов обідати, всіх цьом 😋

ооо донат на збір (лишилося 2 929.17)
Please open Telegram to view this post
VIEW IN TELEGRAM
Розробники, кайфуйте: ціну на OpenAI o3 знилизили на 80% 💃

Нова ціна: 2$ за input, 8$ за output.

Ось що конкуренція з Gemini робить 😁

ооо донат на збір (лишилося 2 879.17)
Please open Telegram to view this post
VIEW IN TELEGRAM
Опа, а в нас DeepSeek момент: Mistral релізнули свої «думаючі» моделі Magistral, які перевершують DeepSeek R1 💃

Моделі
дві:

🪙 Опенсорсна Small на 24b параметрів трохи поступається DeepSeek, але вона в рази легша та простіша для запуску;

🪙 Базова Medium, яку всім не викатять, а будуть продавати партнерам (треба ж якось гроші заробляти);

🪙 Medium вже доступна безплатно у Le Chat, лімітів не знайшов 👌

Нарешті ШІ від ЄС стає ПОТУЖНИМ 🤬

ООО ЗБІР ЗАКРИТО (люблю вас!)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Нова найпотужніша модель OpenAI o3-pro вже тут 😮

Одразу про погане: доступ отримають усі підписники, окрім Plus. Pro та Team вже сьогодні, Edu та Enterprise — наступного тижня.

Приріст по бенчам файний, але не настільки, щоб витрясти з вас 200$.

По API просять 20$ на input та 80$ за output. 2 млн токенів туди-сюди = місячна підписка Pro, що не дуже вигідно 💀

Мій вердикт такий самий, як і з о1-pro: якщо ви не впевнені на 100%, що вам потрібна найрозумніша модель для ваших кейсів, або якщо вам не сплачує підписку ваш бос — кайфуємо від базового о3 у підписці Plus, він не настільки вже й гірший (а ще існує безплатний Gemini 2.5 Pro).

ооо нейромережеве | Монобаза
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/06/26 22:39:54
Back to Top
HTML Embed Code: