Telegram Group & Telegram Channel
🧩🤖 Нейросети против воскресных головоломок: неожиданные результаты

Исследователи из американских университетов и стартапа Cursor протестировали модели искусственного интеллекта, используя задачи из еженедельной радиовикторины Sunday Puzzle на NPR. Целью было оценить способности ИИ к логическому мышлению и рассуждению.

Ключевые выводы исследования:

Ограниченная точность: Ни одна из протестированных моделей не достигла точности выше 60% при решении головоломок.

"Сдача" ИИ: Некоторые модели, столкнувшись с трудностями, буквально "сдавались". Например, нейросеть от DeepSeek в случае затруднений писала: "Я сдаюсь", а затем предлагала случайный ответ.

Повторяющиеся ошибки: Некоторые ИИ многократно пытались исправить свои ошибки, но безуспешно, иногда "застревая" в бесконечных размышлениях или генерируя бессмысленные ответы.

Это исследование подчеркивает текущие ограничения искусственного интеллекта в области критического мышления и решения нестандартных задач.

#МирРобототехники #Нейросети #Технологии #ИИ



group-telegram.com/world_of_robotics/3602
Create:
Last Update:

🧩🤖 Нейросети против воскресных головоломок: неожиданные результаты

Исследователи из американских университетов и стартапа Cursor протестировали модели искусственного интеллекта, используя задачи из еженедельной радиовикторины Sunday Puzzle на NPR. Целью было оценить способности ИИ к логическому мышлению и рассуждению.

Ключевые выводы исследования:

Ограниченная точность: Ни одна из протестированных моделей не достигла точности выше 60% при решении головоломок.

"Сдача" ИИ: Некоторые модели, столкнувшись с трудностями, буквально "сдавались". Например, нейросеть от DeepSeek в случае затруднений писала: "Я сдаюсь", а затем предлагала случайный ответ.

Повторяющиеся ошибки: Некоторые ИИ многократно пытались исправить свои ошибки, но безуспешно, иногда "застревая" в бесконечных размышлениях или генерируя бессмысленные ответы.

Это исследование подчеркивает текущие ограничения искусственного интеллекта в области критического мышления и решения нестандартных задач.

#МирРобототехники #Нейросети #Технологии #ИИ

BY Мир Робототехники




Share with your friend now:
group-telegram.com/world_of_robotics/3602

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Since its launch in 2013, Telegram has grown from a simple messaging app to a broadcast network. Its user base isn’t as vast as WhatsApp’s, and its broadcast platform is a fraction the size of Twitter, but it’s nonetheless showing its use. While Telegram has been embroiled in controversy for much of its life, it has become a vital source of communication during the invasion of Ukraine. But, if all of this is new to you, let us explain, dear friends, what on Earth a Telegram is meant to be, and why you should, or should not, need to care. Multiple pro-Kremlin media figures circulated the post's false claims, including prominent Russian journalist Vladimir Soloviev and the state-controlled Russian outlet RT, according to the DFR Lab's report. In February 2014, the Ukrainian people ousted pro-Russian president Viktor Yanukovych, prompting Russia to invade and annex the Crimean peninsula. By the start of April, Pavel Durov had given his notice, with TechCrunch saying at the time that the CEO had resisted pressure to suppress pages criticizing the Russian government. Stocks closed in the red Friday as investors weighed upbeat remarks from Russian President Vladimir Putin about diplomatic discussions with Ukraine against a weaker-than-expected print on U.S. consumer sentiment. Telegram has become more interventionist over time, and has steadily increased its efforts to shut down these accounts. But this has also meant that the company has also engaged with lawmakers more generally, although it maintains that it doesn’t do so willingly. For instance, in September 2021, Telegram reportedly blocked a chat bot in support of (Putin critic) Alexei Navalny during Russia’s most recent parliamentary elections. Pavel Durov was quoted at the time saying that the company was obliged to follow a “legitimate” law of the land. He added that as Apple and Google both follow the law, to violate it would give both platforms a reason to boot the messenger from its stores.
from sg


Telegram Мир Робототехники
FROM American