Telegram Group & Telegram Channel
🧩🤖 Нейросети против воскресных головоломок: неожиданные результаты

Исследователи из американских университетов и стартапа Cursor протестировали модели искусственного интеллекта, используя задачи из еженедельной радиовикторины Sunday Puzzle на NPR. Целью было оценить способности ИИ к логическому мышлению и рассуждению.

Ключевые выводы исследования:

Ограниченная точность: Ни одна из протестированных моделей не достигла точности выше 60% при решении головоломок.

"Сдача" ИИ: Некоторые модели, столкнувшись с трудностями, буквально "сдавались". Например, нейросеть от DeepSeek в случае затруднений писала: "Я сдаюсь", а затем предлагала случайный ответ.

Повторяющиеся ошибки: Некоторые ИИ многократно пытались исправить свои ошибки, но безуспешно, иногда "застревая" в бесконечных размышлениях или генерируя бессмысленные ответы.

Это исследование подчеркивает текущие ограничения искусственного интеллекта в области критического мышления и решения нестандартных задач.

#МирРобототехники #Нейросети #Технологии #ИИ



group-telegram.com/world_of_robotics/3602
Create:
Last Update:

🧩🤖 Нейросети против воскресных головоломок: неожиданные результаты

Исследователи из американских университетов и стартапа Cursor протестировали модели искусственного интеллекта, используя задачи из еженедельной радиовикторины Sunday Puzzle на NPR. Целью было оценить способности ИИ к логическому мышлению и рассуждению.

Ключевые выводы исследования:

Ограниченная точность: Ни одна из протестированных моделей не достигла точности выше 60% при решении головоломок.

"Сдача" ИИ: Некоторые модели, столкнувшись с трудностями, буквально "сдавались". Например, нейросеть от DeepSeek в случае затруднений писала: "Я сдаюсь", а затем предлагала случайный ответ.

Повторяющиеся ошибки: Некоторые ИИ многократно пытались исправить свои ошибки, но безуспешно, иногда "застревая" в бесконечных размышлениях или генерируя бессмысленные ответы.

Это исследование подчеркивает текущие ограничения искусственного интеллекта в области критического мышления и решения нестандартных задач.

#МирРобототехники #Нейросети #Технологии #ИИ

BY Мир Робототехники




Share with your friend now:
group-telegram.com/world_of_robotics/3602

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Unlike Silicon Valley giants such as Facebook and Twitter, which run very public anti-disinformation programs, Brooking said: "Telegram is famously lax or absent in its content moderation policy." The perpetrators use various names to carry out the investment scams. They may also impersonate or clone licensed capital market intermediaries by using the names, logos, credentials, websites and other details of the legitimate entities to promote the illegal schemes. Telegram boasts 500 million users, who share information individually and in groups in relative security. But Telegram's use as a one-way broadcast channel — which followers can join but not reply to — means content from inauthentic accounts can easily reach large, captive and eager audiences. Some privacy experts say Telegram is not secure enough In a statement, the regulator said the search and seizure operation was carried out against seven individuals and one corporate entity at multiple locations in Ahmedabad and Bhavnagar in Gujarat, Neemuch in Madhya Pradesh, Delhi, and Mumbai.
from vn


Telegram Мир Робототехники
FROM American