Telegram Group & Telegram Channel
🧩🤖 Нейросети против воскресных головоломок: неожиданные результаты

Исследователи из американских университетов и стартапа Cursor протестировали модели искусственного интеллекта, используя задачи из еженедельной радиовикторины Sunday Puzzle на NPR. Целью было оценить способности ИИ к логическому мышлению и рассуждению.

Ключевые выводы исследования:

Ограниченная точность: Ни одна из протестированных моделей не достигла точности выше 60% при решении головоломок.

"Сдача" ИИ: Некоторые модели, столкнувшись с трудностями, буквально "сдавались". Например, нейросеть от DeepSeek в случае затруднений писала: "Я сдаюсь", а затем предлагала случайный ответ.

Повторяющиеся ошибки: Некоторые ИИ многократно пытались исправить свои ошибки, но безуспешно, иногда "застревая" в бесконечных размышлениях или генерируя бессмысленные ответы.

Это исследование подчеркивает текущие ограничения искусственного интеллекта в области критического мышления и решения нестандартных задач.

#МирРобототехники #Нейросети #Технологии #ИИ



group-telegram.com/world_of_robotics/3602
Create:
Last Update:

🧩🤖 Нейросети против воскресных головоломок: неожиданные результаты

Исследователи из американских университетов и стартапа Cursor протестировали модели искусственного интеллекта, используя задачи из еженедельной радиовикторины Sunday Puzzle на NPR. Целью было оценить способности ИИ к логическому мышлению и рассуждению.

Ключевые выводы исследования:

Ограниченная точность: Ни одна из протестированных моделей не достигла точности выше 60% при решении головоломок.

"Сдача" ИИ: Некоторые модели, столкнувшись с трудностями, буквально "сдавались". Например, нейросеть от DeepSeek в случае затруднений писала: "Я сдаюсь", а затем предлагала случайный ответ.

Повторяющиеся ошибки: Некоторые ИИ многократно пытались исправить свои ошибки, но безуспешно, иногда "застревая" в бесконечных размышлениях или генерируя бессмысленные ответы.

Это исследование подчеркивает текущие ограничения искусственного интеллекта в области критического мышления и решения нестандартных задач.

#МирРобототехники #Нейросети #Технологии #ИИ

BY Мир Робототехники




Share with your friend now:
group-telegram.com/world_of_robotics/3602

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Friday’s performance was part of a larger shift. For the week, the Dow, S&P 500 and Nasdaq fell 2%, 2.9%, and 3.5%, respectively. "Like the bombing of the maternity ward in Mariupol," he said, "Even before it hits the news, you see the videos on the Telegram channels." In the United States, Telegram's lower public profile has helped it mostly avoid high level scrutiny from Congress, but it has not gone unnoticed. That hurt tech stocks. For the past few weeks, the 10-year yield has traded between 1.72% and 2%, as traders moved into the bond for safety when Russia headlines were ugly—and out of it when headlines improved. Now, the yield is touching its pandemic-era high. If the yield breaks above that level, that could signal that it’s on a sustainable path higher. Higher long-dated bond yields make future profits less valuable—and many tech companies are valued on the basis of profits forecast for many years in the future. However, the perpetrators of such frauds are now adopting new methods and technologies to defraud the investors.
from hk


Telegram Мир Робототехники
FROM American