🧩🤖 Нейросети против воскресных головоломок: неожиданные результаты
Исследователи из американских университетов и стартапа Cursor протестировали модели искусственного интеллекта, используя задачи из еженедельной радиовикторины Sunday Puzzle на NPR. Целью было оценить способности ИИ к логическому мышлению и рассуждению.
Ключевые выводы исследования:
Ограниченная точность: Ни одна из протестированных моделей не достигла точности выше 60% при решении головоломок.
"Сдача" ИИ: Некоторые модели, столкнувшись с трудностями, буквально "сдавались". Например, нейросеть от DeepSeek в случае затруднений писала: "Я сдаюсь", а затем предлагала случайный ответ.
Повторяющиеся ошибки: Некоторые ИИ многократно пытались исправить свои ошибки, но безуспешно, иногда "застревая" в бесконечных размышлениях или генерируя бессмысленные ответы.
Это исследование подчеркивает текущие ограничения искусственного интеллекта в области критического мышления и решения нестандартных задач.
🧩🤖 Нейросети против воскресных головоломок: неожиданные результаты
Исследователи из американских университетов и стартапа Cursor протестировали модели искусственного интеллекта, используя задачи из еженедельной радиовикторины Sunday Puzzle на NPR. Целью было оценить способности ИИ к логическому мышлению и рассуждению.
Ключевые выводы исследования:
Ограниченная точность: Ни одна из протестированных моделей не достигла точности выше 60% при решении головоломок.
"Сдача" ИИ: Некоторые модели, столкнувшись с трудностями, буквально "сдавались". Например, нейросеть от DeepSeek в случае затруднений писала: "Я сдаюсь", а затем предлагала случайный ответ.
Повторяющиеся ошибки: Некоторые ИИ многократно пытались исправить свои ошибки, но безуспешно, иногда "застревая" в бесконечных размышлениях или генерируя бессмысленные ответы.
Это исследование подчеркивает текущие ограничения искусственного интеллекта в области критического мышления и решения нестандартных задач.
Additionally, investors are often instructed to deposit monies into personal bank accounts of individuals who claim to represent a legitimate entity, and/or into an unrelated corporate account. To lend credence and to lure unsuspecting victims, perpetrators usually claim that their entity and/or the investment schemes are approved by financial authorities. Stocks closed in the red Friday as investors weighed upbeat remarks from Russian President Vladimir Putin about diplomatic discussions with Ukraine against a weaker-than-expected print on U.S. consumer sentiment. Messages are not fully encrypted by default. That means the company could, in theory, access the content of the messages, or be forced to hand over the data at the request of a government. "There are a lot of things that Telegram could have been doing this whole time. And they know exactly what they are and they've chosen not to do them. That's why I don't trust them," she said. Soloviev also promoted the channel in a post he shared on his own Telegram, which has 580,000 followers. The post recommended his viewers subscribe to "War on Fakes" in a time of fake news.
from nl