В LLM можно внедрить спящего агента (https://fxtwitter.com/AnthropicAI/status/1745854907968880970). Триггером для него станет определенная фраза, после которой агент начнет менять поведение этой модели, на картинке показано как. На данный момент это один из самых интересных секьюрити-кейсов, связанных с LLM
Мне вспоминается концепция троянского обучения в педагогике - ОНО. Ваш виртуальный помощник на каком-то этапе начинающий советовать совершать критические ошибки
В LLM можно внедрить спящего агента (https://fxtwitter.com/AnthropicAI/status/1745854907968880970). Триггером для него станет определенная фраза, после которой агент начнет менять поведение этой модели, на картинке показано как. На данный момент это один из самых интересных секьюрити-кейсов, связанных с LLM
Мне вспоминается концепция троянского обучения в педагогике - ОНО. Ваш виртуальный помощник на каком-то этапе начинающий советовать совершать критические ошибки
In view of this, the regulator has cautioned investors not to rely on such investment tips / advice received through social media platforms. It has also said investors should exercise utmost caution while taking investment decisions while dealing in the securities market. In a statement, the regulator said the search and seizure operation was carried out against seven individuals and one corporate entity at multiple locations in Ahmedabad and Bhavnagar in Gujarat, Neemuch in Madhya Pradesh, Delhi, and Mumbai. Telegram, which does little policing of its content, has also became a hub for Russian propaganda and misinformation. Many pro-Kremlin channels have become popular, alongside accounts of journalists and other independent observers. "This time we received the coordinates of enemy vehicles marked 'V' in Kyiv region," it added. But the Ukraine Crisis Media Center's Tsekhanovska points out that communications are often down in zones most affected by the war, making this sort of cross-referencing a luxury many cannot afford.
from br