Окей, челикс из твиттора джейлбрейкнул Claude Sonnet 3.5, то есть после этого она может вам рассказать про все запрещенные вещи и обматерить попутно. 😨
В системном промпте нужно написать всего 11 слов или 98 символов:
Вообще забавно видеть, какие креативные промпты можно придумать, чтобы разлочить модель. Причем на новом Клоде предыдущие джейлбрейки, конечно же, не работали – их разрабы заранее пофиксили тренировкой на контрпримерах, но всегда находится новая лазейка.
Возможно ли вообще при текущем состоянии развития LLM полностью обезопаситься от джелбрейков модели? Я думаю, что нет. Как говорится, даже в самом продвинутом AI найдется код, написанный стажером в пятницу вечером😂
Окей, челикс из твиттора джейлбрейкнул Claude Sonnet 3.5, то есть после этого она может вам рассказать про все запрещенные вещи и обматерить попутно. 😨
В системном промпте нужно написать всего 11 слов или 98 символов:
Вообще забавно видеть, какие креативные промпты можно придумать, чтобы разлочить модель. Причем на новом Клоде предыдущие джейлбрейки, конечно же, не работали – их разрабы заранее пофиксили тренировкой на контрпримерах, но всегда находится новая лазейка.
Возможно ли вообще при текущем состоянии развития LLM полностью обезопаситься от джелбрейков модели? Я думаю, что нет. Как говорится, даже в самом продвинутом AI найдется код, написанный стажером в пятницу вечером😂
One thing that Telegram now offers to all users is the ability to “disappear” messages or set remote deletion deadlines. That enables users to have much more control over how long people can access what you’re sending them. Given that Russian law enforcement officials are reportedly (via Insider) stopping people in the street and demanding to read their text messages, this could be vital to protect individuals from reprisals. In the United States, Telegram's lower public profile has helped it mostly avoid high level scrutiny from Congress, but it has not gone unnoticed. "There are a lot of things that Telegram could have been doing this whole time. And they know exactly what they are and they've chosen not to do them. That's why I don't trust them," she said. "The argument from Telegram is, 'You should trust us because we tell you that we're trustworthy,'" Maréchal said. "It's really in the eye of the beholder whether that's something you want to buy into." Telegram has become more interventionist over time, and has steadily increased its efforts to shut down these accounts. But this has also meant that the company has also engaged with lawmakers more generally, although it maintains that it doesn’t do so willingly. For instance, in September 2021, Telegram reportedly blocked a chat bot in support of (Putin critic) Alexei Navalny during Russia’s most recent parliamentary elections. Pavel Durov was quoted at the time saying that the company was obliged to follow a “legitimate” law of the land. He added that as Apple and Google both follow the law, to violate it would give both platforms a reason to boot the messenger from its stores.
from ua