Почему-то все обратили внимание на иск the New York Times к Microsoft и OpenAI

вычислить по IP

Почему-то все обратили внимание на иск the New York Times к Microsoft и OpenAI, хотя по сути он является шаблонным требованием к сервису, который идет по стопам ранее поданных коллективных исков с общим посылом: артисты/журналисты/иллюстраторы творят историю и спасают мир от дезинформации, а OpenAI строит свой бизнес на воровстве чужой интеллектуальной собственности.

Не пытаясь умалять законность интересов NYT, а заодно не делая из OpenAI героев - надо снизить градус претензий и понять, что хочет NYT, и где мы находимся.

Ранее в этом году NYT обновила политики использования материалов на своем сайте. Теперь текст ToS прямо запрещает использование материалов для обучения алгоритмов.

Также в 2023 NYT подписала контракт на 100 млн долларов с Google, который позволяет поисковику размещать контент NYT на некоторых своих платформах в течение 3 лет.

Газета NYT решила не присоединяться к группе медиа, готовых вести переговоры с технологическими компаниями об использовании контента для обучения ИИ.

Сделку NYT и Google можно было трактовать как начало объединения поставщиков контента вокруг крупных игроков в сфере ИИ. Все логично: получать деньги за материалы, которые сейчас не используются - это идеальный расклад, особенно для теряющих популярность газет и глянца.

Собственно, об этом и пишет сама NYT в своем иске: чтобы писать качественные материалы - нужны деньги, алгоритмы отнимают деньги у газет. Но для контекста этой претензии надо понимать, а какой именно сегмент рынка отбирает алгоритм у газет? Алгоритмы и датасеты не обновляются ежесекундно, поэтому есть определенный лаг между теми новостями/статьями, которые выпускают газеты и тем контентом, который можно нагенерить в ChatGPT. Поэтому конкурировать с актуальными авторскими статьями алгоритм не может а находить информацию о других событиях равносильно поиску информации в поисковике.

Хотя нельзя спорить с тем, что данные NYT с большой вероятностью использовались в обучении, NYT все равно не может утверждать, что нарушены права на всё, и должен продемонстрировать конкретные примеры (частично в иске это было сделано). Пока мы придерживаемся стандарта доказывания нарушения авторских прав - абстрактное умозаключение не может быть положено в основу иска или решения суда, должны быть приведены доказательства использования и создания производных произведений (пока иск ссылается на данные исследований, где указано, что датасет Common Crawl содержит материалы с сайта газеты NYT).

Сейчас в качестве доказательства нарушения NYT ссылается на почти полное копирование статей 2019 и 2012 в выдаче GPT-4, с том числе и те, которые были за пэйволлом (aka платные), в Bing появлялись статьи сентября-октября 2023. Но ничего не мешало парсить эти же самые статьи в перепечатанном виде на других сайтах.

Я удивлена, что мало внимания было уделено false attribution - когда галлюцинации приписывали авторам NYT несуществующие статьи. Это теоретически причиняет компании больший репутационных вред, чем перепечатывание старых статей, при этом не очень понятно - считает ли NYT это недобросовестной конкуренцией или нарушением права на товарных знак (размытием).

В общей сложности NYT делает упор на нарушение авторского права (прямое и сопутствующее нарушения - использование материалов для обучения и создание сервиса для генерации производного контента), нарушение закона о защите конкуренции и правила товарный знак.

Примечательно, что NYT не обвиняет OpenAI и Microsoft в нарушении условий пользовательского соглашения.

www.group-telegram.com/cn/vychislit_po_IP.com/3982

1.8K viewsAnastasia Skovpen, Dec 29, 2023 at 13:05

group-telegram.com/vychislit_po_IP/3982

Create: 2023-12-29
Last Update: 2024-12-20 07:58:41

BY вычислить по IP

Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/vychislit_po_IP/3982

Telegram | DID YOU KNOW?

Почему-то все обратили внимание на иск the New York Times к Microsoft и OpenAI