group-telegram.com/vychislit_po_IP/3982
Last Update:
Почему-то все обратили внимание на иск the New York Times к Microsoft и OpenAI, хотя по сути он является шаблонным требованием к сервису, который идет по стопам ранее поданных коллективных исков с общим посылом: артисты/журналисты/иллюстраторы творят историю и спасают мир от дезинформации, а OpenAI строит свой бизнес на воровстве чужой интеллектуальной собственности.
Не пытаясь умалять законность интересов NYT, а заодно не делая из OpenAI героев - надо снизить градус претензий и понять, что хочет NYT, и где мы находимся.
Ранее в этом году NYT обновила политики использования материалов на своем сайте. Теперь текст ToS прямо запрещает использование материалов для обучения алгоритмов.
Также в 2023 NYT подписала контракт на 100 млн долларов с Google, который позволяет поисковику размещать контент NYT на некоторых своих платформах в течение 3 лет.
Газета NYT решила не присоединяться к группе медиа, готовых вести переговоры с технологическими компаниями об использовании контента для обучения ИИ.
Сделку NYT и Google можно было трактовать как начало объединения поставщиков контента вокруг крупных игроков в сфере ИИ. Все логично: получать деньги за материалы, которые сейчас не используются - это идеальный расклад, особенно для теряющих популярность газет и глянца.
Собственно, об этом и пишет сама NYT в своем иске: чтобы писать качественные материалы - нужны деньги, алгоритмы отнимают деньги у газет. Но для контекста этой претензии надо понимать, а какой именно сегмент рынка отбирает алгоритм у газет? Алгоритмы и датасеты не обновляются ежесекундно, поэтому есть определенный лаг между теми новостями/статьями, которые выпускают газеты и тем контентом, который можно нагенерить в ChatGPT. Поэтому конкурировать с актуальными авторскими статьями алгоритм не может а находить информацию о других событиях равносильно поиску информации в поисковике.
Хотя нельзя спорить с тем, что данные NYT с большой вероятностью использовались в обучении, NYT все равно не может утверждать, что нарушены права на всё, и должен продемонстрировать конкретные примеры (частично в иске это было сделано). Пока мы придерживаемся стандарта доказывания нарушения авторских прав - абстрактное умозаключение не может быть положено в основу иска или решения суда, должны быть приведены доказательства использования и создания производных произведений (пока иск ссылается на данные исследований, где указано, что датасет Common Crawl содержит материалы с сайта газеты NYT).
Сейчас в качестве доказательства нарушения NYT ссылается на почти полное копирование статей 2019 и 2012 в выдаче GPT-4, с том числе и те, которые были за пэйволлом (aka платные), в Bing появлялись статьи сентября-октября 2023. Но ничего не мешало парсить эти же самые статьи в перепечатанном виде на других сайтах.
Я удивлена, что мало внимания было уделено false attribution - когда галлюцинации приписывали авторам NYT несуществующие статьи. Это теоретически причиняет компании больший репутационных вред, чем перепечатывание старых статей, при этом не очень понятно - считает ли NYT это недобросовестной конкуренцией или нарушением права на товарных знак (размытием).
В общей сложности NYT делает упор на нарушение авторского права (прямое и сопутствующее нарушения - использование материалов для обучения и создание сервиса для генерации производного контента), нарушение закона о защите конкуренции и правила товарный знак.
Примечательно, что NYT не обвиняет OpenAI и Microsoft в нарушении условий пользовательского соглашения.
BY вычислить по IP
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
Share with your friend now:
group-telegram.com/vychislit_po_IP/3982