Telegram Group & Telegram Channel
Почему-то все обратили внимание на иск the New York Times к Microsoft и OpenAI, хотя по сути он является шаблонным требованием к сервису, который идет по стопам ранее поданных коллективных исков с общим посылом: артисты/журналисты/иллюстраторы творят историю и спасают мир от дезинформации, а OpenAI строит свой бизнес на воровстве чужой интеллектуальной собственности.

Не пытаясь умалять законность интересов NYT, а заодно не делая из OpenAI героев - надо снизить градус претензий и понять, что хочет NYT, и где мы находимся.

Ранее в этом году NYT обновила политики использования материалов на своем сайте. Теперь текст ToS прямо запрещает использование материалов для обучения алгоритмов.

Также в 2023 NYT подписала контракт на 100 млн долларов с Google, который позволяет поисковику размещать контент NYT на некоторых своих платформах в течение 3 лет.

Газета NYT решила не присоединяться к группе медиа, готовых вести переговоры с технологическими компаниями об использовании контента для обучения ИИ.

Сделку NYT и Google можно было трактовать как начало объединения поставщиков контента вокруг крупных игроков в сфере ИИ. Все логично: получать деньги за материалы, которые сейчас не используются - это идеальный расклад, особенно для теряющих популярность газет и глянца.

Собственно, об этом и пишет сама NYT в своем иске: чтобы писать качественные материалы - нужны деньги, алгоритмы отнимают деньги у газет. Но для контекста этой претензии надо понимать, а какой именно сегмент рынка отбирает алгоритм у газет? Алгоритмы и датасеты не обновляются ежесекундно, поэтому есть определенный лаг между теми новостями/статьями, которые выпускают газеты и тем контентом, который можно нагенерить в ChatGPT. Поэтому конкурировать с актуальными авторскими статьями алгоритм не может а находить информацию о других событиях равносильно поиску информации в поисковике.

Хотя нельзя спорить с тем, что данные NYT с большой вероятностью использовались в обучении, NYT все равно не может утверждать, что нарушены права на всё, и должен продемонстрировать конкретные примеры (частично в иске это было сделано). Пока мы придерживаемся стандарта доказывания нарушения авторских прав - абстрактное умозаключение не может быть положено в основу иска или решения суда, должны быть приведены доказательства использования и создания производных произведений (пока иск ссылается на данные исследований, где указано, что датасет Common Crawl содержит материалы с сайта газеты NYT).

Сейчас в качестве доказательства нарушения NYT ссылается на почти полное копирование статей 2019 и 2012 в выдаче GPT-4, с том числе и те, которые были за пэйволлом (aka платные), в Bing появлялись статьи сентября-октября 2023. Но ничего не мешало парсить эти же самые статьи в перепечатанном виде на других сайтах.

Я удивлена, что мало внимания было уделено false attribution - когда галлюцинации приписывали авторам NYT несуществующие статьи. Это теоретически причиняет компании больший репутационных вред, чем перепечатывание старых статей, при этом не очень понятно - считает ли NYT это недобросовестной конкуренцией или нарушением права на товарных знак (размытием).

В общей сложности NYT делает упор на нарушение авторского права (прямое и сопутствующее нарушения - использование материалов для обучения и создание сервиса для генерации производного контента), нарушение закона о защите конкуренции и правила товарный знак.

Примечательно, что NYT не обвиняет OpenAI и Microsoft в нарушении условий пользовательского соглашения.



group-telegram.com/vychislit_po_IP/3982
Create:
Last Update:

Почему-то все обратили внимание на иск the New York Times к Microsoft и OpenAI, хотя по сути он является шаблонным требованием к сервису, который идет по стопам ранее поданных коллективных исков с общим посылом: артисты/журналисты/иллюстраторы творят историю и спасают мир от дезинформации, а OpenAI строит свой бизнес на воровстве чужой интеллектуальной собственности.

Не пытаясь умалять законность интересов NYT, а заодно не делая из OpenAI героев - надо снизить градус претензий и понять, что хочет NYT, и где мы находимся.

Ранее в этом году NYT обновила политики использования материалов на своем сайте. Теперь текст ToS прямо запрещает использование материалов для обучения алгоритмов.

Также в 2023 NYT подписала контракт на 100 млн долларов с Google, который позволяет поисковику размещать контент NYT на некоторых своих платформах в течение 3 лет.

Газета NYT решила не присоединяться к группе медиа, готовых вести переговоры с технологическими компаниями об использовании контента для обучения ИИ.

Сделку NYT и Google можно было трактовать как начало объединения поставщиков контента вокруг крупных игроков в сфере ИИ. Все логично: получать деньги за материалы, которые сейчас не используются - это идеальный расклад, особенно для теряющих популярность газет и глянца.

Собственно, об этом и пишет сама NYT в своем иске: чтобы писать качественные материалы - нужны деньги, алгоритмы отнимают деньги у газет. Но для контекста этой претензии надо понимать, а какой именно сегмент рынка отбирает алгоритм у газет? Алгоритмы и датасеты не обновляются ежесекундно, поэтому есть определенный лаг между теми новостями/статьями, которые выпускают газеты и тем контентом, который можно нагенерить в ChatGPT. Поэтому конкурировать с актуальными авторскими статьями алгоритм не может а находить информацию о других событиях равносильно поиску информации в поисковике.

Хотя нельзя спорить с тем, что данные NYT с большой вероятностью использовались в обучении, NYT все равно не может утверждать, что нарушены права на всё, и должен продемонстрировать конкретные примеры (частично в иске это было сделано). Пока мы придерживаемся стандарта доказывания нарушения авторских прав - абстрактное умозаключение не может быть положено в основу иска или решения суда, должны быть приведены доказательства использования и создания производных произведений (пока иск ссылается на данные исследований, где указано, что датасет Common Crawl содержит материалы с сайта газеты NYT).

Сейчас в качестве доказательства нарушения NYT ссылается на почти полное копирование статей 2019 и 2012 в выдаче GPT-4, с том числе и те, которые были за пэйволлом (aka платные), в Bing появлялись статьи сентября-октября 2023. Но ничего не мешало парсить эти же самые статьи в перепечатанном виде на других сайтах.

Я удивлена, что мало внимания было уделено false attribution - когда галлюцинации приписывали авторам NYT несуществующие статьи. Это теоретически причиняет компании больший репутационных вред, чем перепечатывание старых статей, при этом не очень понятно - считает ли NYT это недобросовестной конкуренцией или нарушением права на товарных знак (размытием).

В общей сложности NYT делает упор на нарушение авторского права (прямое и сопутствующее нарушения - использование материалов для обучения и создание сервиса для генерации производного контента), нарушение закона о защите конкуренции и правила товарный знак.

Примечательно, что NYT не обвиняет OpenAI и Microsoft в нарушении условий пользовательского соглашения.

BY вычислить по IP


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/vychislit_po_IP/3982

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

What distinguishes the app from competitors is its use of what's known as channels: Public or private feeds of photos and videos that can be set up by one person or an organization. The channels have become popular with on-the-ground journalists, aid workers and Ukrainian President Volodymyr Zelenskyy, who broadcasts on a Telegram channel. The channels can be followed by an unlimited number of people. Unlike Facebook, Twitter and other popular social networks, there is no advertising on Telegram and the flow of information is not driven by an algorithm. The regulator said it had received information that messages containing stock tips and other investment advice with respect to selected listed companies are being widely circulated through websites and social media platforms such as Telegram, Facebook, WhatsApp and Instagram. The message was not authentic, with the real Zelenskiy soon denying the claim on his official Telegram channel, but the incident highlighted a major problem: disinformation quickly spreads unchecked on the encrypted app. Asked about its stance on disinformation, Telegram spokesperson Remi Vaughn told AFP: "As noted by our CEO, the sheer volume of information being shared on channels makes it extremely difficult to verify, so it's important that users double-check what they read." In this regard, Sebi collaborated with the Telecom Regulatory Authority of India (TRAI) to reduce the vulnerability of the securities market to manipulation through misuse of mass communication medium like bulk SMS.
from no


Telegram вычислить по IP
FROM American