Telegram Group & Telegram Channel
Почему-то все обратили внимание на иск the New York Times к Microsoft и OpenAI, хотя по сути он является шаблонным требованием к сервису, который идет по стопам ранее поданных коллективных исков с общим посылом: артисты/журналисты/иллюстраторы творят историю и спасают мир от дезинформации, а OpenAI строит свой бизнес на воровстве чужой интеллектуальной собственности.

Не пытаясь умалять законность интересов NYT, а заодно не делая из OpenAI героев - надо снизить градус претензий и понять, что хочет NYT, и где мы находимся.

Ранее в этом году NYT обновила политики использования материалов на своем сайте. Теперь текст ToS прямо запрещает использование материалов для обучения алгоритмов.

Также в 2023 NYT подписала контракт на 100 млн долларов с Google, который позволяет поисковику размещать контент NYT на некоторых своих платформах в течение 3 лет.

Газета NYT решила не присоединяться к группе медиа, готовых вести переговоры с технологическими компаниями об использовании контента для обучения ИИ.

Сделку NYT и Google можно было трактовать как начало объединения поставщиков контента вокруг крупных игроков в сфере ИИ. Все логично: получать деньги за материалы, которые сейчас не используются - это идеальный расклад, особенно для теряющих популярность газет и глянца.

Собственно, об этом и пишет сама NYT в своем иске: чтобы писать качественные материалы - нужны деньги, алгоритмы отнимают деньги у газет. Но для контекста этой претензии надо понимать, а какой именно сегмент рынка отбирает алгоритм у газет? Алгоритмы и датасеты не обновляются ежесекундно, поэтому есть определенный лаг между теми новостями/статьями, которые выпускают газеты и тем контентом, который можно нагенерить в ChatGPT. Поэтому конкурировать с актуальными авторскими статьями алгоритм не может а находить информацию о других событиях равносильно поиску информации в поисковике.

Хотя нельзя спорить с тем, что данные NYT с большой вероятностью использовались в обучении, NYT все равно не может утверждать, что нарушены права на всё, и должен продемонстрировать конкретные примеры (частично в иске это было сделано). Пока мы придерживаемся стандарта доказывания нарушения авторских прав - абстрактное умозаключение не может быть положено в основу иска или решения суда, должны быть приведены доказательства использования и создания производных произведений (пока иск ссылается на данные исследований, где указано, что датасет Common Crawl содержит материалы с сайта газеты NYT).

Сейчас в качестве доказательства нарушения NYT ссылается на почти полное копирование статей 2019 и 2012 в выдаче GPT-4, с том числе и те, которые были за пэйволлом (aka платные), в Bing появлялись статьи сентября-октября 2023. Но ничего не мешало парсить эти же самые статьи в перепечатанном виде на других сайтах.

Я удивлена, что мало внимания было уделено false attribution - когда галлюцинации приписывали авторам NYT несуществующие статьи. Это теоретически причиняет компании больший репутационных вред, чем перепечатывание старых статей, при этом не очень понятно - считает ли NYT это недобросовестной конкуренцией или нарушением права на товарных знак (размытием).

В общей сложности NYT делает упор на нарушение авторского права (прямое и сопутствующее нарушения - использование материалов для обучения и создание сервиса для генерации производного контента), нарушение закона о защите конкуренции и правила товарный знак.

Примечательно, что NYT не обвиняет OpenAI и Microsoft в нарушении условий пользовательского соглашения.



group-telegram.com/vychislit_po_IP/3982
Create:
Last Update:

Почему-то все обратили внимание на иск the New York Times к Microsoft и OpenAI, хотя по сути он является шаблонным требованием к сервису, который идет по стопам ранее поданных коллективных исков с общим посылом: артисты/журналисты/иллюстраторы творят историю и спасают мир от дезинформации, а OpenAI строит свой бизнес на воровстве чужой интеллектуальной собственности.

Не пытаясь умалять законность интересов NYT, а заодно не делая из OpenAI героев - надо снизить градус претензий и понять, что хочет NYT, и где мы находимся.

Ранее в этом году NYT обновила политики использования материалов на своем сайте. Теперь текст ToS прямо запрещает использование материалов для обучения алгоритмов.

Также в 2023 NYT подписала контракт на 100 млн долларов с Google, который позволяет поисковику размещать контент NYT на некоторых своих платформах в течение 3 лет.

Газета NYT решила не присоединяться к группе медиа, готовых вести переговоры с технологическими компаниями об использовании контента для обучения ИИ.

Сделку NYT и Google можно было трактовать как начало объединения поставщиков контента вокруг крупных игроков в сфере ИИ. Все логично: получать деньги за материалы, которые сейчас не используются - это идеальный расклад, особенно для теряющих популярность газет и глянца.

Собственно, об этом и пишет сама NYT в своем иске: чтобы писать качественные материалы - нужны деньги, алгоритмы отнимают деньги у газет. Но для контекста этой претензии надо понимать, а какой именно сегмент рынка отбирает алгоритм у газет? Алгоритмы и датасеты не обновляются ежесекундно, поэтому есть определенный лаг между теми новостями/статьями, которые выпускают газеты и тем контентом, который можно нагенерить в ChatGPT. Поэтому конкурировать с актуальными авторскими статьями алгоритм не может а находить информацию о других событиях равносильно поиску информации в поисковике.

Хотя нельзя спорить с тем, что данные NYT с большой вероятностью использовались в обучении, NYT все равно не может утверждать, что нарушены права на всё, и должен продемонстрировать конкретные примеры (частично в иске это было сделано). Пока мы придерживаемся стандарта доказывания нарушения авторских прав - абстрактное умозаключение не может быть положено в основу иска или решения суда, должны быть приведены доказательства использования и создания производных произведений (пока иск ссылается на данные исследований, где указано, что датасет Common Crawl содержит материалы с сайта газеты NYT).

Сейчас в качестве доказательства нарушения NYT ссылается на почти полное копирование статей 2019 и 2012 в выдаче GPT-4, с том числе и те, которые были за пэйволлом (aka платные), в Bing появлялись статьи сентября-октября 2023. Но ничего не мешало парсить эти же самые статьи в перепечатанном виде на других сайтах.

Я удивлена, что мало внимания было уделено false attribution - когда галлюцинации приписывали авторам NYT несуществующие статьи. Это теоретически причиняет компании больший репутационных вред, чем перепечатывание старых статей, при этом не очень понятно - считает ли NYT это недобросовестной конкуренцией или нарушением права на товарных знак (размытием).

В общей сложности NYT делает упор на нарушение авторского права (прямое и сопутствующее нарушения - использование материалов для обучения и создание сервиса для генерации производного контента), нарушение закона о защите конкуренции и правила товарный знак.

Примечательно, что NYT не обвиняет OpenAI и Microsoft в нарушении условий пользовательского соглашения.

BY вычислить по IP


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/vychislit_po_IP/3982

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"There are a lot of things that Telegram could have been doing this whole time. And they know exactly what they are and they've chosen not to do them. That's why I don't trust them," she said. Just days after Russia invaded Ukraine, Durov wrote that Telegram was "increasingly becoming a source of unverified information," and he worried about the app being used to "incite ethnic hatred." Russian President Vladimir Putin launched Russia's invasion of Ukraine in the early-morning hours of February 24, targeting several key cities with military strikes. If you initiate a Secret Chat, however, then these communications are end-to-end encrypted and are tied to the device you are using. That means it’s less convenient to access them across multiple platforms, but you are at far less risk of snooping. Back in the day, Secret Chats received some praise from the EFF, but the fact that its standard system isn’t as secure earned it some criticism. If you’re looking for something that is considered more reliable by privacy advocates, then Signal is the EFF’s preferred platform, although that too is not without some caveats. And indeed, volatility has been a hallmark of the market environment so far in 2022, with the S&P 500 still down more than 10% for the year-to-date after first sliding into a correction last month. The CBOE Volatility Index, or VIX, has held at a lofty level of more than 30.
from tr


Telegram вычислить по IP
FROM American