Telegram Group & Telegram Channel
Почему-то все обратили внимание на иск the New York Times к Microsoft и OpenAI, хотя по сути он является шаблонным требованием к сервису, который идет по стопам ранее поданных коллективных исков с общим посылом: артисты/журналисты/иллюстраторы творят историю и спасают мир от дезинформации, а OpenAI строит свой бизнес на воровстве чужой интеллектуальной собственности.

Не пытаясь умалять законность интересов NYT, а заодно не делая из OpenAI героев - надо снизить градус претензий и понять, что хочет NYT, и где мы находимся.

Ранее в этом году NYT обновила политики использования материалов на своем сайте. Теперь текст ToS прямо запрещает использование материалов для обучения алгоритмов.

Также в 2023 NYT подписала контракт на 100 млн долларов с Google, который позволяет поисковику размещать контент NYT на некоторых своих платформах в течение 3 лет.

Газета NYT решила не присоединяться к группе медиа, готовых вести переговоры с технологическими компаниями об использовании контента для обучения ИИ.

Сделку NYT и Google можно было трактовать как начало объединения поставщиков контента вокруг крупных игроков в сфере ИИ. Все логично: получать деньги за материалы, которые сейчас не используются - это идеальный расклад, особенно для теряющих популярность газет и глянца.

Собственно, об этом и пишет сама NYT в своем иске: чтобы писать качественные материалы - нужны деньги, алгоритмы отнимают деньги у газет. Но для контекста этой претензии надо понимать, а какой именно сегмент рынка отбирает алгоритм у газет? Алгоритмы и датасеты не обновляются ежесекундно, поэтому есть определенный лаг между теми новостями/статьями, которые выпускают газеты и тем контентом, который можно нагенерить в ChatGPT. Поэтому конкурировать с актуальными авторскими статьями алгоритм не может а находить информацию о других событиях равносильно поиску информации в поисковике.

Хотя нельзя спорить с тем, что данные NYT с большой вероятностью использовались в обучении, NYT все равно не может утверждать, что нарушены права на всё, и должен продемонстрировать конкретные примеры (частично в иске это было сделано). Пока мы придерживаемся стандарта доказывания нарушения авторских прав - абстрактное умозаключение не может быть положено в основу иска или решения суда, должны быть приведены доказательства использования и создания производных произведений (пока иск ссылается на данные исследований, где указано, что датасет Common Crawl содержит материалы с сайта газеты NYT).

Сейчас в качестве доказательства нарушения NYT ссылается на почти полное копирование статей 2019 и 2012 в выдаче GPT-4, с том числе и те, которые были за пэйволлом (aka платные), в Bing появлялись статьи сентября-октября 2023. Но ничего не мешало парсить эти же самые статьи в перепечатанном виде на других сайтах.

Я удивлена, что мало внимания было уделено false attribution - когда галлюцинации приписывали авторам NYT несуществующие статьи. Это теоретически причиняет компании больший репутационных вред, чем перепечатывание старых статей, при этом не очень понятно - считает ли NYT это недобросовестной конкуренцией или нарушением права на товарных знак (размытием).

В общей сложности NYT делает упор на нарушение авторского права (прямое и сопутствующее нарушения - использование материалов для обучения и создание сервиса для генерации производного контента), нарушение закона о защите конкуренции и правила товарный знак.

Примечательно, что NYT не обвиняет OpenAI и Microsoft в нарушении условий пользовательского соглашения.



group-telegram.com/vychislit_po_IP/3982
Create:
Last Update:

Почему-то все обратили внимание на иск the New York Times к Microsoft и OpenAI, хотя по сути он является шаблонным требованием к сервису, который идет по стопам ранее поданных коллективных исков с общим посылом: артисты/журналисты/иллюстраторы творят историю и спасают мир от дезинформации, а OpenAI строит свой бизнес на воровстве чужой интеллектуальной собственности.

Не пытаясь умалять законность интересов NYT, а заодно не делая из OpenAI героев - надо снизить градус претензий и понять, что хочет NYT, и где мы находимся.

Ранее в этом году NYT обновила политики использования материалов на своем сайте. Теперь текст ToS прямо запрещает использование материалов для обучения алгоритмов.

Также в 2023 NYT подписала контракт на 100 млн долларов с Google, который позволяет поисковику размещать контент NYT на некоторых своих платформах в течение 3 лет.

Газета NYT решила не присоединяться к группе медиа, готовых вести переговоры с технологическими компаниями об использовании контента для обучения ИИ.

Сделку NYT и Google можно было трактовать как начало объединения поставщиков контента вокруг крупных игроков в сфере ИИ. Все логично: получать деньги за материалы, которые сейчас не используются - это идеальный расклад, особенно для теряющих популярность газет и глянца.

Собственно, об этом и пишет сама NYT в своем иске: чтобы писать качественные материалы - нужны деньги, алгоритмы отнимают деньги у газет. Но для контекста этой претензии надо понимать, а какой именно сегмент рынка отбирает алгоритм у газет? Алгоритмы и датасеты не обновляются ежесекундно, поэтому есть определенный лаг между теми новостями/статьями, которые выпускают газеты и тем контентом, который можно нагенерить в ChatGPT. Поэтому конкурировать с актуальными авторскими статьями алгоритм не может а находить информацию о других событиях равносильно поиску информации в поисковике.

Хотя нельзя спорить с тем, что данные NYT с большой вероятностью использовались в обучении, NYT все равно не может утверждать, что нарушены права на всё, и должен продемонстрировать конкретные примеры (частично в иске это было сделано). Пока мы придерживаемся стандарта доказывания нарушения авторских прав - абстрактное умозаключение не может быть положено в основу иска или решения суда, должны быть приведены доказательства использования и создания производных произведений (пока иск ссылается на данные исследований, где указано, что датасет Common Crawl содержит материалы с сайта газеты NYT).

Сейчас в качестве доказательства нарушения NYT ссылается на почти полное копирование статей 2019 и 2012 в выдаче GPT-4, с том числе и те, которые были за пэйволлом (aka платные), в Bing появлялись статьи сентября-октября 2023. Но ничего не мешало парсить эти же самые статьи в перепечатанном виде на других сайтах.

Я удивлена, что мало внимания было уделено false attribution - когда галлюцинации приписывали авторам NYT несуществующие статьи. Это теоретически причиняет компании больший репутационных вред, чем перепечатывание старых статей, при этом не очень понятно - считает ли NYT это недобросовестной конкуренцией или нарушением права на товарных знак (размытием).

В общей сложности NYT делает упор на нарушение авторского права (прямое и сопутствующее нарушения - использование материалов для обучения и создание сервиса для генерации производного контента), нарушение закона о защите конкуренции и правила товарный знак.

Примечательно, что NYT не обвиняет OpenAI и Microsoft в нарушении условий пользовательского соглашения.

BY вычислить по IP


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/vychislit_po_IP/3982

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Now safely in France with his spouse and three of his children, Kliuchnikov scrolls through Telegram to learn about the devastation happening in his home country. "He has to start being more proactive and to find a real solution to this situation, not stay in standby without interfering. It's a very irresponsible position from the owner of Telegram," she said. That hurt tech stocks. For the past few weeks, the 10-year yield has traded between 1.72% and 2%, as traders moved into the bond for safety when Russia headlines were ugly—and out of it when headlines improved. Now, the yield is touching its pandemic-era high. If the yield breaks above that level, that could signal that it’s on a sustainable path higher. Higher long-dated bond yields make future profits less valuable—and many tech companies are valued on the basis of profits forecast for many years in the future. The S&P 500 fell 1.3% to 4,204.36, and the Dow Jones Industrial Average was down 0.7% to 32,943.33. The Dow posted a fifth straight weekly loss — its longest losing streak since 2019. The Nasdaq Composite tumbled 2.2% to 12,843.81. Though all three indexes opened in the green, stocks took a turn after a new report showed U.S. consumer sentiment deteriorated more than expected in early March as consumers' inflation expectations soared to the highest since 1981. The account, "War on Fakes," was created on February 24, the same day Russian President Vladimir Putin announced a "special military operation" and troops began invading Ukraine. The page is rife with disinformation, according to The Atlantic Council's Digital Forensic Research Lab, which studies digital extremism and published a report examining the channel.
from us


Telegram вычислить по IP
FROM American