group-telegram.com/underpyar/5855
Last Update:
Узнали совершенно случайно, что с боем курантов истек срок охраны авторских прав на «Голубую рапсодию» Джорджа Гершвина, мультики про Микки Мауса и фильм «Шантаж» Альфреда Хичкока, который, кстати, был одним из первых звуковых фильмов в истории.
Сегодня срок действия авторских прав составляет всю жизнь автора произведения плюс 70 лет. И это вообще-то вопрос довольно актуальный, потому что многие крупные языковые модели уже переработали все доступные им тексты, но обучать новые версии становится все сложнее.
И пока весь мир спорит, что круче ChatGPT или DeepSeek, у нас есть вопросик. Если современные ИИ-модели обучаются на огромных объемах данных, на чем будут обучаться будущие поколения нейросетей? На первый взгляд кажется, что информации в интернете предостаточно, но если копнуть поглубже, то оказывается, что за данные нужно платить, потому что принадлежат частным компаниям и издательствам.
Книги, научные статьи, исследования — все это либо платно, либо защищено авторским правом. Это означает, что большая часть действительно ценных знаний недоступна для массового использования в обучении ИИ. А если новые модели будут обучаться на данных, уже переработанных предыдущими ИИ, это приведет к шизоидным ответам, генерируемым внутри самих нейросетей.
Это только кажется, что в интернете есть вообще все, только попроси. Вспоминаем громкий судебный процесс в декабре 2023 года, который New York Times инициировала против OpenAI и Microsoft, обвинив их в незаконном использовании миллионов статей для обучения чат-ботов. Кстати, главный свидетель по делу, бывший сотрудник OpenAI, утверждавший, что компания не соблюдала авторские права, таинственным образом умер в конце прошлого года.
Вспомним также трехмесячную забастовку сценаристов в Голливуде в том же 2023-м.
Кажется нам, что нас ждет еще много скандалов на эту тему.