Вы не вошли.
Тред для обсуждения прогресса в области машинного обучения и разработок ИИ, включая нейронки (но не ограничиваясь). Перетираем за технологии, юридические тонкости, этические проблемы и потенциальные последствия для экономики и социума. Дискуссии приветствуются, но давайте всё-таки без срачей, а то научим ещё Скайнет плохому.
Гости не могут голосовать
Почему тогда они в суд подают?
Она обучена на кусках кода, которые проходят под лицензией (видов лицензий у погромистов много) и авторы gpt не скрывали.
Насколько я вижу: есть желание отсечь инцидент использования кода не по назначению.
Плюс, опасность выхода куска кода из-под лицензии.
(если я написал кусок, защищённый лицухой, и другой прогер просто случайно написал такой же и опубликовал под другой лицухой — это законно. Если он его скопипастил — не законно.
Но что делать, если этот кусок кода сгенерировала сеть?
Учитывая, что в отличии от генерации артов, где много средневзвешенных решений и/или преображений, при генерации программ гораздо больше просто явных кусков, которые скопированы откуда-то существует возможность, что правильным запросом можно получить тупо копию чьего-то кода)
Учитывая, что в отличии от генерации артов, где много средневзвешенных решений и/или преображений, при генерации программ гораздо больше просто явных кусков, которые скопированы откуда-то существует возможность, что правильным запросом можно получить тупо копию чьего-то кода)
Это заметнее только потому, что разновидностей символов, которыми пишется код, технически меньше, чем может быть разновидностей мазков или штрихов.
А по факту нейро-арты точно так же часто выдают целиковые куски закопирайченых изображений. Например:
Алгоритм немного искажает куски, но с т.з. возможного судебного преследования это дела не меняет: а то так любой мог бы немного сплющить микки мауса, подтянуть цвета и продавать как нечто свое.
В общем, технология там идентичная, так что от решения по делу копилота зависит судьба большинства современных нейросеток.
ЧСХ они и сами уже понимают, что нарушают закон: например в новой версии stable diffusion уже меньше авторских работ и нельзя использовать некоторые имена художников, и они пошли на это несмотря на то, что такая сборка менее эффективна.
Отредактировано (2022-12-18 20:27:20)
А по факту нейро-арты точно так же часто выдают целиковые куски закопирайченых изображений.
Анон!! Я подозревал оч сильно, но никак не находил примеры. Спасибо, что внес
Анон!! Я подозревал оч сильно, но никак не находил примеры. Спасибо, что внес
А мне не видно((
А мне не видно((
Картинки или сходство?
Картинки или сходство?
Картинки. Но теперь почему-то видно. Может с интернетом что-то было.
Она обучена на кусках кода, которые проходят под лицензией (видов лицензий у погромистов много) и авторы gpt не скрывали.
Речь не про gpt, а про copilot.
Речь не про gpt, а про copilot.
Ссорян, оговорился.
Копайлот — это гпт, обученная на гитхабе
Анон пишет:Речь не про gpt, а про copilot.
Ссорян, оговорился.
Копайлот — это гпт, обученная на гитхабе
▼с вики⬍
В общем проблема не в самих нейросетках, а в легальности их датасетов.
Пока все движения официальных организаций и крупных корпораций указывают на то, что датасеты, набранные с нарушениями копирайта и частной информации рано или поздно начнут банить.
Но если забанить LAION-5B, то и midjourney, и lensa и другие компании, продающие услуги по генерации изображений, мгновенно превратятся в тыкву. Интересно, как все разрулится...
В общем проблема не в самих нейросетках, а в легальности их датасетов.
Как анон, работавший с нейронками, да.
Причем реально все ок было и все сами датасеты собирали, кроме прям совсем отшибленных.
Когда пошла эта мода на кроулинг по чужим рандомным вещам, я реально охуел. А когда пошла любви к сеткам, обученным на этих сетах, я прям охуел ещё раз и до сих пор не выхуиваю, как у людей ничего не щёлкает.
Я ещё фигею с того, что люди тащат в датасеты все, что попало, и пытаются модерировать запросы, чтобы результате ничего странного не выпало.
Интересно, как все разрулится...
Я б просто признал датасеты частью ПО. Кмк, звучит логично.
Есть проблема с самообучающимися моделями (которые продолжают обучение после релиза), но с ними столько проблем, что мы до них ещё лет 5-10 не дойдём.
Я б просто признал датасеты частью ПО. Кмк, звучит логично.
Звучит логично, всё-таки нейросети очень зависят от датасета, но я не очень разбираюсь в копирайте для по.
Это же должно по идее убрать лазейку с нон-профит датасетом, в который гребнем что попало, и отдельно компанией, которая разрабатывает ии и как бы не при делах?
Все лазейки никак не убрать. Частник-физик имеет право какие угодно картинки у себя на компе собирать, и сделать краудфандинг на датасет и выложить любую модель тоже. Будут кикстартеры или просто сборы денег на реддите, будут модели от больших компаний которые не используют копирайт-материалы (но которые легко дотренировать на современных художниках). Китайцы еще, которым посрать на копирайты
Все лазейки никак не убрать. Частник-физик имеет право какие угодно картинки у себя на компе собирать, и сделать краудфандинг на датасет и выложить любую модель тоже
Windows oleg тоже доступен для скачивания, несмотря на то что там почти полный копипаст лицухи.
Это даже для ПО неидеальнвй способ.
Частник-физик при этом, если его датасет включает себя закопирайченых материал, не имел права его делать.
Если датасет нейронки будет считаться частью ПО, то не будет у частника и права на чужом обучать.
Возможность будет, да, а права нет.
Ну и скачать так много картинок частнику тоже сложно. Сайты следят за ботами для выкачки ещё со времен, когда фейсбук собирал данные с майспейс.
(на фб в давней древности была кнопка "перенести профиль" и фб автоматически скачивал всю историю юзера с мс. Примерно как дыбр и дайри).
будут модели от больших компаний которые не используют копирайт-материалы (но которые легко дотренировать на современных художниках).
Это да, но, следи за руками, правонарушение совершит человек, который дообучил на чужих рисунках. И можно будет попросить выпилить работы нейронки, если докажешь, что это именно на тебе дообучались.
Ну и обучение на такая простая штука, как кажется, все-таки сейчас в основном выкладывают найроарты люди, которые просто запрос умеют написать. А тут надо скачать всю сеть, иметь неплохую видюху, etc.
Дырки останутся, да. Идеальных решений в защите прав и борьбе с пиратством ещё никто не нашёл.
Но моё предложение хотя бы переводит действия сбора в разряд менее легальных и даёт правовую основу для исков.
Это да, но, следи за руками, правонарушение совершит человек, который дообучил на чужих рисунках. И можно будет попросить выпилить работы нейронки, если докажешь, что это именно на тебе дообучались.
Не докажешь что он не сам рисовал. Даже если нейронки обяжут вшивать в результат что-то, а китайских и пиратских нейронок не будет, можно просто сделать скриншот полученной картинки/немного дорисовать/перевести из одного формата в другой
Не докажешь что он не сам рисовал.
Кстати по поводу сам рисовал/ не сам.
https://www.cbr.com/comics-industry-col … art-usage/
Редактор, одной из комикс компании, пишет:
"If you submit AI art to me in an attempt to get work and I find out, I'll do everything in my power to make sure you're blackballed from the comics industry. There's no room for frauds in this industry."
(Если вы отправите ии арт в попытке получить работу и я узнаю, я сделаю все что в моих силах чтобы убедиться, что вы внесены в черный список комикс-индустрии)
Судя по статье, многие с ним согласны.
Ну и как бы доказать сложно, только если человек сам рисует на уровне. Иначе он без нейросети просто ничего не сможет.
Отредактировано (2022-12-19 11:44:29)
Кстати по поводу сам рисовал/ не сам.
Анон, это всё актуально и страшно только для тех, кто уже в индустрии, а толпе AI-художников нечего терять, вчера они вообще ничего не могли изобразить и никак на этом заработать. Фурри/аниме комишки? Заебись! Инди-игры? Супер! Я работал на инди-игру где основатель потратил $100к из своего кармана на арты, он лучше бы потратил $10к, ему было бы похуй что AI, тем более она даже не вышла в итоге
Ну и как бы доказать сложно, только если человек сам рисует на уровне. Иначе он без нейросети просто ничего не сможет.
Доказать в плане пошеймить - может быть, доказать в суде - нереально
И еще есть такой момент - многие концептщики/фотобашеры тоже не умеют рисовать от руки, особенно на уровне того что выкладывают (был какой-то концептщик у которого по старым работам это хорошо видно).
Отредактировано (2022-12-19 11:54:06)
Фурри/аниме комишки? Заебись! Инди-игры? Супер!
А потом заказчик просит что-то поменять и рисунок превращается в тыкву.
Это не считаю того, что если нейросетки станут действительно общедоступными, то никто и не придет к ним с комишками, печатать все умеют.
А потом заказчик просит что-то поменять и рисунок превращается в тыкву.
Это миф, inpaint или генерация с тем же сидом но немного другим промптом. Или просто полностью новая картинка. Что-то можно и от руки, минимальные навыки обмазки у многих есть
Это не считаю того, что если нейросетки станут действительно общедоступными, то никто и не придет к ним с комишками, печатать все умеют.
Кто-то не придет, а кто-то придет. Есть сервисы для создания сайтов без кодинга (тильда и пр.), но некоторые пользуются ими не напрямую а нанимают "no-code разработчиков"
Ну и как бы доказать сложно, только если человек сам рисует на уровне. Иначе он без нейросети просто ничего не сможет.
Даже чтобы суметь с нейросетью, должен быть какой-то уровень. Очень редко бывают люди без опыта рисования\образования, которые замечают косяки сетки\художника и понимают где именно надо исправить, чтобы вся картинка стала лучше.
Кмк рисование это зачастую очень часто "я представил картинку, а потом начал исправлять те части листа, где не похоже на картинку в моей голове". Чтобы рисовать хорошо надо в первую очередь знать где исправить, и только потом – как.
Я вообще зарабатываю рисованием (я, если что, не супер против нейросетей, они могут быть очень полезны, я бы с удовольствием обучил сеть на собственных рисунках и потом обрабатывал собственные фотографии (или свободные для использования изображения) чтобы помогать себе с флагами, но необходимо продумать регуляцию этого дела), но даже мне не супер легко видоизменять результаты нейросетей, я специально пробовал из интереса. Даже тупо кисти, которые будут стопроцентно вписываться в весь остальной рисунок, подобрать не так уж и просто, не говоря уж о самом процессе. Уметь рисовать для этого все равно нужно, иначе рано или поздно спалишься
Больше чем фурри-коммишки, меня больше беспокоят сраные текстовые сетки.
Понятно, что это не вина сеток, но на них можно быстро и недорого генерить контент, который кажется осмысленным.
Сейчас этим и так занимаются копирайтеры, и происходит постоянно захламление всего и вся этими текстами с бесконечным перепечатыванием самих себя, из-за которого найти ничего нового или даже не совсем стандартного по теме вообще невозможно.
Если их станет можно генерить десятками в один клик по запросу компании, я вообще вырублю гугл, яндекс и уйду в поисковики, которые ищут только старые сайты\сайты без js.
Все лазейки никак не убрать. Частник-физик имеет право какие угодно картинки у себя на компе собирать,
Но не сможет их монетизировать, а при хорошем раскладе даже публиковать где-то кроме сайтов-помоек типа форчана.
сделать краудфандинг на датасет и выложить любую модель тоже. Будут кикстартеры или просто сборы денег на реддите
И снова нет, потому что любые платформы для краудфандинга (и вообще монетизации) будут удалять материалы, нарушающие закон.
будут модели от больших компаний которые не используют копирайт-материалы (но которые легко дотренировать на современных художниках
Вот тут придется за руку ловить, но если поймают, то так же на выпил из публичного пространства, а настроения общества такие, что ловить будут.
Китайцы еще, которым посрать на копирайты
Китайцы вот буквально на днях приняли закон, по которому доступ к генераторам по паспорту, а все результаты обязаны содержать отметку, что это работа генератора.
Даже если нейронки обяжут вшивать в результат что-то, а китайских и пиратских нейронок не будет,
Про китайцев пунктом выше, а невидимый водяной знак stable diffusion УЖЕ вшивает, вместе с номером версии. Так что если законы изменятся, или возникнет суднбный прецедент, они смогут буквально кликом мыши подвести под судебные разборки все сайты, где останутся изображения, сгенеренные ранними версиями, использующими LAION-5b
Не докажешь что он не сам рисовал.
Это много лет успешно доказывается наличием у настоящего автора рабочего файла/записей процесса/набросков и т.п.
Современные нейронки по сути просто инструмент для автоматизации плагиата, а сам плагиат давно известное преступление, и есть методы борьбы с ним.
И еще есть такой момент - многие концептщики/фотобашеры тоже не умеют рисовать от руки, особенно на уровне того что выкладывают (был какой-то концептщик у которого по старым работам это хорошо видно).
Знаешь в чем разница? Чтобы такого человека пустили работать в любое серьезное место, все исходники должны быть либо сделаны им лично, либо выкуплены на специальных сайтах.
Претензии к разработчикам некоторых нейросетей именно потому, что они решили, что могут собрать все, что можно скачать из инета и использовать в коммерческих целях.
Это много лет успешно доказывается наличием у настоящего автора рабочего файла/записей процесса/набросков и т.п.
Это то что он сам нарисовал так доказывается. Доказать что он сгенерил ты не можешь, а доказывать обратное он не обязан. Нереально за каждой игровой студией и за каждым художником бегать и требовать доказательств что они сами рисуют.
все результаты обязаны содержать отметку, что это работа генератора
невидимый водяной знак stable diffusion УЖЕ вшивает, вместе с номером версии
Ну это же смешно - вотермарки стираются, вшитая инфа убирается скриншотом, конвертацией в другие форматы, небольшой дорисовкой/фильтрами и пр.
Отредактировано (2022-12-19 16:13:47)
Это то что он сам нарисовал так доказывается. Доказать что он сгенерил ты не можешь, а доказывать обратное он не обязан. Нереально за каждой игровой студией и за каждым художником бегать и требовать доказательств что они сами рисуют.
На сайтах с монетизацией (таких как редбабл, микростоки и т.п.) абсолютно стандартная практика, когда аккаунт блокируется до предоставления доказательств авторства, под которыми как правило подразумеваются рабочие файлы.
То что этого нет на сайтах с портфолио это вопрос отношения комьюнити, насколько оно готово репортить и скандалить. А отношнение к нейроартам такое, что комьюнити будет искать их с лупой.
Что касается коммерческих проектов типа игровых студий: за ними бегают активно уже сейчас, они регулярно отбиваются от исков или платят по тем искам, что проиграли.
Ну это же смешно - вотермарки стираются,
И по новым китайским законам это запрещено
вшитая инфа убирается скриншотом, конвертацией в другие форматы, небольшой дорисовкой/фильтрами и пр.
Ну то есть действиями, направленными на то, чтобы скрыть факт нарушения копирайта. Это только усугубит положение попавшегося на подобной практике юзера