Вы не вошли.
Тред для обсуждения прогресса в области машинного обучения и разработок ИИ, включая нейронки (но не ограничиваясь). Перетираем за технологии, юридические тонкости, этические проблемы и потенциальные последствия для экономики и социума. Дискуссии приветствуются, но давайте всё-таки без срачей, а то научим ещё Скайнет плохому.
Гости не могут голосовать
Цивил не будет платить за подписку на то, что в миллионе мест можно нагенерить бесплатно.
ну вот мы и пришли к реалистичному сценарию регуляции: Адоб будет быковать на сервисы, которые генерируют картинки бесплатно, поэтому такие сервисы будут юзать только легальные датасеты (чтобы их не засудили), которые в отсутствие ресурсов крупной корпорации будут меньше и хуже, чем Адобовские.
При этом нейроарта всё равно будет становиться всё больше, и раз на него нельзя будет поставить копирайт, на нём будут учить новые сетки. Дальше имеем сценарий, уже реализовавшийся для игровых сеток. Всё, что для него нужно - фидбек от живых мясных человеков, который позволит сеткам отличать хорошие генерации от плохих.
Это, анон, очень и очень разные масштабы.
Справедливо. Я не уверен, что ты прав насчёт количества степеней свободы в играх (потому что в симуляторах авиабоя, например, сетки тоже уже людей обошли), но я в них вообще не спец, так что не буду спорить.
А это значит, что человеческая проверка\корректировка результатов её работы всегда будет нужна.
нууу, анон, всё-таки пока что все эти генерации исключительно ради реакции человеков делаются. Так что да, человеческая корректировка всегда будет нужна. Вопрос в том, насколько она будет трудоёмкой.
Аноны, а я снова подниму тему, раз уж её кто-то затронул: чтобы вы назвали настоящим искусственным интеллектом?
какие у вас критерии настоящести интеллекта?
Как минимум у него должна быть цельная "личность" и осознание себя как личности. Т.е., например, его мнение в ответе на вопрос не должно меняться просто от того, что вопрос задали несколько раз немножко по-разному; у него должны быть вкус/предпочтение.
Т.е., например, его мнение в ответе на вопрос не должно меняться просто от того, что вопрос задали несколько раз немножко по-разному; у него должны быть вкус/предпочтение.
Но при этом еще и нет математического доказательства, что вообще есть нейросеть, которая может синтезировать графику "правильно" и "красиво" без человеческого вмешательства, и, что если она есть, количество коэффициентов, которое ей необходимо для этого, не превышает, хотя бы, количество атомов в планете Земля.
Думаю, для максимально правильного результата нейросеть, как и человек, должна плясать не от пикселей, а от трёхмерной модели, которую затем "фотографировать" и обрабатывать в нужной стилистике.
Аноны, а я снова подниму тему, раз уж её кто-то затронул: чтобы вы назвали настоящим искусственным интеллектом?
какие у вас критерии настоящести интеллекта?
Независимость. Но это не про интеллект, наверное. А про одушевлённость, отличие живого от неживого.
То есть способность самостоятельно ставить перед собой цели. Конечно, сложно определить "независимость", потому что люди могут действовать как под влиянием внешних факторов, так и под влиянием своей физиологии. То есть даже если ничего не будет происходить, человек всё равно рано или поздно проголодается и это побудит его пойти искать еду.
Но как-то так.
При этом нейроарта всё равно будет становиться всё больше, и раз на него нельзя будет поставить копирайт, на нём будут учить новые сетки. Дальше имеем сценарий, уже реализовавшийся для игровых сеток. Всё, что для него нужно - фидбек от живых мясных человеков, который позволит сеткам отличать хорошие генерации от плохих.
А у игровых сеток тоже есть такая штука, как переобучение, когда результат генерации полностью соответсвует какому-то защищенному копирайтом контенту из датасета?
Потому что обучая нейро на нейро, и пытаясь вылечить косяки типа знаменитых стремных рук, мы в итоге получим либо нихуя, либо нормальные руки, в точности соответствующие какому-то из загруженных в датасет изображений, что уже будет основанием для судебного иска даже по нынешним несовершенным законам.
То же с любой другой проблемной частью.
мы в итоге получим либо нихуя, либо нормальные руки, в точности соответствующие какому-то из загруженных в датасет изображений
Почему лица не в точности соответствуют, а руки должны? В датасетах огромное количество рук, в т.ч. незакопирайченных, со временем научится генерить руки из нойза на основе этих данных как и со всем остальным
Почему лица не в точности соответствуют, а руки должны? В датасетах огромное количество рук, в т.ч. незакопирайченных, со временем научится генерить руки из нойза на основе этих данных как и со всем остальным
Потому что лицо, особенно без выражения и с закрытым ртом, - это, по сути, коробка, у нее много ракурсов но рот на лоб ни у кого не лезет. Глаза, нос, уши, щеки, рот, брови - почти одинаково располагаются относительно друг друга и овала лица. (И то нейросетки ошибаются периодически с тем куда что прицепить и суют, например, глаза слишком высоко)
Руки, с другой стороны... Это руки. Сотни, а то и тысячи положений в которых они могут находиться, куча ракурсов которые "скрадывают" пальцы, куда большее влияние перспективы. Тут статистический анализ гораздо сложнее.
Руки, с другой стороны... Это руки. Сотни, а то и тысячи положений в которых они могут находиться, куча ракурсов которые "скрадывают" пальцы, куда большее влияние перспективы. Тут статистический анализ гораздо сложнее.
Нужно создать нейросеть, которая будет строить трёхмерные модели, прежде чем рисовать детали. Как настоящие художники.
“Как настоящие художники”
А у игровых сеток тоже есть такая штука, как переобучение, когда результат генерации полностью соответсвует какому-то защищенному копирайтом контенту из датасета?
в том или ином виде переобучение существует для любых моделей. Причём не только для нейросетей, но и для прочих МО-алгоритмов. Переобучение - это в большей степени проблема датасета, а не алгоритма.
Руки, с другой стороны... Это руки. Сотни, а то и тысячи положений в которых они могут находиться, куча ракурсов которые "скрадывают" пальцы, куда большее влияние перспективы. Тут статистический анализ гораздо сложнее.
Руки, как и голова - трёхмерный объект. И не так чтобы какой-то принципиально более сложный, если принять во внимание многообразие мимики человеческого лица, которую, однако же, сетки вполне успешно имитируют.
Моё предположение - проблема в отсутствии большого размеченного датасета. Лица на фотографиях в каком-нибудь фейсбуке часто выделены пользователями, да и в принципе лица часто фотографируют. Размеченного датасета с руками такого же размера у нас нет. Из-за этого сложности - но они преодолимы.
Нужно создать нейросеть, которая будет строить трёхмерные модели, прежде чем рисовать детали.
Так сейчас работа ведётся в том числе в этом направлении, и довольно успешно. Сетки, которые генерируют трёхмерные модели по фото, пока не настолько на слуху, как генерирующие арт или текст, но прогресс там очень неслабый.
“Как настоящие художники”
Тут было "настоящие" не столько в смысле "люди", сколько в смысле академического образования с рисованием кубов и обнажённых моделей.
Так сейчас работа ведётся в том числе в этом направлении, и довольно успешно. Сетки, которые генерируют трёхмерные модели по фото, пока не настолько на слуху, как генерирующие арт или текст, но прогресс там очень неслабый.
Вот и правильно. Потому что столь загадочные и непостижимые для обычных сеток пальцы — это всего лишь три цилиндра, которые могут поворачиваться вокруг одного из концов в определённом диапазоне углов.
Вполне себе интересная статья на dtf об использовании нейросеток для создания игры
тык
плюсы статьи: человек реально пытался вынуть из неё результат, и человек неплохо рисует, что позволяет ему достаточно точно видеть проблемы с картинками нейронки
Вполне себе интересная статья на dtf об использовании нейросеток для создания игры
Что я вижу по итогам статьи: получить приличный результат из нейросетки может только человек, который уже умеет рисовать. Подрисовав правильно.
Скорее всего, таким людям не нравится генерировать сотни изображений, чтобы выбрать одно, которое отдаленно похоже на то, что им надо, и доделывать его руками до приличного.
Получить +-ожидаемое от нейросетки куда сложнее, чем кажется после чтения остальных статей.
Спасибо, действительно очень интересно.
Интересная статья, комменты тоже!
Моё предположение - проблема в отсутствии большого размеченного датасета. Лица на фотографиях в каком-нибудь фейсбуке часто выделены пользователями, да и в принципе лица часто фотографируют
Я гонял миджорник и у неё проблема и с лицами тоже. Просто на лице не так заметно, когда уезжает нос/рот из-за того что человеческие лица разнообразные, да и стилистика бывает упрощённая.
Кмк, проблема с руками не в пальцах. Палец она может изобразить.
Проблема в принципе с количеством и с прикреплением в нужных местах пальцев/ручек/ножек/лапок.
Нет понимания скелета вообще.
С запросами, где уточнял ось количество больше 3х она ещё худо бедно справлялась, а вот 4 и больше — явно наугад.
Как в байке про счёт на старорусском: один, два, куча, тьма.
Если фишку с количеством ещё +- понятно как пофиксить: научить другую нейронку считать более-менее качественно, с помощью программ разметки, и поставить их в соревнование (сложно, но можно), то как пофиксить понимание скелета я вообще не понимаю.
Достаточно большой датасет на чужих артах не синтезировать: сами художники грешат плохой анатомией, да и задолбаешься скелеты рисовать (для сравнения, на обучение нейронки на разноспознавание тупо типа местности по фотке уходят лямы тайлов. Хз как оценивать, но тут явно больше. И ещё разметчики должны быть отобраны так, чтобы самим +- понимать в анатомии рисунка)
А если насинтезировать самим на 3д модельках — потеряется разнообразие стилей.
На данный момент, имхо, нерешаемая проблема, и юзать нейронки для генерации людей можно только в очень и очень популярных позах.
А если насинтезировать самим на 3д модельках — потеряется разнообразие стилей.
анон, но нейросетки генерализируют форму отдельно, а стили (точнее, разные аспекты стилей) - отдельно. вангую, доп. датасеты, созданные из 3д моделей, как раз и решат эту проблему
нейросетки генерализируют форму отдельно,
Миджорни? Мне казалось, что она там пятнышками синтезирует, а не именно 3д формой.
Мои друзья из художки эти пятна называли композицией цвета, и вроде как к анатомии это не относится никак
Миджорни? Мне казалось, что она там пятнышками синтезирует, а не именно 3д формой.
анон, я про то, как нейросети учатся. они обобщают информацию о форме в одних "нейронах", о взаимном расположении частей тела - в других нейронах, о стиле мазка - в третьих... на самом деле там всё сложнее и не всегда идеально работает, но принцип в том, что сетка "запоминает" разные аспекты информации независимо друг от друга. если у тебя в датасете сто пятьдесят мячиков, нарисованных разными стилями, но ни одного нарисованного в стиле Ван Гога, и сто пятьдесят картин Ван Гога, но ни одной - с мячиком, сетка всё равно может нарисовать тебе мячик в стиле Ван Гога. Соответственно, если ты скормишь ей овер дофига изображений моделек человеческой кисти, она сможет рисовать их в любом стиле, даже если изначальные модельки были просто реалистичными фотографиями.
Тем временем копирайт - 1 : нейросеть 0.
https://aibusiness.com/ml/ai-generated- … protection
Отредактировано (2022-12-21 01:40:05)
Анон пишет:Миджорни? Мне казалось, что она там пятнышками синтезирует, а не именно 3д формой.
анон, я про то, как нейросети учатся. они обобщают информацию о форме в одних "нейронах", о взаимном расположении частей тела - в других нейронах, о стиле мазка - в третьих... на самом деле там всё сложнее и не всегда идеально работает, но принцип в том, что сетка "запоминает" разные аспекты информации независимо друг от друга. если у тебя в датасете сто пятьдесят мячиков, нарисованных разными стилями, но ни одного нарисованного в стиле Ван Гога, и сто пятьдесят картин Ван Гога, но ни одной - с мячиком, сетка всё равно может нарисовать тебе мячик в стиле Ван Гога. Соответственно, если ты скормишь ей овер дофига изображений моделек человеческой кисти, она сможет рисовать их в любом стиле, даже если изначальные модельки были просто реалистичными фотографиями.
Тогда было бы достаточно пары сотен видео с руками, разбитых покадрово, а такие материалы в датасетах популярных нейросеток есть с самого начала.
Правда в том, что сказки про обучение это маркетинговый ход, а на практике там старый добрый рэндомный шум, на который накладываются паттерны совпадающих по тегам пикселей. Именно это объясняет практически все косяки, которые выдают нейронки и требования настолько огромных массивов краденых изображений, чтобы результат походил хоть на что-то.
Тем временем копирайт - 1 : нейросеть 0.
Они там уже с сенаторами воюют на этот счет. Сенаторы пытаются лоббировать изменение законов, чтобы стимулировать инвестиции в машинное обучение, копирайт офис вежливо шлет их нахуй.
В принципе неудивительно, т.к. если законодательно разрешить обучать нейросеки на интеллектуальной собственности для создания продукта, аналогичного скопированному, всю современную систему копирайта можно будет выкидывать на помойку, что нахуй разорит 90% медиа-компаний и обрушит развлекательную индустрию во всем мире.
А ведь это еще до дипфейков с политиками не дошло дело.
Правда в том, что сказки про обучение это маркетинговый ход, а на практике там старый добрый рэндомный шум, на который накладываются паттерны совпадающих по тегам пикселей
анон, скажи честно, ты хоть одну сетку сам обучал?