Вы не вошли.
Анон, ну ты же понимаешь, что LLM ученые для лечения рака генерировали не на текстах Мартина?
Сначала большую модель обучили на Игре престолов, Войне и Мире, текстах Глории Гейнор и срачах про дрочку с Реддита, а когда она "поняла" естественные языки — её заставили "выучить" ещё и язык генов, скормив уже медицинские данные.
Странно, в медицинских, в том числе, направлениях используют нейросетки другого принципа, не языковые, с генетическими алгоритмами? (я все еще гуманитарий)
Сначала большую модель обучили на Игре престолов, Войне и Мире, текстах Глории Гейнор и срачах про дрочку с Реддита, а когда она "поняла" естественные языки — её заставили "выучить" ещё и язык генов, скормив уже медицинские данные.
а гпт не согласен
“Not quite. Tahoe-x1 didn’t first learn human language — it learned biology directly. It wasn’t pretrained on Game of Thrones or Reddit, but on gene-expression data from millions of single cells. The ‘language’ it learned from the start was the language of genes, drugs, and cell states.”
И вообще, анон, наверное, ты каждый день сдаешь по литру крови для больных и не кушаешь мяса, или в белый плащик ты завертываешься только насчет Мартина и художников?
Отредактировано (Вчера 12:52:43)
Сначала большую модель обучили на Игре престолов, Войне и Мире, текстах Глории Гейнор и срачах про дрочку с Реддита, а когда она "поняла" естественные языки — её заставили "выучить" ещё и язык генов, скормив уже медицинские данные.
Я чувствую здесь манипуляцию, но не могу ее полностью опровергнуть. Поэтому подожду какого-нибудь более подкованного технически анончика.
Сначала большую модель обучили на Игре престолов, Войне и Мире, текстах Глории Гейнор и срачах про дрочку с Реддита, а когда она "поняла" естественные языки — её заставили "выучить" ещё и язык генов, скормив уже медицинские данные.
Я надеюсь, что ты сарказмируешь)
О, а вот анончики уже и пришли. Спасибо!
А какие-то модели учатся на текстах Мартина? Мне все нейронки говорят, что сорри, не можем с тобой обсудить тексты произведений современных авторов, то есть можем, но доступа к самим текстам нет, только к второисточникам, в обучающих материалах были книги только со свободным доступом.
А какие-то модели учатся на текстах Мартина? Мне все нейронки говорят, что сорри, не можем с тобой обсудить тексты произведений современных авторов, то есть можем, но доступа к самим текстам нет, только к второисточникам, в обучающих материалах были книги только со свободным доступом.
Ну, я абсолютно уверен, что все крупные компании обучали свои нейронки на всем, что можно найти в интернете. В том числе, и на пиратских текстах. А потом наложили поверх промпт, чтобы нейронка не разглашала конфиденциальную информацию о пиратстве и притворялась законопослушной.
Странно, в медицинских, в том числе, направлениях используют нейросетки другого принципа, не языковые, с генетическими алгоритмами? (я все еще гуманитарий)
Генетические алгоритмы - не нейронка, это другой совсем подход к созданию ИИ и для других вещей. Это когда надо просчитать оптимальные для чего-либо форму, размер, маршрут и т. д., причем оптимальное для практических задач, а не для хайпа.
Ну, я абсолютно уверен, что все крупные компании обучали свои нейронки на всем, что можно найти в интернете. В том числе, и на пиратских текстах. А потом наложили поверх промпт, чтобы нейронка не разглашала конфиденциальную информацию о пиратстве и притворялась законопослушной.
Я не уверен в этом, потому что про книжки нейронки иногда отвечают лютую дичь, как будто никогда не видели оригинальный текст.
Я чувствую здесь манипуляцию, но не могу ее полностью опровергнуть. Поэтому подожду какого-нибудь более подкованного технически анончика.
Такие модели бывают - например, распознавание текстов по картинке сейчас так делают, берут ЛЛМ, натренированную на языке и добавляют в нее "зрение" (и вообще "зрячие" модели так делают). Но конкретно здесь была другая цепочка:
Чатботы на текстах популярны, денежны и т.д. -> в них вбросили кучу денег и разработали технологии (всякие Flash Attention и т.д.) -> взяли эти модели с технологиями, отработанными на человеческом языке и сказали "а что если учить их на языке генов" и получилось. То есть, "Мартин" тут нужен был для отработки технологий.
именно мусорные участки являются "необходимыми для рака". Только что даёт это знание, если их большая часть?
Так вот именно, модель позволяет в этом мусоре найти комбинации отвечающие за рост опухоли например.
Тут, мне кажется, важно другое. Даже если конкретная модель не спасет человечество от рака, это не так важно. Так наука работает, люди делают маленькие шажки, публикуют результаты, на их основе другие продвигаются чуть дальше, потом третьи комбинируют и получают прорыв, и т.д. И все эти ЛЛМ, которые у нас есть сейчас, это еще и кирпичики, на которых может быть построено что-то гораздо более чудесное.
Чатботы на текстах популярны, денежны и т.д. -> в них вбросили кучу денег и разработали технологии (всякие Flash Attention и т.д.) -> взяли эти модели с технологиями, отработанными на человеческом языке и сказали "а что если учить их на языке генов" и получилось. То есть, "Мартин" тут нужен был для отработки технологий.
Такое опосредованное совонатягивание вообще можно на всех распространить, на зеленых или правозащитников, или тех, кто защищает животных от жестокого обращения при тестировании, на тех, кто отказывается сдавать свой генетический материал или делиться почкой.
Так непонятно, почему ии-бро завертываются в белый плащик только по средам, и только художники с музыкантами у них виноваты во всех бедах мира?
И повторяют слово в слово аргументы Альтмана, который знаменит своим совонатягиванием, хотя те же его гигаваттные дата-центры - тоже нифига не цветочки для экологии, например. И через такое опосредование можно на Альтмана всех собак повесить за все будущее земли и все болезни из за экологии и излученитя, но слезки у белоплащевых очень избирательны. У них писатели и художники буквально убивают будущих раковых больных. Это ж надо так сову натянуть!
Теперь в нее можно закидывать эти последовательности и она может предсказывать
А уровень галлюцинаций у неё такой же как у чатгпт и гемини? А то я помню какие были статьи про "нейронкк открыла 100500 новых материалов" и какой от них был выхлоп
реально, тут сидят ии-бро, которые приравняли художников и музыкантов к преступникам и мега-гитлерам. И потом ии-бро обижаются, что их тут не любят, и что нет нормальной беседы.
Далее ии-бро будут приравнивать тех, кто скрывает свои работы в стол, к тайной преступной организации, что убивает раковых больных. И дальше потребуют законодательно принуждать писателей писать, и доносить на тех, ктот скрывает. Иначе погибнут дети и котята.
Сюр какой-то.
Причем они используют такие аргументы, которые на всех людей можно распространить. Все люди чем-то мешают или в чем-то ограничивают, или чего-то не додают великому благу. Но только художники и писатели вдруг ОБЯЗАНЫ.
Можно еще принудить всех ученых бесплатно работать без выходных и ни в коем случае не выбирать другую профессию. И вменять им в преступность, что им это не подходит. Ведь, если бы они не артачились, раковые лекарства появились бы еще быстрее.
Отредактировано (Вчера 13:39:50)
Такое опосредованное совонатягивание
технически безграмотно, собственно, дискуссия с такими "знатоками" бессмысленна.
на уровне "микроволновка облучает нас, мы все умрем"
Отредактировано (Вчера 13:40:09)
А уровень галлюцинаций у неё такой же как у чатгпт и гемини? А то я помню какие были статьи про "нейронкк открыла 100500 новых материалов" и какой от них был выхлоп
БЛЯ, ДА ПОЧИТАЙТЕ ВЫ О ТОМ, КАК "СОБИРАЮТ" ГЕНЫ С ПОМОЩЬЮ НЕЙРОНОК, ВЫ В КУРСЕ, ЧТО КРОМЕ ЯЗЫКОВЫХ ЕСТЬ ДРУГИЕ, ЧТО Ж ВЫ КАК БАБУСИ С ПРИМУСОМ
ей богу, как с дикарем о самолете
И вообще, анон, наверное, ты каждый день сдаешь по литру крови для больных и не кушаешь мяса, или в белый плащик ты завертываешься только насчет Мартина и художников?
Пост про переобучение языковой молели был ради занудства, а не в защиту правообладателей.
А уровень галлюцинаций у неё такой же как у чатгпт и гемини? А то я помню какие были статьи про "нейронкк открыла 100500 новых материалов" и какой от них был выхлоп
Так-то в этом году нобелевскую премию дали за работу с нейросетями в некоторых науках. По-моему, в химии. Я тут объяснял, как это происходит: нейронка обрабатывает огромный массив данных, т.к. она ллмка, ошибки возникают. Эти ошибки подчищают ученые ручками, потому что в любом случае - исправить ошибки намного проще, чем проводить весь анализ целиком самому.
И меня при этом можно отнести к ИИ-хейтерам, т.к. вижу проблему с экологической точки зрения, с тем, что Альтман пиздит, как дышит, но умалить пользу нейронок для науки тоже нельзя. Другое дело, что Альтману на эту пользу похуй, он там секс-роботов на основе чата гпт делает и убеждает всех, что чем больше будет дата-центров - тем круче станет нейронка, хотя исследователи говорят обратное: если нейронка достигла "потолка", то сколько в нее новой инфы не пихай (например, новых текстов), умнее она не станет. И дата-центры не помогут.
БЛЯ, ДА ПОЧИТАЙТЕ ВЫ О ТОМ, КАК "СОБИРАЮТ" ГЕНЫ С ПОМОЩЬЮ НЕЙРОНОК, ВЫ В КУРСЕ, ЧТО КРОМЕ ЯЗЫКОВЫХ ЕСТЬ ДРУГИЕ, ЧТО Ж ВЫ КАК БАБУСИ С ПРИМУСОМ
Реплика анона про конкретную новость про конкретно LLM, которая прославилась шитьём поганищ. Да, есть другие типы нейронок и другие подходы к ИИ, не пытающиеся собезьянить нервную систему человека, которые поганищ не шьют. Но они сейчас не в тренде.
но умалить пользу нейронок для науки тоже нельзя.
я вообще не умаляю пользу нейронок для науки. Но тут какие-то аргументы в стиле "а вот, если бы работали за чашку риса и не рыпались бы, то была бы польза государству и здравоохранению через это".
Но только художники и писатели вдруг ОБЯЗАНЫ.
Мне любопытно, а антибро, которые по факту - откровенные копирайт-бро, знают, почему авторские права ограничены по времени и по использованию? Казалось бы, написал условную игрупрестолов, владей вечно, передай правнукам, пусть владеют и богатеют? 
Сразу отвечу: потому что целью законов об авторском праве, как ни странно, не является напрямую обогащение авторов. Это не собственность. Целью этих законов является благо человечества. И для этого нужен баланс: нужно позволить авторам зарабатывать на своих произведениях, чтобы мотивировать их, но нужно и ограничить их - потому что закопирайчивание всего убивает прогресс. Поэтому пытаются найти компромисс, но копирайт-бро все увеличиваю и увеличивают сроки копирайтов, область их, уровень контроля и т.д. Не только касательно ИИ, но просто свободный ИИ им как кость в горле. Условный Дисней хочет генерить мультики, чтобы делать их дешево и зарабатывать еще больше миллиардов, но он хочет, чтобы этой возможности генерить мультики не было у других. Вот они и пытаются подмять, ограничить и связать.
Поэтому пытаются найти компромисс,
если бы пытались, это был бы другой вопрос. При том, что этот компромисс нужен тем же ии-бро, ведь, если 90% будет нейронок, да еще многие выкладывают без тегов и маркировок, а люди перестанут сами делать новый материал, то чем нейронкам питаться.
Мне любопытно, а антибро, которые по факту - откровенные копирайт-бро, знают, почему авторские права ограничены по времени и по использованию? Казалось бы, написал условную игрупрестолов, владей вечно, передай правнукам, пусть владеют и богатеют?
Да, только ты подменяешь понятия. Если все должны иметь возможность пользоваться свободным от копирайта контентом (которым становится контент после определенного истечения времени, и я это поддерживаю).
Но сейчас, по сути, это не работает по заветам коммунизма. За свободное получение контента без копирайта ратуют ИИ-компании, которые:
- Закрыли свой исходный код (в компании OpenAI слово "Open" только в названии. Так у них все легаси залочено). 
- Не собираются делиться, а собираются, в свою очередь, брать условно-бесплатный контент, обучать на нем нейросеть, и просить деньги у других людей за то, чтобы они могли пользоваться генерацией контента. 
Обычный человек может получить исходный код некоторых LLMок, но далеко не всех.
Мне любопытно, а антибро, которые по факту - откровенные копирайт-бро, знают, почему авторские права ограничены по времени и по использованию? Казалось бы, написал условную игрупрестолов, владей вечно, передай правнукам, пусть владеют и богатеют?
Сразу отвечу: потому что целью законов об авторском праве, как ни странно, не является напрямую обогащение авторов. Это не собственность. Целью этих законов является благо человечества. И для этого нужен баланс: нужно позволить авторам зарабатывать на своих произведениях, чтобы мотивировать их, но нужно и ограничить их - потому что закопирайчивание всего убивает прогресс. Поэтому пытаются найти компромисс, но копирайт-бро все увеличиваю и увеличивают сроки копирайтов, область их, уровень контроля и т.д. Не только касательно ИИ, но просто свободный ИИ им как кость в горле. Условный Дисней хочет генерить мультики, чтобы делать их дешево и зарабатывать еще больше миллиардов, но он хочет, чтобы этой возможности генерить мультики не было у других. Вот они и пытаются подмять, ограничить и связать.
Я, например, убеждённый пират, не вылезающий с флибусты и дакдак. Но я хочу быть уверенным, что набрав в гугле, скажем, цитату из "Преступление и наказание", я найду это произведение, а не пошитое нейронкой поганище "Поступление и подсказание".