Холиварофорум

Не все, что говорят на Холиварке — правда!

Вы не вошли.

Объявление

Началась запись на Тайного Санту 2024!

#1776 2024-09-28 02:14:10

Анон

Re: Восстание машин: ИИ против человека

Анон пишет:

Ой, нахуй я сюда пришел. Извините.

можно, к примеру, создать тему "ущемление иишников" или в этом роде. Или есть мирный тред ИИ. А то непонятно и правда, зачем именно сюда.

#1777 2024-09-28 09:20:56

Анон

Re: Восстание машин: ИИ против человека

Анон пишет:

Ой, нахуй я сюда пришел.

Ну да. Хуле ты пришел, вбросил и молчишь-интересничаешь?
Сказал А давай уже и Б: что за сообщество, в какой конкретно формулировке правила тебя смутили?
А то с твоим косноязычием непонятно кто на ком стоял, то ли админы того соо и вправду подохуели, то ли это ты правила прочёл жопой.

Отредактировано (2024-09-28 09:21:48)

#1778 2024-09-28 09:54:12

Анон

Re: Восстание машин: ИИ против человека

Кстати, на тему "ИИшница распознается с полпинка":

Проект по анализу использования языка людьми в интернете закрылся, потому что нейросети слишком сильно «загрязнили данные», заполонив сеть искусственным текстом

Создательница проекта Wordfreq, который отслеживал публикации в интернете, чтобы определить популярность различных слов в языке, сообщила, что проект будет закрыт. Причина — спам, который производит генеративный искусственный интеллект. Он “отравил” интернет до уровня, который уже не позволяет проводить исследования. Wordfreq отслеживал более 40 различных языков, анализируя статьи в Википедии, субтитры к фильмам, новости книги, а также Twitter и Reddit. Система использовалась для анализа меняющихся языковых паттернов по мере изменения современной культуры, ее применяли ученые, которые работают в этой области. В своем сообщении на GitHub создательница проекта Робин Спир написала, что он «больше не будет обновляться».

«Не думаю, что у кого-то есть надежная информация об использовании языка людьми после 2021 года», — отметила она. По словам разработчицы, сегодня интернет заполнен “мусором”, который создают нейросети. «Включение этого мусора в данные искажает частоту использования слов», — сообщила она. В данных, которые анализировал Wordfreq, всегда был спам, но «он был управляемым и часто идентифицируемым». «Большие языковые модели генерируют текст, который специально маскируется под настоящий язык», — пожаловалась она. Спир также привела пример того, что ChatGPT, например, злоупотребляет словом «вникать», что резко повысило частоту этого конкретного слова (но его не так часто используют люди).

Она отметила, что сегодня почти все инструменты (которые щедро финансируют Google, OpenAI и другие) для анализа текста используются именно для обучения нейросетей, чтобы создать «технологии для плагиата, которые будут выдавать ваши слова за свои». Спир также отметила, что сегодня данные получить сложнее, поскольку Twitter и Reddit, которые использовал Wordfreq, начали взимать плату за доступ к своим API из-за того, что их используют для обучения нейросетей.

Источник: https://t.me/ostorozhno_novosti/29732

Короче, исследователям языка в будущем как минимум придется кардинально пересматривать методику анализа. А как максимум у них появится новая тема для глобального исследования: как ИИ-генерации влияют на творчество и поведение мясных людей. 
Анон вспоминает случай с ИИ-генерацией, едва не выигравшей конкурс фотографии и обратный ему случай, когда некий фотограф прислал реальную фотку на конкурс ИИ (и тоже победил бы, если бы не снял свою работу незадолго до объявления результатов)

#1779 2024-09-28 14:54:53

Анон

Re: Восстание машин: ИИ против человека

Юзайте кат плиз (белый квадратик справа от смайлика)

#1780 2024-10-16 08:30:37

Анон

Re: Восстание машин: ИИ против человека

Анон пишет:

Кстати, на тему "ИИшница распознается с полпинка":

Проект по анализу использования языка людьми в интернете закрылся, потому что нейросети слишком сильно «загрязнили данные», заполонив сеть искусственным текстом

Создательница проекта Wordfreq, который отслеживал публикации в интернете, чтобы определить популярность различных слов в языке, сообщила, что проект будет закрыт. Причина — спам

Следующим пунктом получаем накрывание пиздой электронных переводчиков, работающих на том же движе что гуглтранслейт (сопоставление слов разных языков по сочетаниям и частотности). Мясные переводчики должны заметно подрасти в цене.

Короче, исследователям языка в будущем как минимум придется кардинально пересматривать методику анализа.

Да вернутся к бумажным картотекам и всего делов. Частотный анализ и в докомьютерную эпоху умели делать, и ебипетские папирусы методам сравнительной лингвистики расшифровывали.

Отредактировано (2024-10-16 08:30:54)

Подвал форума

Основано на FluxBB, с модификациями Visman
Доработано специально для Холиварофорума