Холиварофорум

СРЕДНЕВЕКОВЫЙ ЦЕХ МАСТЕРОВ СРАЧЕЙ

Вы не вошли.

Объявление

Слаженная свора опытных павликов работает в штатном режиме.

#1 2020-01-29 02:03:01

Анон

Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Садитесь поближе, анонцы, есть, что рассказать.

В ролях: Антибабовцы, Многодетки, Вконтач, Медуза, Russia Today, и конечно же, Холиварка.

В 2019 году проводился GSoC, Google Summer of Code, ежегодный конкурс по программированию от нашей бывшей Корпорации Добра.
Зашёл посмотреть на участников, и что я вижу:

Скрытый текст

WaE380G.png

Кросс-лингвистический анализ отношений США и России через сбор твитов и сообщений американских демократов и русских провластных консерваторов?
Звучит уже довольно тепло, лезу смотреть. Анализ Вконтакте, РТ, Медузы... подождите, что? Никакого анализа твитов американцев нет вообще (???), анализ проводился явно только русского языка, и вот что попалось мне внутри:

iUxMB9N.png

Перевод: Главным источником не-сексистской риторики был Холиварофорум, где я выкачала большую тему, посвящённую семейным отношениям (проблемы с родителями, близкими родственниками и т.д.). Это, также, было сделано в надежде, что даже на уровне данных будет возможна балансировка между сексистской риторикой и не-сексистской. К примеру, для модели [ИИ] нежелательно, чтобы она стала ассоциировать упоминания женщин с сексизмом (примеч. ОП: здесь имеется в виду перетренировка модели, см. сексистский ИИ). Метод для извлечения данных такой же, как и в предыдущих случаях [через Beautiful Soup, библиотеку для Питона].

То есть, иными словами, из Холиварки вытащили и распарсили всю тему с родственниками, причём распарсили так себе, и стали её считать источником анти-сексистской риторики. Сириосли? Там одни цитаты от родственников и набросы анонов и пациентов друг на друга чего стоят.

При этом, из всех остальных источников вытащили 2577 сообщений, а из Холиварки аж 21526. Ээээ, мне кажется, или тренировка моделей на сексизм - в основном презентованием сообщений с холиварки с припиской "это не сексизм" - должно выглядеть как-то иначе?

Так и есть, смотрите что мы видим дальше:

qTx83ta.png

Как только тему с родственниками выкинули, точность поползла вверх, правда, слишком поздно и нормально потестировать датасет не удалось.
Из оставшегося там сообщения с форума антибабовцев, многодеток, ну вы поняли, какого сорта размеченные датасеты получились. Медузу тоже за компанию записали в источник сексистских комментариев, а почему бы и нет. Ba-dum tss!

И за это студенты получают пять тысяч долларов, ха! =D Чёрт, да это просто золотая жила какая-то.
А ну живо обучать ИИ вежливости на темах с пациентами!

Ссылки:

#2 2020-01-29 02:12:22

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Ни хуя не понятно, но очень интересно.

#3 2020-01-29 02:14:35

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Анон пишет:

Ни хуя не понятно, но очень интересно

Спасибо анон, день прожит не зря :)

#4 2020-01-29 02:38:09

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

что за хуйню я прочитал

#5 2020-01-29 02:54:53

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Ахахаха это вин  =)

#6 2020-01-29 03:10:12

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Все, что я поняла, что заебаб победил-таки.  :smoke:

#7 2020-01-29 03:15:18

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Ни хуя не понятно, но очень интересно-2.

#8 2020-01-29 06:26:30

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Погоди, а цель работы была в анализе отношений США и РФ всё же? И несексистский массив текста с Холиварки им работу руинил?

#9 2020-01-29 06:55:51

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Нужна была очень большая и разнообразная выборка данных. А взяли раковник с холиварки вместо нормальных высказываний.

#10 2020-01-29 07:38:53

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Может это какой-то анон с холиварки так решил похалявить и на основе холиварочки и работу сделать и бабла срубить. Так потрудился, так ночами не спал выборку делал.  :yeah:

#11 2020-01-29 08:20:21

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Что бы ты ни делал, за это всегда кто-нибудь заплатит, если правильно подать.
Спасибо за пару минут здорового смеха.

#12 2020-01-29 08:27:07

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Хоть кому-то польза от того раковника  :lol:

Анон пишет:

Может это какой-то анон с холиварки так решил похалявить

Да 146%. Если б я не дропнул универ, так же бы делал.

Отредактировано (2020-01-29 08:27:59)

#13 2020-01-29 08:38:57

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Тема родственников вышла на международный уровень  :lol:

#14 2020-01-29 10:19:20

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

ue9tK6p.png

#15 2020-01-29 10:25:43

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Но почему именно тема родственников  :smoke:

#16 2020-01-29 10:26:53

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Анон пишет:

Но почему именно тема родственников  :smoke:

Она большая и про реал. Думаю, поэтому.

#17 2020-01-29 10:31:40

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Уже в третий раз я прочитал название темы как "Дети-сатанисты" и даже не удивился.

#18 2020-01-29 10:42:34

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Анон пишет:

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

что за хуйню я прочитал

[2]
А можно мне то же самое, что употребил тот, кто это придумал?

#19 2020-01-29 10:58:13

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Ходют тут всякие иностранцы с эмблемами нетсталкеров (и не только) на аватарках, а потом фигакс, и форум отпарсили для обучения ИИ, нормально, чо  :lol: Ох уж эти дата-сатанисты, погромисты-рептилоиды и нетсталкеры иллюминаты.

#20 2020-01-29 11:04:07

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Анон пишет:

Она большая и про реал. Думаю, поэтому.

Но в контексте "исследования" она пиздец странно смотрится.

чуть более подробный пересказ происходящего

Насколько я понял, исследовалось наличие/отсутствие сексистских высказываний в срачах:

In the course of work on the issue of “hate speech”, two compilations have been made, both of which may be useful for further research in this area.

Для этого пошли во вконтакт в группы лентача, медузы и рт и выгрузили оттуда комментарии к постам, попадавшим в тему выборки. Выборка, кстати, была охуенна: искалось по тегам/ключевым словам "сексизм, изнасилование, закон о домашнем насилии, Шурыгина, насилие". Мол, под такие посты как раз стекаются любители посраться с подходящей риторикой.

We used it to find posts with any of the words in the query list because we assumed that it was the news related to these topics that would cause the most discussion. Here we also give the translation of the query sheet:

query_list= {'sexism', 'meToo', 'sexual harassment', 'decriminalization of domestic violence', 'rape', 'feminism', 'Shurygina', 'harassment' }

Потом напротив каждого коммента из выгрузки ручками поставили пометку сексизм/не сексизм.

скрин с примером

example_corpus.png

Потом пошли на сайт антибабовцев, но оттуда для выгрузки взяли "по большей части не сексистские темы". Типа чтобы сленг и жаргонизмы попадались как в сексистских, так и в не сексистских комментах и не херели им выборку.

И потом под барабанную дробь взяли выгрузку из темы родственников на холиварке.

В результате выборка все равно оказалась похерена, потому что в комментариях с холиварки (их было почти в десять раз больше всего остального вместе взятого) не было ни единого разрыва случая сексизма.   :lenin:

И я нихуя не понял, при чем тут США  :lol:

В общем, спасибо анон-ТС, это чтиво сделало мне утро.  :lol:

Вишенкой стало замечание о том, что значительная часть проблем в распознавании была из-за сарказма. Программа, как и многие аноны, не могла определить сарказм без таблички и агрилась на все подряд.

#21 2020-01-29 11:05:51

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Анон пишет:

Тема родственников вышла на международный уровень  :lol:

Ну хоть не транссрачи  :lol:
А то ещё лесбийский тред можно было

#22 2020-01-29 11:08:53

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Анон пишет:

Программа, как и многие аноны

Дело раскрыто, все аноны - русский бот  :troll:

#23 2020-01-29 11:11:52

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Анон пишет:

Но в контексте "исследования" она пиздец странно смотрится.

Почему? Для создания ИИ как раз нужно что-то не очень понятное для обучения.

Анон пишет:

Вишенкой стало замечание о том, что значительная часть проблем в распознавании была из-за сарказма. Программа, как и многие аноны, не могла определить сарказм без таблички и агрилась на все подряд.

Ну так. А как ещё обучать ИИ? Сначала будет агриться, потом обучится.

Анон пишет:

Ну хоть не транссрачи  :lol:
А то ещё лесбийский тред можно было

Всё ещё впереди, если эти темы ещё не взяты для обучения ИИ.

#24 2020-01-29 11:12:57

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Ни хуя не понятно, но очень интересно - 3

Родственники, теперь инетрнешнл!
Ахуенная тема, я всегда говорил!  :lol:

#25 2020-01-29 11:13:15

Анон

Re: Дата-сатанисты и холиварка: тема родственников и сексизм в ИИ

Когда прочитал

Дантисты-сатанисты

но в теме какие-то геополитики, сексисты и питон.  :smoke:

Подвал форума

Под управлением FluxBB
Модифицировал Visman

[ Сгенерировано за 0.023 сек, 6 запросов выполнено - Использовано памяти: 790.49 Кбайт (Пик: 824.25 Кбайт) ]

18+