Вы не вошли.
Тред для обсуждения текстовых ИИ в контексте писательства: ролевых игр, додать себе редкопейринга, написать пейзаж для главы или подсказать вотэтоповорот.
Для удобства поиска отзывов используйте тег #ии_истории.
Хотя один раз я свайпала ответ бота в ОСС (спецом отдельно с ним хотела поболтать в ОСС, но там из-за настроек самого промта (отыгрывай в образе персонажа всегда) пришлось ловить подходящий) около 50-60 раз. Можно было уже и ручками прописать, но мне хотелось от него самого добиться. И ведь вышло
А потом все удивляются, почему вводят лимиты или платные подписки.
Объясняли в теме несколько раз же. Твой контекст это output, ответ нейронки это input.
То есть если от меня ушел запрос размером 7500 токенов, а потом пришел ответ в 7850, то одна генерация была 15350? А свайп такого ответа примерно 1535?
А потом все удивляются, почему вводят лимиты или платные подписки.
Никто не удивляется
Это как бы и так понятно, что бесплатно тебе будут давать ограниченное количество свайпов или генераций. Чутес набирал себе аудиторию и обучал модель, как только достиг нужного результата - ввел платку.
И не важно, все ли пользователи делали 1-3 свайпа или по 50, это было бы введено при любом раскладе
А потом все удивляются, почему вводят лимиты или платные подписки.
Это просто следствие того, что люди не понимают, как работают ЛЛМ в принципе и инференс в частности, мне кажется.
обучал модель
Ты знаешь, что такое Чутес? Ты понимаешь, как обучаются модели?
То есть если от меня ушел запрос размером 7500 токенов, а потом пришел ответ в 7850, то одна генерация была 15350? А свайп такого ответа примерно 1535?
Нет.
Одна генерация будет 7500 токенов по цене инпута и 7850 по цене аутпута.
Свайп (без кэширования) будет 7500 токенов инпута и столько токенов аутпута, сколько сгенерится.
Следующее сообщение от первого аутпута (без кэширования) будет 15350 инпута, если ты оставишь весь предыдущий ПЕРВЫЙ аутпут (7850) в контексте и столько аутпута, сколько сгенерится.
Нет.
Хмм, не зря на реддит писали, что готовы платить за подписку, а не за вот это вот, потому что просчитать цену нереально/сложно
Нет.
Я запутался. Вот та же виверна пишет в конце генерации ответа:
было 7800
стало 7850
генерирую следующий ответ
было 7850
стало 8100
еще ответ
было 8100
стало 8300
сколько я уже токенов потратил?
Я запутался. Вот та же виверна пишет в конце генерации ответа:
было 7800
стало 7850
генерирую следующий ответ
было 7850
стало 8100
еще ответ
было 8100
стало 8300сколько я уже токенов потратил?
А где аутпут (сколько неронка тебе присылает)? У тебя тут только контекст.
По тому что у тебя в контексте, ты потратил:
7800+7850+8100 инпута
50+250+200 аутпута, но там может быть больше, если у тебя вырезается ризонинг, например.
А! Анон! Я понял, в чем путаница
от меня ушел запрос размером 7500 токенов, а потом пришел ответ в 7850
За аутпут считается ТОЛЬКО генерация нейронки, когда она пишет, вместе с ризонингом, и всем остальным конечно, но именно те токены, которые она отдает. Тебе пришел ответ в 350 токенов (7850-7500), а не 7850.
Отредактировано (Сегодня 17:40:13)
просчитать цену нереально/сложно
Все просто же...
Все просто же...
Пользователям видимо нет, потому что жалоб таких много. Ну или народ не хочет заморачиваться с расчетами.
Признаюсь честно, мне тоже проще платить абонентку, чем высчитывать это все.
По тому что у тебя в контексте, ты потратил:
7800+7850+8100 инпута
50+250+200 аутпута, но там может быть больше, если у тебя вырезается ризонинг, например.
А, вот теперь примерно понятно. Ну тогда это вполне подъемно.
А, вот теперь примерно понятно. Ну тогда это вполне подъемно.
Я там дописал, когда сообразил, что тебе не приходят простынищи по 7к токенов за один ответ.
Вообще где-то 90% цены это цена инпут токенов (твоего промпта, бота и чата то есть), и как раз на них идет скидка. У ризонинг моделей чуть больший вес имеет аутпут, потому что у них ответы больше из-за того, что они генерят ризонинг.
Пользователям видимо нет, потому что жалоб таких много. Ну или народ не хочет заморачиваться с расчетами.
Признаюсь честно, мне тоже проще платить абонентку, чем высчитывать это все.
Мне кажется, я просто не очень хорошо объяснил. Я бы тоже платил абонентку, во-превых, не дергаешься каждый раз сколько осталось и сработал ли кэш, во-вторых, абонентка даже с лимитами у всех провайдеров на сегодня дешевле, чем потокенно. Но АПИ по подписке нет ни у кого, кажется.
Оно не так страшно дорого на самом деле, я играю иногда с платными моделями (ДС и местами Клод) на ОР. Сначала боялась, думала сейчас как нереальные суммы пойдут, но на деле, даже если бы я вообще только за деньги играла, у меня ну где-то 20-30 у.е. в месяц бы уходило. Но это при моих объемах игры, конечно.
Отредактировано (Сегодня 17:45:26)
Но это при моих объемах игры, конечно.
А какие у тебя объемы примерно?
Оно не так страшно дорого на самом деле, я играю иногда с платными моделями (ДС и местами Клод) на ОР. Сначала боялась, думала сейчас как нереальные суммы пойдут, но на деле, даже если бы я вообще только за деньги играла, у меня ну где-то 20-30 у.е. в месяц бы уходило. Но это при моих объемах игры, конечно.
А теперь посчитай, что на Опус при контексте в 20к токенов уходит на одно! сообщение стоимость в 0,35 доллара. В результате 10 свайпов сделал - 3,5 доллара сняли. Красота. На сонете меньше, конечно, но говорить, что это не так уж и дорого - это вводить анонов в заблуждение.
Отредактировано (Сегодня 17:53:51)
А какие у тебя объемы примерно?
Ну... В среднем за день наверное где-то на сообщений ~100 отыгрываю (+свайпы). Сообщения (и у меня, и у бота длинные, люблю простынки). Но оно день на день не приходится, сам понимаешь. Бывают дни, когда совсем не играю.
Добавлю, что я за объемом контекста слежу, за 20К уходит оч.редко.
Отредактировано (Сегодня 18:10:13)
даже если бы я вообще только за деньги играла, у меня ну где-то 20-30 у.е. в месяц бы уходило.
Ну, прямо скажем, не у всех есть ненужные 3к в месяц за небольшой объем игры. Так что "недорого" у каждого свое.
Отредактировано (Сегодня 18:15:32)
А потом все удивляются, почему вводят лимиты или платные подписки.
Ну уж в этом точно не любители рп с 100 или даже 300 свайпами виноваты, а ддосеры и автоматизированные запросы всяких погромистких сервисов и т.д., такие как мы это капля в море юзеров ЛЛМ
На сонете меньше, конечно, но говорить, что это не так уж и дорого - это вводить анонов в заблуждение.
Аноны разные, понятие недорого у всех разное. Но да, чтобы использовать Опус без кэширования, надо быть миллионером. Да даже и с кэшированием получается накладно.
С настроенным кэшем и плотной игрой у меня, если экстраполировать, выходит где-то 50-60 долларов в месяц на Сонете (максимум я тратил полтора-два доллара, когда писал весь вечер не отрываясь, скажем, но такое далеко не каждый день у меня происходит), но я тоже за контекстом слежу, почти не свайпаю и не так много успеваю поролеплеить, потому что пишу посты довольно медленно. Средняя генерация с Сонетом у меня в районе одного цента (с пятиминутным кэшированием), у Опуса, соответственно, будет около 5 центов, у третьего чуть больше, он любит много писать.
Посчитал, что частенько укладываюсь в лимит, но если нет, то все равно должен по деньгам укладываться.
Сижу, не играю, весь настрой сбили
Ну вообще я бы больше ставила на всякие проги вроде Курсора и иже с ними. Вайб коддинг цветет и пахнет, недавно видела жалобы юзер Курсора, который 3к запросов к нейронке сделал.
Бля, не могу. Аноны, у вас бывает такое, что R1 и 0528 обрывают ризонинг или пост, когда считают? В ризонинге постоянно на "во-первых, нужно сделать-" все, пизда рулю, сейчас оборвал пост на "Answer one" в самом начале поста. Не могу же я быть один такой? Никаких запретов ни на что не стоит, чистый пресет абсолютно, агнаи.
У меня последние дни 0528 вообще любые посты частенько обрывает. Но он у меня и ризонинг простынками выдаёт, так что…
Отредактировано (Сегодня 18:28:12)
У меня 0528 часто на середине фразы обрывает, я просто жму на "продолжить" (на Виверне), пока оно мысль не закончит. Или просто срезаю до законченного абзаца так, чтобы оно нормально в контекст ложилось.
Отредактировано (Сегодня 18:31:47)