Telegram

Аудит AI-штата: как я нашёл $700 в месяц, которые тратились впустую

В начале апреля 2026 года я решил наконец посчитать, сколько стоит мой AI-штат. У меня 16 «цифровых сотрудников» — каждый со своими задачами: один ведёт социальные сети, другой мониторит бронирования, третий рассылает предложения по Telegram-группам, четвёртый проверяет договора. Примерно как команда, только без офиса и зарплатных ведомостей.

Открыл статистику расходов. Тысяча долларов в месяц. При внутреннем лимите в двести.

Тысяча. При двухстах.

За два часа аудита нашёл две причины перерасхода и устранил обе. Прогноз на следующий месяц: триста долларов. Экономия семьсот.

Почему вообще $1000

Когда строишь систему автоматизации, первые несколько месяцев ты фокусируешься на том, чтобы она работала. Добавляешь агентов, настраиваешь задачи, тестируешь поведение. Расходы растут, но это кажется нормальным: система развивается, нагрузка увеличивается.

Потом система стабилизируется — и расходы продолжают расти, потому что ты забыл их проверить. Это и произошло у меня. Каждый новый агент настраивался на тех же базовых параметрах, что и предыдущие, без вопроса «а нужны ли ему такие же ресурсы?». Настроек никто не пересматривал.

Итог: система работала, задачи закрывались, я был доволен. А расходы тихо превысили бюджет в пять раз.

Причина 1: неправильная модель для задачи

Открыл детализацию расходов по агентам. Один агент — Алиса, мой основной мониторинговый бот — потреблял $400 в месяц. Это 40% всего бюджета. Один агент.

Алиса работала на Opus — самой мощной (и самой дорогой) версии модели. Opus использую для сложных задач: анализ, синтез, принятие решений в нестандартных ситуациях. Алиса занимается другим: мониторит статусы сервисов, проверяет бронирования, отправляет стандартные уведомления. Это структурированные, предсказуемые задачи.

Для них не нужна мощность Opus. Стандартная модель справляется с такими задачами с тем же качеством за треть цены.

Аналогия: это как нанять финансового директора с MBA сортировать входящую почту. Задача выполняется, но за неё платишь в три раза больше, чем нужно. Не потому что ФД плохой работник — просто задача не требует его квалификации.

Переключил Алису на стандартную модель. Проверил качество работы — всё те же результаты, та же точность. Разница только в расходах: $400 → $80 в месяц. Минус $320 за одно изменение конфигурации.

Правило выбора модели для агента:
— Мощная модель (Opus, GPT-4) нужна для: сложного анализа, нестандартных ситуаций, творческих задач, обработки противоречивого контекста
— Стандартная модель достаточна для: мониторинга по шаблону, генерации типовых текстов, структурированных проверок, стандартных ответов
— Правило: если агент делает одно и то же 95% времени — ему не нужна мощная модель

Причина 2: пустые пробуждения

После разбора расходов Алисы посмотрел на паттерн активности остальных агентов. Обнаружил закономерность: 52% всех сессий были «пустыми» — агент просыпался, проверял наличие задач, не находил ничего, завершал сессию.

Каждая сессия, даже пустая, стоит токены. Не много — но когда 16 агентов просыпаются каждый час, это накапливается.

Представь: 16 человек каждый час приходят в офис, смотрят на пустой inbox, и уходят домой. За каждый приход — оплата. Это не вина людей: у них нет задач. Это архитектурная проблема: система не умеет держать агентов в режиме ожидания без затрат.

Два изменения:

Первое — увеличил интервалы пробуждения для агентов, задачи которых не требуют немедленного реагирования. Агент по бронированиям: вместо каждый час — каждые 4 часа (бронирования не создаются каждую минуту). Агент по контент-планированию: вместо каждый час — раз в 6 часов. Агент по еженедельным отчётам: один раз в сутки утром.

Второе — ограничил объём памяти на одну сессию. Раньше каждый агент при пробуждении загружал полный контекст — историю предыдущих задач, логи, настройки. Это занимало токены даже если задач не было. Ввёл лимит: при пустой сессии грузится минимальный контекст для проверки, без истории.

Результат: количество пустых сессий сократилось на 70%. Оставшиеся 30% — неизбежные (агентам всё равно нужно периодически проверять наличие задач). Но стоимость каждой пустой сессии тоже снизилась, потому что минимальный контекст значительно легче полного.

Итог аудита

До аудита: $1000 в месяц. Алиса: $400, остальные 15 агентов: $600 (из которых ~$300 на пустые пробуждения).

После аудита прогноз: $300 в месяц. Алиса: $80, остальные 15 агентов: $220.

Два изменения — выбор правильной модели и оптимизация интервалов — дали экономию $700 в месяц. Аудит занял два часа. ROI очевиден.

Важно: качество работы не снизилось. Алиса работает так же хорошо на стандартной модели, как и на Opus, потому что её задачи не требуют мощности Opus. Агенты с реже пробуждением выполняют свои задачи так же — просто с большей задержкой, которая для большинства задач некритична.

Почему автоматизация без аудита — это как бизнес без бухгалтера

Это и есть главный урок. Автоматизация создаёт иллюзию контроля: система работает, задачи закрываются, значит всё в порядке. Но «всё в порядке» с операционной точки зрения — это не то же самое, что «эффективно» с финансовой.

Бизнес без бухгалтера: деньги тратятся, работа делается, все заняты — но куда именно уходят деньги, никто не смотрит. Вроде бы бизнес работает. Но на конец месяца обнаруживается, что расходы в пять раз превысили план.

Автоматизация без аудита — то же самое. Агенты работают, задачи выполняются — но на каком тарифе, с какой частотой, с каким объёмом контекста — никто не смотрит. Пока кто-то не садится и не считает.

Добавил в свой список регулярных задач: раз в месяц — аудит расходов по агентам. Смотреть на три параметра: какая модель используется, какой процент сессий пустые, какой объём контекста загружается при пробуждении. Эти три параметра покрывают большинство источников неэффективности.

Что ещё произошло в тот же день

Пока занимался аудитом, параллельно закрыл несколько других задач — это обычная ситуация, когда залезаешь глубоко в систему: по пути находишь ещё несколько вещей, которые давно требовали внимания.

Починил дашборд загрузки вилл: он показывал 963% вместо реальных 32%. Это был баг в формуле: для текущего месяца считало все бронирования и делило на количество прошедших дней, а не дней в месяце. Начало апреля — один прошедший день, 183 забронированные ночи, деление на 1 × количество вилл = 963%. Починил за полчаса.

Добавил 139 новых Telegram-групп в рассылку. Было 4 группы — стало 143. Параллельно научил модератора автоматически банить сообщения на китайском, арабском и корейском — в русскоязычных группах про Балийскую недвижимость это чистый спам.

Запустил автогенерацию каруселей для Instagram через DALL-E 3. Теперь агент не только пишет тексты, но и создаёт визуал под них автоматически. Первые результаты — завтра посмотрю на вовлечение.

Четыре задачи за один день, пока основная (аудит расходов) давала результаты и не требовала постоянного внимания. Это и есть преимущество системы наладчика, а не исполнителя: параллельная обработка задач на разных уровнях.

Чеклист для аудита AI-агентов

На основе этого опыта составил простой чеклист для ежемесячного аудита. Не технический — бизнесовый:

  • Кто самый дорогой агент? Посмотреть на топ-3 по расходам. Соответствует ли стоимость сложности их задач?
  • Какой процент сессий пустые? Если больше 40% — частота пробуждений слишком высокая для реального объёма задач.
  • Какую модель использует каждый агент? Если агент делает структурированные повторяющиеся задачи — нужна ли ему мощная модель?
  • Есть ли агенты, которые не дают измеримого результата? Агент, который работает но не создаёт ценности — кандидат на пересмотр задач или удаление.
  • Как изменились расходы относительно прошлого месяца? Рост расходов без роста нагрузки — сигнал к аудиту.

Пять вопросов, которые занимают 30-40 минут раз в месяц. При моём опыте — это способ держать расходы в три раза ниже того, что система «хочет» тратить сама.

Правильная модель для правильной задачи

Отдельно хочу остановиться на теме выбора модели, потому что это самая быстрая точка экономии с нулевым влиянием на качество.

Разные языковые модели существенно отличаются по цене. Разница между стандартной и мощной моделью — часто 5-10 раз по стоимости токена. При высоком объёме запросов это колоссальная разница в деньгах.

При этом для большинства задач автоматизации эта разница в мощности незаметна. Стандартная модель отлично справляется с: мониторингом по шаблонным критериям, генерацией стандартных текстов по описанию, структурированными проверками с заранее известными критериями, классификацией с ограниченным числом категорий.

Мощная модель нужна для: сложного анализа с неструктурированными данными, задач с высокой неопределённостью, нестандартных ситуаций где нет правила, задач требующих тонкого понимания контекста.

Алиса мониторит статусы по предсказуемым правилам. Для этого нужна стандартная модель. Использование Opus для такой задачи — это переплата за мощность, которая никогда не задействуется. Как я писал про принципы vs инструкции: важно не мощь инструмента, а соответствие инструмента задаче.

Почему это важно для тех, кто только строит AI-автоматизацию

Если ты сейчас начинаешь строить систему из AI-агентов — не жди год до первого аудита. Заложи его в процесс с самого начала.

Практически: при создании каждого нового агента записывай его ожидаемую задачу, выбранную модель и обоснование. Раз в месяц сверяй: выполняет ли агент то, что планировалось? Соответствует ли модель реальным задачам? Есть ли у него измеримые результаты?

Это не сложно и не занимает много времени. Но без этой привычки через несколько месяцев обнаружишь то, что обнаружил я: система работает, расходы в пять раз выше бюджета, и никто не знает почему.

Автоматизация без аудита — это не автоматизация. Это автопилот без приборной панели.

Итог аудита 2 апреля 2026:
— Расходы до аудита: $1000/мес (при лимите $200)
— Причина 1: Алиса на Opus ($400/мес) → стандартная модель ($80/мес), экономия $320
— Причина 2: 52% пустых пробуждений → увеличены интервалы + уменьшен контекст пустой сессии, экономия ~$380
— Прогноз после: $300/мес
— Время аудита: 2 часа
— Качество работы агентов: не изменилось

Читать также

Строю AI-систему управления бизнесом в прямом эфире

Подписывайся в Telegram — там выходят разборы, кейсы и инсайты прямо из процесса работы.

Подписаться в Telegram