Автор: xiyu
Хотите воспользоваться Claude Opus 4.6, но не хотите, чтобы счёт вырос в конце месяца? Эта статья поможет вам снизить стоимость на 60-85%.
Ты думаешь, что токены — это просто «то, что ты говоришь + что отвечает ИИ»? На самом деле это гораздо больше, чем просто это.
Скрытые расходы на разговор:
Простое «как сегодня погода» на самом деле потребляет 8000-15000 входных токенов. В Opus это стоит $0.12-0.22 только в контексте.
Крон ещё более жесток: каждый триггер = новый диалог = заново вводится весь контекст. Cron, который запускается каждые 15 минут, 96 раз в день, Opus стоит $10-20 на следующий день.
Heartbeat тот же: суть тоже является диалоговым вызовом, и чем короче интервал, тем дороже.
Первый большой приём для экономии денег — самый эффективный. Цена на сонет составляет примерно пятую часть Opus, и 80% повседневных задач полностью достаточны.
Markdown
Задание:
Пожалуйста, помогите мне изменить стандартную модель OpenClaw на Claude Sonnet,
Используйте Opus только тогда, когда нужен глубокий анализ или авторство.
Конкретные потребности:
Модель по умолчанию установлена на Sonnet
Задача cron по умолчанию использует Sonnet
Только задачи по написанию и глубокого анализа указывают OPUS
**Сценарий опуса:**Длинное написание текста, сложный код, многошаговое мышление, творческие задачи
**Сценарий сонета:**Ежедневные светские беседы, простые вопросы и ответы, проверка кронштейна, сердцебиение, обработка файлов, перевод
Фактическое измерение: после перехода ежемесячная стоимость снижается на 65%, и опыт почти такой же.
«Уровень шума» за один звонок может составлять от 3000 до 14000 токенов. Оптимизация файла инъекции — самая экономичная оптимизация.
Markdown
Задание:
Помогите мне оптимизировать контекстные файлы OpenClaw для сохранения токенов.
В частности, он включает: 1) AGENTS.md Удаление ненужных частей (правила группового чата, TTS, неиспользуемые функции) и сжатие их до менее чем 800 токенов
SOUL.md Сжатые до кратких пунктов, 300-500 жетонов
MEMORY.md Очистка просроченной информации в пределах 2000 токенов
Проверьте конфигурацию workspaceFiles для удаления ненужных инжекцированных файлов
Правило: на каждые 1 000 токенов, которые вы вводите, вы экономите около $45 в месяц на основе 100 звонков в Opus в день.
Markdown
Подсказка: Помогите мне оптимизировать задачу OpenClaw cron для сохранения токенов.
Пожалуйста:
Перечислить все задачи cron с их частотой и моделью
Понизить все задачи, не связанные с авторством, до Сонета
Объединять задачи из одного периода времени (например, несколько проверок в одну)
Уменьшить излишне высокую частоту (проверка системы изменилась с 10 минут на 30 минут, проверка версии изменилась с 3 раз в день на 1 раз в день)
Настройте доставку так, чтобы она была уведомлением по требованию и не отправляла сообщения в обычное время
Основной принцип: Не чаще — тем лучше, большинство требований в реальном времени — ложные требования. Объедините 5 независимых проверок в один вызов, что позволит сэкономить 75% затрат на инъекцию контекста.
Markdown
Подсказка: Помогите оптимизировать конфигурацию сердцебиения OpenClaw:
Рабочий интервал установлен на 45-60 минут
Установить тихий период с 23:00 до 08:00 посреди ночи
Оптимизировать HEARTBEAT.md до минимального количества строк
Объединить разрозненные проверки в ритме для пакетного выполнения
Когда агент ищет данные, он по умолчанию выбирает «читать полный текст» — файл на 500 строк стоит 3000-5000 токенов, но ему нужно всего 10 токенов.90% входных токенов тратятся впустую.
QMD — это локальный инструмент семантического поиска, который устанавливает полный текст + векторный индекс, позволяющий агентам выделять абзацы вместо чтения целых документов.Все локальные вычисления, без затрат на API.
Используйте с mq (Mini Query): структура оглавления для предварительного просмотра, точное извлечение абзацев, поиск по ключевым словам — требуется всего 10-30 строк на чтение.
Markdown
Задание:
Помогите настроить поиск базы знаний QMD для сохранения токенов.
Адрес на Github:https://github.com/tobi/qmd
Обязательно:
Установка QMD
Индексировать рабочий каталог
Добавить правила поиска в AGENTS.md, чтобы заставить агентов искать с помощью qmd/mq вместо прямого чтения полного текста
Настройте индекс запланированных обновлений
Измеряемый эффект: количество проверок данных за одну проверку сократилось с 15 000 до 1 500 токенов, что на 90% меньше.
Отличие от memorySearch в том, что memorySearch управляет «recall» (MEMORY.md), а qmd — «поиском данных» (пользовательской базой знаний), которые не влияют друг на друга.
Markdown
Подсказка: помогите настроить memorySearch в OpenClaw.
Если у меня мало файлов памяти (десятки MD),
Рекомендуется ли использовать локальное встраивание или Voyage AI?
Пожалуйста, опишите соответствующую разницу в стоимости и качестве поиска.
**Простой вывод:**Файлы памяти редко встраиваются локально (без стоимости), а ИИ для высоких многоязычных требований или файлов используется Voyage AI (бесплатно 200 миллионов токенов на аккаунт).
Markdown
Задание:
Пожалуйста, помогите мне оптимизировать конфигурацию OpenClaw для максимальной экономии токенов за один раз, согласно следующему чек-листу:
Модель по умолчанию изменена на Sonnet, и только Opus остаётся для задач по авторству и анализу
Оптимизируйте AGENTS.md / SOUL.md / MEMORY.md
Все задачи cron понижают уровень Sonnet + merge + downclock
Сердцебиение с разницей в 45 минут + ночная тишина
Настройте QMD Precision Search вместо полнотекстового чтения
workspaceFiles сохраняет только необходимые файлы
Файлы памяти регулярно оптимизируются, MEMORY.md управление в пределах 2000 токенов
Слои моделей — Sonnet Daily, Opus Critical, экономия на 60-80%
Ухудшение контекста — оптимизация файлов + точное извлечение QMD, экономия 30-90% входных токенов
Сократить звонки — объединить кронов, удлинить сердцебиение, включить периоды тишины
Sonnet 4 уже сильный, и вы не почувствуете разницы в повседневном использовании. Просто вырежьте его, когда вам действительно нужен Opus.
*На основе реального опыта многоагентных систем данные представляют собой оценку десенсибилизации. *