OpenClaw Token — Полное руководство по экономии: используйте самые мощные модели, тратьте минимальные деньги / содержит подсказки

PANews

2026-02-11 00:35:51

Автор: xiyu

Хотите воспользоваться Claude Opus 4.6, но не хотите, чтобы счёт вырос в конце месяца? Эта статья поможет вам снизить стоимость на 60-85%.

1. Куда тратятся жетоны?

Ты думаешь, что токены — это просто «то, что ты говоришь + что отвечает ИИ»? На самом деле это гораздо больше, чем просто это.

Скрытые расходы на разговор:

Системный запрос (~3000-5000 токенов): Основные команды OpenClaw, изменить нельзя
Инъекция контекстных файлов (~3000-14000 токенов): AGENTS.md, SOUL.md, MEMORY.md и т.д. при каждом разговоре — это самая большая скрытность
Исторические новости: чем дольше разговор, тем длиннее он становится
Ваш вход + выход ИИ: Вот что вы считаете «всем»

Простое «как сегодня погода» на самом деле потребляет 8000-15000 входных токенов. В Opus это стоит $0.12-0.22 только в контексте.

Крон ещё более жесток: каждый триггер = новый диалог = заново вводится весь контекст. Cron, который запускается каждые 15 минут, 96 раз в день, Opus стоит $10-20 на следующий день.

Heartbeat тот же: суть тоже является диалоговым вызовом, и чем короче интервал, тем дороже.

2. Слои моделей: Ежедневный сонет, ключевое произведение

Первый большой приём для экономии денег — самый эффективный. Цена на сонет составляет примерно пятую часть Opus, и 80% повседневных задач полностью достаточны.

Markdown

Задание:

Пожалуйста, помогите мне изменить стандартную модель OpenClaw на Claude Sonnet,

Используйте Opus только тогда, когда нужен глубокий анализ или авторство.

Конкретные потребности:

Модель по умолчанию установлена на Sonnet
Задача cron по умолчанию использует Sonnet
Только задачи по написанию и глубокого анализа указывают OPUS

**Сценарий опуса:**Длинное написание текста, сложный код, многошаговое мышление, творческие задачи

**Сценарий сонета:**Ежедневные светские беседы, простые вопросы и ответы, проверка кронштейна, сердцебиение, обработка файлов, перевод

Фактическое измерение: после перехода ежемесячная стоимость снижается на 65%, и опыт почти такой же.

3. Контекстное похудение: Отрезание больших невидимых токенов

«Уровень шума» за один звонок может составлять от 3000 до 14000 токенов. Оптимизация файла инъекции — самая экономичная оптимизация.

Markdown

Задание:

Помогите мне оптимизировать контекстные файлы OpenClaw для сохранения токенов.

В частности, он включает: 1) AGENTS.md Удаление ненужных частей (правила группового чата, TTS, неиспользуемые функции) и сжатие их до менее чем 800 токенов

SOUL.md Сжатые до кратких пунктов, 300-500 жетонов
MEMORY.md Очистка просроченной информации в пределах 2000 токенов
Проверьте конфигурацию workspaceFiles для удаления ненужных инжекцированных файлов

Правило: на каждые 1 000 токенов, которые вы вводите, вы экономите около $45 в месяц на основе 100 звонков в Opus в день.

4. Cron оптимизация: самый скрытый убийца затрат

Markdown

Подсказка: Помогите мне оптимизировать задачу OpenClaw cron для сохранения токенов.

Пожалуйста:

Перечислить все задачи cron с их частотой и моделью
Понизить все задачи, не связанные с авторством, до Сонета
Объединять задачи из одного периода времени (например, несколько проверок в одну)
Уменьшить излишне высокую частоту (проверка системы изменилась с 10 минут на 30 минут, проверка версии изменилась с 3 раз в день на 1 раз в день)
Настройте доставку так, чтобы она была уведомлением по требованию и не отправляла сообщения в обычное время

Основной принцип: Не чаще — тем лучше, большинство требований в реальном времени — ложные требования. Объедините 5 независимых проверок в один вызов, что позволит сэкономить 75% затрат на инъекцию контекста.

5. Оптимизация сердцебиения

Markdown

Подсказка: Помогите оптимизировать конфигурацию сердцебиения OpenClaw:

Рабочий интервал установлен на 45-60 минут
Установить тихий период с 23:00 до 08:00 посреди ночи
Оптимизировать HEARTBEAT.md до минимального количества строк
Объединить разрозненные проверки в ритме для пакетного выполнения

6. Точное извлечение: используйте qmd, чтобы сэкономить 90% входных токенов

Когда агент ищет данные, он по умолчанию выбирает «читать полный текст» — файл на 500 строк стоит 3000-5000 токенов, но ему нужно всего 10 токенов.90% входных токенов тратятся впустую.

QMD — это локальный инструмент семантического поиска, который устанавливает полный текст + векторный индекс, позволяющий агентам выделять абзацы вместо чтения целых документов.Все локальные вычисления, без затрат на API.

Используйте с mq (Mini Query): структура оглавления для предварительного просмотра, точное извлечение абзацев, поиск по ключевым словам — требуется всего 10-30 строк на чтение.

Markdown

Задание:

Помогите настроить поиск базы знаний QMD для сохранения токенов.

Адрес на Github:https://github.com/tobi/qmd

Обязательно:

Установка QMD
Индексировать рабочий каталог
Добавить правила поиска в AGENTS.md, чтобы заставить агентов искать с помощью qmd/mq вместо прямого чтения полного текста
Настройте индекс запланированных обновлений

Измеряемый эффект: количество проверок данных за одну проверку сократилось с 15 000 до 1 500 токенов, что на 90% меньше.

Отличие от memorySearch в том, что memorySearch управляет «recall» (MEMORY.md), а qmd — «поиском данных» (пользовательской базой знаний), которые не влияют друг на друга.

7. Выбор поиска памяти

Markdown

Подсказка: помогите настроить memorySearch в OpenClaw.

Если у меня мало файлов памяти (десятки MD),

Рекомендуется ли использовать локальное встраивание или Voyage AI?

Пожалуйста, опишите соответствующую разницу в стоимости и качестве поиска.

**Простой вывод:**Файлы памяти редко встраиваются локально (без стоимости), а ИИ для высоких многоязычных требований или файлов используется Voyage AI (бесплатно 200 миллионов токенов на аккаунт).

8. Окончательный список конфигураций

Markdown

Задание:

Пожалуйста, помогите мне оптимизировать конфигурацию OpenClaw для максимальной экономии токенов за один раз, согласно следующему чек-листу:

Модель по умолчанию изменена на Sonnet, и только Opus остаётся для задач по авторству и анализу

Оптимизируйте AGENTS.md / SOUL.md / MEMORY.md

Все задачи cron понижают уровень Sonnet + merge + downclock

Сердцебиение с разницей в 45 минут + ночная тишина

Настройте QMD Precision Search вместо полнотекстового чтения

workspaceFiles сохраняет только необходимые файлы

Файлы памяти регулярно оптимизируются, MEMORY.md управление в пределах 2000 токенов

Настройте один раз, получите выгоду в долгосрочной перспективе:

Слои моделей — Sonnet Daily, Opus Critical, экономия на 60-80%
Ухудшение контекста — оптимизация файлов + точное извлечение QMD, экономия 30-90% входных токенов
Сократить звонки — объединить кронов, удлинить сердцебиение, включить периоды тишины

Sonnet 4 уже сильный, и вы не почувствуете разницы в повседневном использовании. Просто вырежьте его, когда вам действительно нужен Opus.

*На основе реального опыта многоагентных систем данные представляют собой оценку десенсибилизации. *

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

комментарий

0/400

Нет комментариев