OpenClaw Token — Полное руководство по экономии: используйте самые мощные модели, тратьте минимальные деньги / содержит подсказки

PANews

Автор: xiyu

Хотите воспользоваться Claude Opus 4.6, но не хотите, чтобы счёт вырос в конце месяца? Эта статья поможет вам снизить стоимость на 60-85%.

1. Куда тратятся жетоны?

Ты думаешь, что токены — это просто «то, что ты говоришь + что отвечает ИИ»? На самом деле это гораздо больше, чем просто это.

Скрытые расходы на разговор:

  • Системный запрос (~3000-5000 токенов): Основные команды OpenClaw, изменить нельзя
  • Инъекция контекстных файлов (~3000-14000 токенов): AGENTS.md, SOUL.md, MEMORY.md и т.д. при каждом разговоре — это самая большая скрытность
  • Исторические новости: чем дольше разговор, тем длиннее он становится
  • Ваш вход + выход ИИ: Вот что вы считаете «всем»

Простое «как сегодня погода» на самом деле потребляет 8000-15000 входных токенов. В Opus это стоит $0.12-0.22 только в контексте.

Крон ещё более жесток: каждый триггер = новый диалог = заново вводится весь контекст. Cron, который запускается каждые 15 минут, 96 раз в день, Opus стоит $10-20 на следующий день.

Heartbeat тот же: суть тоже является диалоговым вызовом, и чем короче интервал, тем дороже.

2. Слои моделей: Ежедневный сонет, ключевое произведение

Первый большой приём для экономии денег — самый эффективный. Цена на сонет составляет примерно пятую часть Opus, и 80% повседневных задач полностью достаточны.

Markdown

Задание:

Пожалуйста, помогите мне изменить стандартную модель OpenClaw на Claude Sonnet,

Используйте Opus только тогда, когда нужен глубокий анализ или авторство.

Конкретные потребности:

  1. Модель по умолчанию установлена на Sonnet

  2. Задача cron по умолчанию использует Sonnet

  3. Только задачи по написанию и глубокого анализа указывают OPUS

**Сценарий опуса:**Длинное написание текста, сложный код, многошаговое мышление, творческие задачи

**Сценарий сонета:**Ежедневные светские беседы, простые вопросы и ответы, проверка кронштейна, сердцебиение, обработка файлов, перевод

Фактическое измерение: после перехода ежемесячная стоимость снижается на 65%, и опыт почти такой же.

3. Контекстное похудение: Отрезание больших невидимых токенов

«Уровень шума» за один звонок может составлять от 3000 до 14000 токенов. Оптимизация файла инъекции — самая экономичная оптимизация.

Markdown

Задание:

Помогите мне оптимизировать контекстные файлы OpenClaw для сохранения токенов.

В частности, он включает: 1) AGENTS.md Удаление ненужных частей (правила группового чата, TTS, неиспользуемые функции) и сжатие их до менее чем 800 токенов

  1. SOUL.md Сжатые до кратких пунктов, 300-500 жетонов

  2. MEMORY.md Очистка просроченной информации в пределах 2000 токенов

  3. Проверьте конфигурацию workspaceFiles для удаления ненужных инжекцированных файлов

Правило: на каждые 1 000 токенов, которые вы вводите, вы экономите около $45 в месяц на основе 100 звонков в Opus в день.

4. Cron оптимизация: самый скрытый убийца затрат

Markdown

Подсказка: Помогите мне оптимизировать задачу OpenClaw cron для сохранения токенов.

Пожалуйста:

  1. Перечислить все задачи cron с их частотой и моделью

  2. Понизить все задачи, не связанные с авторством, до Сонета

  3. Объединять задачи из одного периода времени (например, несколько проверок в одну)

  4. Уменьшить излишне высокую частоту (проверка системы изменилась с 10 минут на 30 минут, проверка версии изменилась с 3 раз в день на 1 раз в день)

  5. Настройте доставку так, чтобы она была уведомлением по требованию и не отправляла сообщения в обычное время

Основной принцип: Не чаще — тем лучше, большинство требований в реальном времени — ложные требования. Объедините 5 независимых проверок в один вызов, что позволит сэкономить 75% затрат на инъекцию контекста.

5. Оптимизация сердцебиения

Markdown

Подсказка: Помогите оптимизировать конфигурацию сердцебиения OpenClaw:

  1. Рабочий интервал установлен на 45-60 минут

  2. Установить тихий период с 23:00 до 08:00 посреди ночи

  3. Оптимизировать HEARTBEAT.md до минимального количества строк

  4. Объединить разрозненные проверки в ритме для пакетного выполнения

6. Точное извлечение: используйте qmd, чтобы сэкономить 90% входных токенов

Когда агент ищет данные, он по умолчанию выбирает «читать полный текст» — файл на 500 строк стоит 3000-5000 токенов, но ему нужно всего 10 токенов.90% входных токенов тратятся впустую.

QMD — это локальный инструмент семантического поиска, который устанавливает полный текст + векторный индекс, позволяющий агентам выделять абзацы вместо чтения целых документов.Все локальные вычисления, без затрат на API.

Используйте с mq (Mini Query): структура оглавления для предварительного просмотра, точное извлечение абзацев, поиск по ключевым словам — требуется всего 10-30 строк на чтение.

Markdown

Задание:

Помогите настроить поиск базы знаний QMD для сохранения токенов.

Адрес на Github:https://github.com/tobi/qmd

Обязательно:

  1. Установка QMD

  2. Индексировать рабочий каталог

  3. Добавить правила поиска в AGENTS.md, чтобы заставить агентов искать с помощью qmd/mq вместо прямого чтения полного текста

  4. Настройте индекс запланированных обновлений

Измеряемый эффект: количество проверок данных за одну проверку сократилось с 15 000 до 1 500 токенов, что на 90% меньше.

Отличие от memorySearch в том, что memorySearch управляет «recall» (MEMORY.md), а qmd — «поиском данных» (пользовательской базой знаний), которые не влияют друг на друга.

7. Выбор поиска памяти

Markdown

Подсказка: помогите настроить memorySearch в OpenClaw.

Если у меня мало файлов памяти (десятки MD),

Рекомендуется ли использовать локальное встраивание или Voyage AI?

Пожалуйста, опишите соответствующую разницу в стоимости и качестве поиска.

**Простой вывод:**Файлы памяти редко встраиваются локально (без стоимости), а ИИ для высоких многоязычных требований или файлов используется Voyage AI (бесплатно 200 миллионов токенов на аккаунт).

8. Окончательный список конфигураций

Markdown

Задание:

Пожалуйста, помогите мне оптимизировать конфигурацию OpenClaw для максимальной экономии токенов за один раз, согласно следующему чек-листу:

Модель по умолчанию изменена на Sonnet, и только Opus остаётся для задач по авторству и анализу

Оптимизируйте AGENTS.md / SOUL.md / MEMORY.md

Все задачи cron понижают уровень Sonnet + merge + downclock

Сердцебиение с разницей в 45 минут + ночная тишина

Настройте QMD Precision Search вместо полнотекстового чтения

workspaceFiles сохраняет только необходимые файлы

Файлы памяти регулярно оптимизируются, MEMORY.md управление в пределах 2000 токенов

Настройте один раз, получите выгоду в долгосрочной перспективе:

  1. Слои моделей — Sonnet Daily, Opus Critical, экономия на 60-80%

  2. Ухудшение контекста — оптимизация файлов + точное извлечение QMD, экономия 30-90% входных токенов

  3. Сократить звонки — объединить кронов, удлинить сердцебиение, включить периоды тишины

Sonnet 4 уже сильный, и вы не почувствуете разницы в повседневном использовании. Просто вырежьте его, когда вам действительно нужен Opus.

*На основе реального опыта многоагентных систем данные представляют собой оценку десенсибилизации. *

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев