OpenClaw Token Останній посібник з економії: використовуйте найпотужнішу модель, витрачайте мінімум грошей/з підказками

PANews

Автор: xiyu

Хочете використовувати Claude Opus 4.6, але не хочете, щоб наприкінці місяця рахунок вибухнув? Ця стаття допоможе вам зменшити витрати на 60-85%.

1. На що йдуть токени?

Ви думаєте, що токени — це просто “ваші слова + відповіді ШІ”? Насправді — набагато більше.

Приховані витрати кожної розмови:

  • System Prompt (~3000-5000 токенів): основна команда OpenClaw, змінити її неможливо
  • Вставка контекстних файлів (~3000-14000 токенів): AGENTS.md, SOUL.md, MEMORY.md тощо, що додаються до кожної розмови — це найбільша прихована витрата
  • Історія повідомлень: чим довше спілкування, тим більше
  • Ваші запити + відповіді AI: це те, що ви вважаєте “всього”

Простий запит “Яка сьогодні погода” фактично споживає 8000-15000 вхідних токенів. За допомогою Opus — на контекст витрачається $0.12-0.22.

Ще жорсткіше: кожен запуск cron — новий діалог — повторне додавання всього контексту. Один cron, що запускається кожні 15 хвилин, — 96 разів на день, і за день з Opus — $10-20.

Heartbeat — аналогічно: це виклики діалогу, чим коротший інтервал — тим більше витрат.

2. Шарування моделей: щоденний Sonnet, ключовий Opus

Найефективніший спосіб економії — це ефективне розподілення моделей. Sonnet коштує приблизно 1/5 від Opus, і на 80% щоденних задач цілком достатній.

markdown

Підказка:

Змініть налаштування так:

  • Встановіть модель за замовчуванням — Sonnet
  • Завдання cron — за замовчуванням Sonnet
  • Тільки для творчих або глибоких аналізів використовуйте Opus

Сценарії Opus: довге написання, складний код, багатоступеневі розумові задачі, креатив

Сценарії Sonnet: щоденні розмови, прості питання, перевірки cron, heartbeat, робота з файлами, переклади

Практика: після перемикання місячні витрати зменшилися на 65%, досвід майже не змінився.

3. Легке зменшення контексту: зменшення прихованих токенів

Кожен виклик — “шум” — може становити 3000-14000 токенів. Оптимізація через скорочення вставлених файлів — найвигідніший спосіб.

markdown

Підказка:

Допоможіть зменшити обсяг контекстних файлів OpenClaw для економії токенів.

Конкретно:

  1. AGENTS.md — видаліть непотрібні частини (правила групового чату, TTS, непотрібні функції), зменшити до 800 токенів

  2. SOUL.md — зробіть короткий виклад, 300-500 токенів

  3. MEMORY.md — очистіть застарілі дані, тримайте в межах 2000 токенів

  4. Перевірте конфігурацію workspaceFiles, видаліть непотрібні файли для вставки

Загальне правило: кожні 1000 зменшених токенів — економія приблизно $45 на місяць при 100 викликах на день.

4. Оптимізація cron: найпотаємніший ворог витрат

markdown

Підказка: допоможіть оптимізувати cron-завдання OpenClaw для економії токенів.

Зробіть так:

  1. Перелічіть усі cron-завдання, їх частоту та моделі

  2. Зменшіть рівень складності для всіх не-творчих задач до Sonnet

  3. Об’єднайте задачі, що виконуються одночасно (наприклад, кілька перевірок — в один запуск)

  4. Зменшіть частоту непотрібних високочастотних перевірок (системні — з 10 хвилин до 30, перевірки версій — з 3 разів на день до 1)

  5. Налаштуйте delivery — за запитом, без повідомлень за замовчуванням

Основний принцип: не потрібно робити все якомога частіше. Більшість “реальних” потреб — імітація. Об’єднання 5 окремих перевірок у один виклик зменшує витрати на контекст на 75%.

5. Оптимізація Heartbeat

markdown

Підказка: допоможіть налаштувати Heartbeat для економії.

Зробіть так:

  1. Інтервал — 45-60 хвилин

  2. Нічний режим — з 23:00 до 8:00 — мовчання

  3. Скоротіть HEARTBEAT.md до мінімуму

  4. Об’єднайте розрізнені перевірки у пакетний запуск Heartbeat

6. Точний пошук: економія 90% Input Token за допомогою qmd

При пошуку інформації агент за замовчуванням “читає весь текст” — файл у 500 рядків — 3000-5000 токенів, але йому потрібно лише 10 рядків. 90% input token — марна трата.

qmd — локальний інструмент семантичного пошуку, створює全文 + векторний індекс, щоб агент міг точно знаходити потрібний фрагмент, а не читати весь файл. Все локально, без API — безкоштовно.

В парі з mq (Mini Query): перегляд структури, точний пошук, ключові слова — кожного разу читає лише 10-30 рядків.

markdown

Підказка:

Допоможіть налаштувати qmd для економії токенів.

Github: https://github.com/tobi/qmd

Що потрібно:

  1. Встановити qmd

  2. Створити індекс для робочого каталогу

  3. В додатку AGENTS.md додати правила пошуку, щоб агент пріоритетно використовував qmd/mq замість читання всього

  4. Налаштувати автоматичне оновлення індексів

Практика: кожен пошук — зменшення з 15000 до 1500 токенів, економія 90%.

Різниця з memorySearch: memorySearch — “пам’ять” (MEMORY.md), qmd — “пошук інформації” (локальний індекс). Вони не перетинаються.

7. Вибір Memory Search

markdown

Підказка: допоможіть налаштувати memorySearch для OpenClaw.

Якщо у мене мало файлів (кілька десятків md), краще використовувати локальні вбудовані або Voyage AI?

Поясніть різницю у вартості та якості пошуку.

Простий висновок: при малій кількості файлів — локальні вбудовані (безкоштовно), при великій кількості або багатомовних — Voyage AI (безкоштовно до 2 млрд токенів на акаунт).

8. Остаточний чекліст налаштувань

markdown

Підказка: допоможіть мені разом оптимізувати OpenClaw для максимальної економії токенів за цим списком:

  • Змінити модель за замовчуванням на Sonnet, використовувати Opus лише для творчих/аналізу задач
  • Оптимізувати AGENTS.md / SOUL.md / MEMORY.md
  • Зменшити частоту cron, об’єднати задачі, збільшити інтервал Heartbeat до 45 хвилин, зробити нічний режим
  • Впровадити qmd для точного пошуку
  • Залишити тільки необхідні файли у workspaceFiles
  • Регулярно очищати MEMORY.md до 2000 токенів

Одноразова настройка — довгострокова вигода:

  1. Шарування моделей — Sonnet для щоденних задач, Opus — для ключових, економія 60-80%

  2. Легке зменшення контексту — оптимізація файлів + qmd — економія 30-90% вхідних токенів

  3. Зменшення викликів — об’єднання cron, подовження Heartbeat, режим мовчання

Sonnet 4 вже дуже потужний, для щоденних задач — практично не відчувається різниця. Для потрібних Opus — просто переключіться.

Базується на практичному досвіді роботи з багатьма агентами, дані — оцінка без персональних даних.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів