Автор: xiyu
Хочете використовувати Claude Opus 4.6, але не хочете, щоб наприкінці місяця рахунок вибухнув? Ця стаття допоможе вам зменшити витрати на 60-85%.
Ви думаєте, що токени — це просто “ваші слова + відповіді ШІ”? Насправді — набагато більше.
Приховані витрати кожної розмови:
Простий запит “Яка сьогодні погода” фактично споживає 8000-15000 вхідних токенів. За допомогою Opus — на контекст витрачається $0.12-0.22.
Ще жорсткіше: кожен запуск cron — новий діалог — повторне додавання всього контексту. Один cron, що запускається кожні 15 хвилин, — 96 разів на день, і за день з Opus — $10-20.
Heartbeat — аналогічно: це виклики діалогу, чим коротший інтервал — тим більше витрат.
Найефективніший спосіб економії — це ефективне розподілення моделей. Sonnet коштує приблизно 1/5 від Opus, і на 80% щоденних задач цілком достатній.
markdown
Підказка:
Змініть налаштування так:
Сценарії Opus: довге написання, складний код, багатоступеневі розумові задачі, креатив
Сценарії Sonnet: щоденні розмови, прості питання, перевірки cron, heartbeat, робота з файлами, переклади
Практика: після перемикання місячні витрати зменшилися на 65%, досвід майже не змінився.
Кожен виклик — “шум” — може становити 3000-14000 токенів. Оптимізація через скорочення вставлених файлів — найвигідніший спосіб.
markdown
Підказка:
Допоможіть зменшити обсяг контекстних файлів OpenClaw для економії токенів.
Конкретно:
AGENTS.md — видаліть непотрібні частини (правила групового чату, TTS, непотрібні функції), зменшити до 800 токенів
SOUL.md — зробіть короткий виклад, 300-500 токенів
MEMORY.md — очистіть застарілі дані, тримайте в межах 2000 токенів
Перевірте конфігурацію workspaceFiles, видаліть непотрібні файли для вставки
Загальне правило: кожні 1000 зменшених токенів — економія приблизно $45 на місяць при 100 викликах на день.
markdown
Підказка: допоможіть оптимізувати cron-завдання OpenClaw для економії токенів.
Зробіть так:
Перелічіть усі cron-завдання, їх частоту та моделі
Зменшіть рівень складності для всіх не-творчих задач до Sonnet
Об’єднайте задачі, що виконуються одночасно (наприклад, кілька перевірок — в один запуск)
Зменшіть частоту непотрібних високочастотних перевірок (системні — з 10 хвилин до 30, перевірки версій — з 3 разів на день до 1)
Налаштуйте delivery — за запитом, без повідомлень за замовчуванням
Основний принцип: не потрібно робити все якомога частіше. Більшість “реальних” потреб — імітація. Об’єднання 5 окремих перевірок у один виклик зменшує витрати на контекст на 75%.
markdown
Підказка: допоможіть налаштувати Heartbeat для економії.
Зробіть так:
Інтервал — 45-60 хвилин
Нічний режим — з 23:00 до 8:00 — мовчання
Скоротіть HEARTBEAT.md до мінімуму
Об’єднайте розрізнені перевірки у пакетний запуск Heartbeat
При пошуку інформації агент за замовчуванням “читає весь текст” — файл у 500 рядків — 3000-5000 токенів, але йому потрібно лише 10 рядків. 90% input token — марна трата.
qmd — локальний інструмент семантичного пошуку, створює全文 + векторний індекс, щоб агент міг точно знаходити потрібний фрагмент, а не читати весь файл. Все локально, без API — безкоштовно.
В парі з mq (Mini Query): перегляд структури, точний пошук, ключові слова — кожного разу читає лише 10-30 рядків.
markdown
Підказка:
Допоможіть налаштувати qmd для економії токенів.
Github: https://github.com/tobi/qmd
Що потрібно:
Встановити qmd
Створити індекс для робочого каталогу
В додатку AGENTS.md додати правила пошуку, щоб агент пріоритетно використовував qmd/mq замість читання всього
Налаштувати автоматичне оновлення індексів
Практика: кожен пошук — зменшення з 15000 до 1500 токенів, економія 90%.
Різниця з memorySearch: memorySearch — “пам’ять” (MEMORY.md), qmd — “пошук інформації” (локальний індекс). Вони не перетинаються.
markdown
Підказка: допоможіть налаштувати memorySearch для OpenClaw.
Якщо у мене мало файлів (кілька десятків md), краще використовувати локальні вбудовані або Voyage AI?
Поясніть різницю у вартості та якості пошуку.
Простий висновок: при малій кількості файлів — локальні вбудовані (безкоштовно), при великій кількості або багатомовних — Voyage AI (безкоштовно до 2 млрд токенів на акаунт).
markdown
Підказка: допоможіть мені разом оптимізувати OpenClaw для максимальної економії токенів за цим списком:
Шарування моделей — Sonnet для щоденних задач, Opus — для ключових, економія 60-80%
Легке зменшення контексту — оптимізація файлів + qmd — економія 30-90% вхідних токенів
Зменшення викликів — об’єднання cron, подовження Heartbeat, режим мовчання
Sonnet 4 вже дуже потужний, для щоденних задач — практично не відчувається різниця. Для потрібних Opus — просто переключіться.
Базується на практичному досвіді роботи з багатьма агентами, дані — оцінка без персональних даних.