Tokenomics Guard

Per-request LLM cost tracking, budget gate AI spending control: daily limit, alert when approaching ceiling

Tokenomics Guard — контроль расходов на AI. **Per-request tracking:** каждый LLM-запрос записывается в workspace_llm_usages: model_id, action, input_tokens, output_tokens, estimated_cost_usd. **Model pricing:** free models = $0, Claude Sonnet = $3/$15 per million, Haiku = $0.8/$4. **Budget gate:** LLM_DAILY_BUDGET_USD (default $5). Алерт TG при 80%. budget_exceeded? блокирует premium модели. **Fallback:** при превышении бюджета — escalated sessions падают на free models (Groq).

Каждый AI-запрос учитывается: модель, объём, стоимость. Дневной лимит бюджета. Алерт при 80% расхода. Дорогие модели автоматически блокируются при превышении.

## How it works ## Как это работает

TokenomicsService.record!(model, action, input_tokens, output_tokens) → estimated_cost → workspace_llm_usages. budget_exceeded? → daily sum vs LLM_DAILY_BUDGET_USD. Alert at 80% via TG bot. Запрос → учёт стоимости → проверка бюджета → алерт при 80% → блокировка при превышении.

## How it works ## Как это работает

## Related ## Связанные продукты

Autonomous LLM Runtime

Credit Engine

Dual-Brain Chat