[nevr]

Dual-Brain Chat

LIVE

Fast brain for simple, smart for complex. Auto-switches Fast brain for simple, smart for complex. Auto-switches

Groq 0.5s Claude load balancing escalation de-escalation -90% tokens

5 triggers, 0.5s → Claude fast + smart, -90% cost

Dual-Brain — двухмозговая архитектура чата. 80% сообщений обрабатывает быстрый мозг (Groq, бесплатно, 0.5с). 20% — умный мозг (Claude, платно). **5 триггеров эскалации:** 1. Негативный тон — слова-маркеры фрустрации 2. Стагнация — нет новых фактов 4+ сообщений 3. Повторы — >60% совпадение слов 4. Явный запрос — пользователь просит 5. Техническая сложность — intent = artifact или complex analysis **Деэскалация:** когда разговор нормализуется — автоматический возврат на быстрый мозг. Без уведомления пользователя. **Экономика:** средняя стоимость сессии $0.12 → $0.01. Экономия 90% токенов без потери качества.
Простые вопросы — мгновенный ответ за 0.5 секунды. Сложная ситуация или фрустрация — автоматическое подключение продвинутой модели. 5 триггеров переключения: негативный тон, стагнация, повторы, явный запрос, сложная задача. Обратное переключение — автоматическое. Экономия 90% на AI без потери качества.

## How it works ## Как это работает

Message → EscalationDetectorService (5 triggers: sentiment, stagnation, repetition, explicit, complexity) → if escalated: Claude via OpenRouter. If normal: Groq (0.5s). De-escalation: LLM sends UI action when conversation normalizes. Сообщение → анализ 5 триггеров → простое = быстрая модель (0.5с) / сложное = продвинутая модель → автоматический возврат.

## Related ## Связанные продукты