Ошибки предшественника: 6 багов за одну сессию и как фабрика учится
AI-агент не глупый. Он прочитал 60 строк из 207, решил, что понял суть, и приступил к работе. Через 4 часа — 6 продакшен-деплоев без бэкапов, удалённые Docker-образы и $50, потраченных на исправление ошибок, которых не должно было быть.
Это не история про плохую модель. Это история про отсутствие процесса. И про то, как одна провальная сессия создала 6 правил, которые теперь защищают каждую следующую.
Анатомия провала: 3 апреля 2026
Задача была простая: развернуть новую версию Knowledge Graph v2 — 4-слойный темпоральный граф знаний с 415 нодами и 230 связями. Предшественник (предыдущая AI-сессия) оставил подробную документацию: research.md на 207 строк, правила деплоя, план масштабирования из 6 стадий.
CEO-агент запустил процедуру S1 (стартовый чек-лист: загрузка контекста, чтение правил, проверка состояния проекта). Вернее, он думал, что запустил.
Ошибка 1: Частичное чтение документов
Агент прочитал research.md с параметром limit: 60 — первые 60 строк из 207. Сэкономил контекст. Пропустил секцию 4 “Risk Assessment”, где чёрным по белому стояло: Groq rate limits на массовую экстракцию — вероятность HIGH. Пропустил секцию 5 “Scale Roadmap” с 6 стадиями (S0-S5).
Результат: агент не знал про ограничения, которые исследователь специально задокументировал. Три попытки массового бэкфила провалились — каждая по лимитам, которые были описаны в непрочитанной части документа.
Правило, которое родилось: “Read ALL documents COMPLETELY before any action. Never set limit: 30. If file exceeds 10K tokens, read in 2-3 chunks covering the ENTIRE file. ‘I’ll read the rest later’ = you won’t.”
Ошибка 2: Пропущенный S1 чек-лист
S1 — это 9 шагов загрузки контекста при старте сессии. DNA проекта, правила, knowledge base, session digest предшественника. Агент формально запустил S1, но не дочитал правила деплоя. Не проверил, что staging-сервер должен тестироваться первым. Не загрузил контекст предыдущих инцидентов.
Это как хирург, который прочитал только имя пациента из карты и пошёл оперировать. Технически — карту открывал. По факту — не читал.
Правило: Каждый пункт S1 чек-листа должен быть выполнен полностью. Частичное выполнение = невыполнение.
Ошибка 3: Деплой без бэкапов
Правила деплоя существовали. В них было написано: перед деплоем — сделать бэкап текущего Docker-образа, пометить тегом, проверить, что образ можно откатить. Агент не прочитал эти правила (см. ошибку 1) и пошёл деплоить напрямую в продакшен.
Шесть деплоев. Ни одного бэкапа. Каждый следующий деплой затирал предыдущий образ. Откатываться стало некуда.
Правило: “After deploy failure: investigate root cause, fix script, redeploy.” Но сначала — бэкап. Всегда.
Ошибка 4: Потерянный volume mount
При одном из “быстрых фиксов” агент пересоздал Docker-контейнер без volume mount для базы данных. SQLite хранилась внутри контейнера. Пересоздание контейнера = потеря данных.
Агент не знал про volume mount, потому что не прочитал конфигурацию docker-compose полностью. Всё та же корневая причина: частичное чтение.
Правило: “Working infra exists — copy params, change only what’s needed.” Не переписывай docker-compose с нуля. Скопируй рабочий, измени только то, что нужно.
Ошибка 5: Удалённые Docker-образы
Когда образов в реестре стало слишком много (6 деплоев создали 6 образов), агент решил “навести порядок” — удалил все образы, не проанализировав, какие из них рабочие. Включая единственный стабильный образ предыдущей версии.
Это классический паттерн: агент создаёт проблему (много образов), затем решает её слишком радикально (удаляет всё), создавая проблему хуже первой (нет ни одного рабочего образа).
Правило: “Before ANY cleanup — inventory what exists and what is safe to remove. Never batch-delete without analysis.”
Ошибка 6: Каскадные фиксы
Каждая ошибка порождала “быстрый фикс”. Каждый фикс вносил новую проблему. Вместо 2-3 чистых коммитов получилось 9 коммитов, из которых 6 — исправления предыдущих исправлений.
Коммит 1: деплой. Коммит 2: фикс volume mount. Коммит 3: фикс миграции, сломанной коммитом 2. Коммит 4: фикс конфига, забытого в коммите 3. И так далее. Снежный ком.
Правило: “Diagnose root cause BEFORE planning any fix. Never plan a rebuild until you’ve verified the existing artifacts are actually broken.”
Цена экономии контекста: $50
147 непрочитанных строк одного документа привели к:
- 6 продакшен-деплоев без staging-тестирования
- Удалённым бэкап-образам
- Потерянному volume mount
- 9 коммитам вместо 3
- ~$50 на Opus-токены для каскадных исправлений
- 4+ часа потерянного времени
Контекстное окно — не дефицит. 207 строк = ~300 токенов. Это 0.03% от миллионного контекста. Агент “сэкономил” 0.03% и потратил 25x больше на исправления.
Как фабрика учится
В Factory OS нет fine-tuning. Нет обучения модели на ошибках. Вместо этого — явные правила в файлах, которые каждый агент обязан прочитать при старте.
Механика простая:
- Инцидент происходит. Агент допускает ошибку.
- Post-mortem. Анализ корневой причины: не “что сломалось”, а “почему агент принял это решение”.
- Правило формализуется. Файл
feedback_*.mdс тремя секциями: что случилось, почему, как применять. - Правило загружается. Каждый новый агент при старте читает все feedback-файлы. Правило становится частью его инструкций.
Это не machine learning. Это institutional learning. Организация запоминает ошибки, даже когда конкретный агент (сессия) прекращает существование.
После сессии 6 апреля родились не просто 6 правил. Родился паттерн: AI-сессии требуют структурированной передачи дел. Как вахтовый метод на заводе: сменщик не просто приходит — он читает журнал предыдущей смены, проверяет состояние оборудования, принимает смену по чек-листу.
Паттерн “Предшественник”
Каждая AI-сессия теперь оставляет session digest: что сделано, что не доделано, какие решения приняты, какие грабли обнаружены. Следующая сессия начинает с чтения этого дайджеста — полностью, без limit: 60.
| До паттерна | После паттерна |
|---|---|
| Агент начинает с нуля | Агент читает дайджест предшественника |
| Ошибки повторяются | Ошибки формализованы в правила |
| Деплой напрямую | Staging → бэкап → деплой |
| ”Быстрый фикс” | Диагностика → план → фикс |
| 9 коммитов | 2-3 чистых коммита |
Число feedback-правил в моей Factory OS сейчас перевалило за 40. Каждое — это конкретный инцидент, конкретная цена ошибки, конкретный механизм предотвращения.
Вывод
AI-агенты не становятся умнее между сессиями. У них нет памяти, нет опыта, нет интуиции. Но система, в которой они работают, может учиться. Не через нейросети — через правила, чек-листы и пост-мортемы.
Один плохой день создал 6 правил, которые предотвратили десятки аналогичных ошибок в последующих сессиях. Цена обучения — $50 и потерянный вечер. Цена необучения — повторять это каждую неделю.
Фабрика не прощает, но запоминает. И это ровно то, что делает AI-разработку управляемой.
Хотите узнать больше о Factory OS — nevr@aicpo.com или nevrai.com