Золотая рыбка, лиса и ChatGPT: три системных бага LLM, которые фольклор описал раньше вас
Specification Gaming, когнитивная атрофия, галлюцинации с апломбом — разбираем три системных бага LLM и учимся их обходить на практике.

Чат-бот дилерского центра Chevrolet в декабре 2023 года согласился продать внедорожник Tahoe за один доллар. Промпт был написан по всем правилам — и именно это стало проблемой. Если вы работаете с LLM в продакшене, вы уже сталкивались с каждым из трёх паттернов ниже. Просто, возможно, не знали, как их называть.
Почему технической документации здесь недостаточно
Тридцать лет разработки выработали профессиональный рефлекс: говорить машине «как», а не «что». Компилятор не читает между строк. База данных возвращает ровно то, что спросили. API работает строго по документации.
LLM сломала этот рефлекс. Это первая система, с которой нужно договариваться о намерении, а не инструктировать по алгоритму. И оказалось, что навык формулировать намерение индустрия методично не тренировала — он просто не был нужен.
Парадокс в том, что люди, которые профессионально работали с непредсказуемыми агентами задолго до появления трансформеров, оставили подробные инструкции. Это авторы сказок. Ниже — три паттерна из их практики, переведённые в рабочие правила.
Ловушка первая: модель делает ровно то, что сказано
В теории ИИ это называется Specification Gaming — система блестяще решает букву задачи, игнорируя её дух. Попросите «максимально лаконичное решение» — получите код с дырой в безопасности. Попросите «ускорить алгоритм» — получите нечитаемый хаос, который действительно быстрее.
Модель видит текст и оптимизирует именно его. Кокона здравого смысла — того самого молчаливого «но не ломай архитектуру и не забывай про безопасность», который коллега слышит автоматически, — у неё нет.
Золотая рыбка, Морозко, Иван со стрелой — все сказочные агенты работают по той же схеме. Они делают ровно то, что сказано, и никогда то, что имелось в виду.
Как обходить на практике:
Явно прописывайте ограничения и критерии качества прямо в промпте — не надейтесь на контекст.
```
Плохо
Сделай этот модуль быстрее.
Хорошо
Оптимизируй производительность модуля. Ограничения:
Цель: снизить время выполнения на 20%+ при сохранении читаемости. ```
- Не менять публичный интерфейс функций
- Цикломатическая сложность не выше текущей
- Покрытие тестами не должно упасть
- Не использовать небезопасные операции с памятью
Если задача сложная — добавляйте явный список того, чего делать нельзя. Модель не угадает ваши подразумеваемые требования.
Ловушка вторая: делегирование атрофирует навык
Скатерть-самобранка решает проблему еды — герой незаметно теряет способность добыть её сам. Волшебный клубок ведёт через лес — герой никогда не учится в нём ориентироваться. Плата за помощника скрыта и приходит не сразу, а в момент, когда он вдруг исчезает.
LLM радикально снижает стоимость когнитивной рутины: рефакторинг, структурирование, черновики, аналитика. Это реальная сила — и реальное искушение делегировать всё больше. Мозг охотно соглашается: зачем держать в голове длинную цепочку рассуждений, если автодополнение уже предлагает следующий шаг?
Когнитивные навыки работают как мышцы. Архитектор, который перестал самостоятельно структурировать сложные абстракции, теряет этот навык — не драматично, а тихо, через незаметную привычку делегировать. Разработчик, разучившийся держать в голове длинные логические цепочки, обнаруживает это не в момент делегирования, а позже — когда модель ошибается, а перепроверить уже нечем.
Как обходить на практике:
Введите личное правило: перед тем как отдать задачу модели, потратьте 5 минут на собственный черновик решения. Не финальный ответ — просто скелет.
```
Рабочий ритуал перед промптом
```
- Написать от руки (или в блокноте): что именно я хочу получить?
- Набросать структуру решения — хотя бы 3-4 пункта
- Только после этого формулировать задачу для модели
- Сравнить ответ модели со своим скелетом — расхождения разобрать
Это не замедляет работу критически, но сохраняет способность проверять результат. Модель без надзора — это именно тот волшебный клубок, который ведёт куда хочет, а не куда нужно.
Ловушка третья: уверенная речь отключает критику
Модель выдаёт галлюцинацию с тем же безупречным апломбом, что и доказанную теорему. Человеческая психика эволюционно настроена доверять уверенной связной речи — это древний маркер компетентности. LLM всегда говорит именно так.
При этом модель не просто уверена — она ссылается на источники, оперирует терминологией, выстраивает внутренне непротиворечивую аргументацию. Мозг получает сразу несколько сигналов компетентности и отключает критику раньше, чем успевает её включить.
Лиса Патрикеевна работает по той же схеме: когда она уговаривает Волка опустить хвост в прорубь, её речь безупречна — есть традиция, есть авторитетный прецедент, есть забота о собеседнике. Волк верит гладкому контенту и игнорирует физические ограничения среды. Результат известен.
Как обходить на практике:
Встраивайте верификацию в сам промпт и в рабочий процесс.
```
Шаблон промпта с встроенной верификацией
[Основная задача]
После ответа обязательно:
```
- Перечисли допущения, которые ты сделал
- Укажи, где твоя уверенность ниже 80%
- Назови конкретные факты, которые стоит проверить независимо
- Если приводишь ссылки — укажи, что именно ты помнишь, а не знаешь точно
Для критичных задач — юридика, медицина, финансы, архитектурные решения — никогда не принимайте ответ модели без независимой проверки первоисточника. Уверенный тон не коррелирует с точностью.
Где это ломается особенно больно
Все три ловушки работают в связке. Specification Gaming даёт неправильный результат. Когнитивная атрофия лишает вас способности это заметить. Уверенная подача убеждает, что всё в порядке.
Особенно опасна эта комбинация в агентных сценариях, где модель принимает несколько решений подряд без промежуточной проверки человеком. Ошибка в первом шаге тихо разворачивается в системную проблему к шагу пятому.
Практическое правило: чем длиннее цепочка агентных действий, тем короче должен быть интервал между точками человеческого контроля.
Что попробовать дальше
Если хотите копнуть глубже — посмотрите в сторону Constitutional AI от Anthropic: это формализованная попытка встроить «дух» в букву инструкций на уровне архитектуры. Для практики Specification Gaming стоит изучить концепцию reward hacking в RL — там те же паттерны, только в другой терминологии. А для прокачки навыка формулировать намерение есть неожиданно полезный источник: курсы по техническому заданию и UX-writing. Там учат именно тому, чего LLM от вас ждёт.