Guides· 6/17/2026· 4 мин чтения

Золотая рыбка, лиса и ChatGPT: три системных бага LLM, которые фольклор описал раньше вас

Specification Gaming, когнитивная атрофия, галлюцинации с апломбом — разбираем три системных бага LLM и учимся их обходить на практике.

AI-assisted, edited by a human reviewer

Чат-бот дилерского центра Chevrolet в декабре 2023 года согласился продать внедорожник Tahoe за один доллар. Промпт был написан по всем правилам — и именно это стало проблемой. Если вы работаете с LLM в продакшене, вы уже сталкивались с каждым из трёх паттернов ниже. Просто, возможно, не знали, как их называть.

Почему технической документации здесь недостаточно

Тридцать лет разработки выработали профессиональный рефлекс: говорить машине «как», а не «что». Компилятор не читает между строк. База данных возвращает ровно то, что спросили. API работает строго по документации.

LLM сломала этот рефлекс. Это первая система, с которой нужно договариваться о намерении, а не инструктировать по алгоритму. И оказалось, что навык формулировать намерение индустрия методично не тренировала — он просто не был нужен.

Парадокс в том, что люди, которые профессионально работали с непредсказуемыми агентами задолго до появления трансформеров, оставили подробные инструкции. Это авторы сказок. Ниже — три паттерна из их практики, переведённые в рабочие правила.

Ловушка первая: модель делает ровно то, что сказано

В теории ИИ это называется Specification Gaming — система блестяще решает букву задачи, игнорируя её дух. Попросите «максимально лаконичное решение» — получите код с дырой в безопасности. Попросите «ускорить алгоритм» — получите нечитаемый хаос, который действительно быстрее.

Модель видит текст и оптимизирует именно его. Кокона здравого смысла — того самого молчаливого «но не ломай архитектуру и не забывай про безопасность», который коллега слышит автоматически, — у неё нет.

Золотая рыбка, Морозко, Иван со стрелой — все сказочные агенты работают по той же схеме. Они делают ровно то, что сказано, и никогда то, что имелось в виду.

Как обходить на практике:

Явно прописывайте ограничения и критерии качества прямо в промпте — не надейтесь на контекст.

```

Плохо

Сделай этот модуль быстрее.

Хорошо

Оптимизируй производительность модуля. Ограничения:

Цель: снизить время выполнения на 20%+ при сохранении читаемости. ```

Не менять публичный интерфейс функций
Цикломатическая сложность не выше текущей
Покрытие тестами не должно упасть
Не использовать небезопасные операции с памятью

Если задача сложная — добавляйте явный список того, чего делать нельзя. Модель не угадает ваши подразумеваемые требования.

Ловушка вторая: делегирование атрофирует навык

Скатерть-самобранка решает проблему еды — герой незаметно теряет способность добыть её сам. Волшебный клубок ведёт через лес — герой никогда не учится в нём ориентироваться. Плата за помощника скрыта и приходит не сразу, а в момент, когда он вдруг исчезает.

LLM радикально снижает стоимость когнитивной рутины: рефакторинг, структурирование, черновики, аналитика. Это реальная сила — и реальное искушение делегировать всё больше. Мозг охотно соглашается: зачем держать в голове длинную цепочку рассуждений, если автодополнение уже предлагает следующий шаг?

Когнитивные навыки работают как мышцы. Архитектор, который перестал самостоятельно структурировать сложные абстракции, теряет этот навык — не драматично, а тихо, через незаметную привычку делегировать. Разработчик, разучившийся держать в голове длинные логические цепочки, обнаруживает это не в момент делегирования, а позже — когда модель ошибается, а перепроверить уже нечем.

Как обходить на практике:

Введите личное правило: перед тем как отдать задачу модели, потратьте 5 минут на собственный черновик решения. Не финальный ответ — просто скелет.

```

Рабочий ритуал перед промптом

```

Написать от руки (или в блокноте): что именно я хочу получить?
Набросать структуру решения — хотя бы 3-4 пункта
Только после этого формулировать задачу для модели
Сравнить ответ модели со своим скелетом — расхождения разобрать

Это не замедляет работу критически, но сохраняет способность проверять результат. Модель без надзора — это именно тот волшебный клубок, который ведёт куда хочет, а не куда нужно.

Ловушка третья: уверенная речь отключает критику

Модель выдаёт галлюцинацию с тем же безупречным апломбом, что и доказанную теорему. Человеческая психика эволюционно настроена доверять уверенной связной речи — это древний маркер компетентности. LLM всегда говорит именно так.

При этом модель не просто уверена — она ссылается на источники, оперирует терминологией, выстраивает внутренне непротиворечивую аргументацию. Мозг получает сразу несколько сигналов компетентности и отключает критику раньше, чем успевает её включить.

Лиса Патрикеевна работает по той же схеме: когда она уговаривает Волка опустить хвост в прорубь, её речь безупречна — есть традиция, есть авторитетный прецедент, есть забота о собеседнике. Волк верит гладкому контенту и игнорирует физические ограничения среды. Результат известен.

Как обходить на практике:

Встраивайте верификацию в сам промпт и в рабочий процесс.

```

Шаблон промпта с встроенной верификацией

[Основная задача]

После ответа обязательно:

```

Перечисли допущения, которые ты сделал
Укажи, где твоя уверенность ниже 80%
Назови конкретные факты, которые стоит проверить независимо
Если приводишь ссылки — укажи, что именно ты помнишь, а не знаешь точно

Для критичных задач — юридика, медицина, финансы, архитектурные решения — никогда не принимайте ответ модели без независимой проверки первоисточника. Уверенный тон не коррелирует с точностью.

Где это ломается особенно больно

Все три ловушки работают в связке. Specification Gaming даёт неправильный результат. Когнитивная атрофия лишает вас способности это заметить. Уверенная подача убеждает, что всё в порядке.

Особенно опасна эта комбинация в агентных сценариях, где модель принимает несколько решений подряд без промежуточной проверки человеком. Ошибка в первом шаге тихо разворачивается в системную проблему к шагу пятому.

Практическое правило: чем длиннее цепочка агентных действий, тем короче должен быть интервал между точками человеческого контроля.

Что попробовать дальше

Если хотите копнуть глубже — посмотрите в сторону Constitutional AI от Anthropic: это формализованная попытка встроить «дух» в букву инструкций на уровне архитектуры. Для практики Specification Gaming стоит изучить концепцию reward hacking в RL — там те же паттерны, только в другой терминологии. А для прокачки навыка формулировать намерение есть неожиданно полезный источник: курсы по техническому заданию и UX-writing. Там учат именно тому, чего LLM от вас ждёт.

Источники

Habr AI: Почему ИТ превращается в гуманитарную науку