Решающее правило для каждой задачи, которая приходит в работу. Три состояния, не два.
Делегировать. Когда есть внешний валидатор и чёткая спека. Внешний валидатор — компилятор, тестовый набор, регулярное выражение, JSON-схема. Чёткая спека — формальный вход и формальный выход. Anthropic в августе 2025 опубликовала отчёт о том, как сами инженеры внутри лаборатории работают с Claude. Они зафиксировали принцип:
easily verifiable + low-stakes + self-contained + repetitive. Где все четыре галочки — делегируй. Уровень сложности задач, которые они отдают модели, вырос с 3.2 до 3.8 по их внутренней шкале за полгода. Это нормально, когда позиция держится — рамка остаётся, а внутри неё доверие моделям растёт.
Спаррингироваться. Когда нужен второй мозг для рассуждения, но решение остаётся за человеком. Модель —
sparring partner. В статье 17 цикла 2 — [
persistence study CMU/Oxford/MIT/UCLA]: solver-режим вызывает атрофию через 10 минут, sparring-режим — нет. На уровне работы это значит: ты пишешь свой первый ответ. Потом просишь модель критиковать. Потом ты решаешь, что взять, что отвергнуть. Решение за тобой. Это сложнее, чем «
реши за меня», и даёт результат другого порядка.
Не использовать. Когда никакая определённость не возможна. Air Canada — пример. Их AI-бот выдал клиенту скидку, которую реальная политика компании не поддерживала. Канадский трибунал в феврале 2024 решил: ответ бота = политика компании, выплатить 812 долларов. Причина — компания не определила, какие политики бот может произносить от лица бренда. Правило простое: определите границу или не выпускайте.
Проверка на каждый кейс:
где здесь vocabulary, где валидатор, где цена ошибки. Ответ определяет режим. Если все три пустые — задача не для модели.