Текст проверяет LLM. Но код проверяет компилятор. Цифры проверяет Python-скрипт. Формат проверяет JSON Schema.
Компилятор не галлюцинирует. Тест не фантазирует. Линтер не выдумывает. Если задача формализуема — используй формальную проверку. Это единственный способ получить 100% гарантию.
Kleppmann в 2025 году написал: «
AI сделает формальную верификацию мейнстримом». Модель генерирует — proof checker отвергает всё невалидное. LLM как генератор гипотез, детерминированный инструмент как фильтр. Не либо/либо — оба вместе.
Для нашей аудитории это переводится просто:
Собственник. Ваш AI-бот отвечает клиентам? Ответы проверяет скрипт на наличие запрещённых формулировок + второй LLM сверяет с базой знаний. Не один слой — два. Air Canada поставила бота без проверки. Суд признал: компания отвечает за ложь бота. Прецедент.
Руководитель. Команда генерирует отчёты с помощью AI? Числа валидируются скриптом против CRM. Выводы проверяет отдельная модель с доступом к источникам. Формат — JSON Schema. Рутинный QA уходит из рук людей.
Специалист. Пишешь код с Copilot? Компилятор и тесты — твоя страховка. Генерируешь текст? Заведи валидатора: отдельный промпт, отдельный контекст, задача — найти несоответствия. Это и есть переход от оператора к архитектору.