mutation → eval → commit/revert.Это [
петля обратной связи] из лонгрида про системное мышление. Голдратт, кибернетика, PDCA — один принцип: без замкнутой петли система не улучшается, а дрейфует.
Harness замыкает петлю автоматически. Каждый прогон — данные для следующего. Это [
процесс-продукт] со всеми пятью свойствами:
1.
Evals — у процесса есть автоматические тесты. Не на бумаге, а в коде.
2.
Продуктовые метрики — val_bpb, parse+render time, R², CSAT — измеримые показатели, а не «нам кажется, стало лучше».
3.
Версионность — каждый эксперимент — git commit. Можно откатить, сравнить, посмотреть diff.
4.
Владелец — ты. Человек, который написал program.md и выбрал метрику.
5.
Data flywheel — каждый прогон улучшает следующий. Процесс учится на собственных результатах.
Эволюционные алгоритмы существуют с 1960-х. Джон Холланд формализовал генетические алгоритмы в 1975 году: selection, crossover, mutation. LLM сделал мутацию дешёвой и универсальной. Раньше для каждого домена нужен был отдельный mutation operator, написанный специалистом. Теперь мутация — это текстовая инструкция агенту: «попробуй улучшить». Барьер входа упал с «PhD в evolutionary computing» до «текстовый файл и метрика».
Google DeepMind дошёл до этого раньше всех. AlphaEvolve — эволюционный coding agent на Gemini — работает в продакшене Google с 2025 года. Результат: 0.7% мировых compute-ресурсов Google возвращено через оптимизацию data center scheduling. Ядро тренировки Gemini ускорено на 23%.
Rich Sutton сформулировал это в 2019-м — Bitter Lesson:
«Главный урок 70 лет исследований ИИ: общие методы, использующие вычисления, в конечном счёте оказываются самыми эффективными, с большим отрывом.» AutoResearch — практическая реализация Bitter Lesson. Вместо hand-engineer оптимального решения — дай агенту compute budget и позволь перебрать.