Yan Lukashin

Запах резины. Как выжечь генеративный пластик из текста архитектурой, а не уговорами

Открываете LinkedIn. Скроллите ленту. И где-то на третьем посте чувствуете его — тот самый запах. Свежей автомобильной резины и фальшивых инсайтов. Слова умные, запятые на местах. Скулы сводит от тоски.

Вы не один. Этот запах теперь чувствуют все, кто читает достаточно много. Журнал Trends in Cognitive Sciences в начале 2026 опубликовал работу, в которой авторы прямо измерили: стилистическое разнообразие на Reddit, в научных журналах и в peer-reviewed литературе уже снизилось. Это не ощущение. Это зафиксированная гомогенизация. LLM усиливают доминирующие стили и заглушают альтернативные — и эффект, по словам авторов, усугубляется RLHF.

Большинство людей пытается лечить это новыми промптами. «Пиши живо». «Пиши как Стив Джобс». «Добавь юмора». Это запросы к статистике быть исключением из самой себя. Они не работают и работать не могут.

Эта статья — про то, почему. И про то, что работает вместо этого.

И ещё одна важная вещь, прежде чем мы пойдём дальше. Эта статья — про то, как избегать генеративного пластика. Значит, она сама должна быть нулём пластика. Если вы дочитаете до конца и почувствуете в моём тексте резину — статья провалилась. Это критерий приёмки, который я заложил перед публикацией. Прогнал собственный текст через свой же фильтр и переписал всё, что не прошло.

Почему «пиши живо» не работает

Языковая модель не знает, что такое «живо». У неё нет жизненного опыта, нет молодости, нет похорон, нет первой любви, нет похмелья. У неё есть распределение вероятностей над последовательностями токенов, выученное на корпусе размером с интернет.

Когда вы пишете «напиши пост про лидерство», вы открываете перед моделью пустую комнату. Огромную, ничем не заполненную тему, которую она должна укладывать в текст. И в этой пустоте включается базовая механика авторегрессионной генерации: при низкоэнтропийном контексте модель сваливается в high-probability шаблоны. То есть в самые статистически частые конструкции, которые в её обучающем корпусе встречались миллион раз.

У этого явления есть технический термин — mode collapse. Команда Hannah Kirk показала это эмпирически ещё в 2024 году на ICLR: RLHF систематически снижает разнообразие выходов, и это происходит вне зависимости от входа. Модель сваливается в узкий стиль даже при разных задачах. Авторы прямо пишут: «Творческая способность LLM уменьшается после alignment».

Свежая работа октября 2025 — «Verbalized Sampling» — пошла дальше и нашла причину. Mode collapse сидит в самих данных предпочтений. У людей-разметчиков есть typicality bias: они предпочитают предсказуемое, гладкое, знакомое. Это эволюционная штука — мозг любит беглость, потому что беглость = безопасность. Разметчики выбирают «гладко», RLHF это усиливает, гладкость цементируется в весах. Я уже разбирал ровно эту механику применительно к лести в [«Вы натренировали ChatGPT вам врать»]. Здесь то же самое, только вместо подхалимства цементируется риторический шаблон.

Когда вы пишете «пиши живо», происходит вот что. Модель добавляет в выход статистически правдоподобные маркеры живости: восклицание здесь, вопрос там, личное местоимение, метафора уровня «это как...». И эти маркеры сами становятся новым пластиком, потому что они тоже — high-probability шаблоны для запроса «пиши живо». Вы не вышли из mode collapse. Вы просто переехали в его другой регион.

Delve, intricate, tapestry

Если вам нужна конкретика — вот слово, на которое научный мир уже отреагировал: delve. Florida State University в 2025 году опубликовала на COLING работу, в которой Юзек и Уорд измерили частотность 21 «фокусного» слова в научных абстрактах. Delve — на первом месте. Резкий скачок после появления ChatGPT. Полный список включает intricate, underscore, tapestry, boast, commendable, showcase, surpass, unlocking, realm и ещё одиннадцать.

У этой работы есть второе наблюдение, которое мне кажется ещё важнее списка. Участники их эксперимента реагировали на слово «delve» негативнее, чем на другие AI-маркеры. У читателей уже выработался условный рефлекс. Видишь delve — чувствуешь резину. Это коллективный носовой биомаркер, который образовался за два года.

Англоязычный список существует. Русскоязычного аналогичного академического исследования я не нашёл. Но если опереться на опыт работы с LLM на русском, рабочий минимум выглядит примерно так:
- «важно отметить»
- «в современном мире»
- «в заключение»
- «стоит подчеркнуть»
- «является ключевым»
- «нельзя не упомянуть»
- «играет важную роль»
- «открывает новые возможности»

Ваш список будет другим. Но он у вас точно есть, и вы его узнаёте в чужих текстах с первого абзаца.

Текст без запаха: личный кейс

Недавно мы с командой собирали сценарий одного из модулей курса AI Architect. Концептуальный урок на 35 минут, сложная тема. Прогнали драфт через модель — и я поймал себя на странном ощущении. Текст не пах роботом. Совсем. Я перечитал три раза, пытаясь поймать резину, — её там не было.

Почему так получилось?

Потому что у модели не было пустой комнаты. У неё был железобетонный чертёж.

Что было на входе:

1. Жёсткие ограничения формы. Бюджет 35 минут — переведено в бюджет слов. Заданная структура (введение → концепт → пример → практика → закрытие). Цели урока по таксономии Блума, привязанные к каждой секции. Тон — конкретный, без академического выпендрёжа.

2. Плотная фактура. Конкретный кейс Klarna с цифрами по AI-внедрению. Шесть параметров для сравнения подходов. Четыре модуля архитектуры агентов с примерами. Пять уровней сложности от Anthropic. На каждый абзац у модели было что говорить — и это «что говорить» не она придумывала. Она это укладывала.

3. Заданные метафоры. Аналогии прописаны заранее: стажёр → конвейер → управляющий. Модель не искала образы. Она использовала наши.

В этой архитектуре у модели физически не было места для генеративного выхлопа. Ей некогда было выкручивать «давайте погрузимся в захватывающий мир», потому что нужно было успеть уложить шесть параметров Klarna в бюджет 700 слов. Она перестала быть фантазёром. Она стала компилятором. Заливала бетон в наши формы.

Это та же мысль, которую я разбирал в [«Промпт — пожелание. Спека — контракт.»] — но с другой стороны. Там я говорил про точность результата. Здесь — про читаемость. Это одно явление с двух углов. И это та же физика, которую я разобрал в [«Язык — это яд»]: LLM — генератор языка, и без плотного контракта он генерирует то, что чаще всего встречалось в обучающем корпусе. То есть пластик.

Честно скажу: рандомизированного академического эксперимента «constraint-based промпт даёт меньше клише, чем свободный» в литературе 2025–2026 я не нашёл. Ближайшее — работа Choi с коллегами в SAGE Open 2025 года, которая показала, что специфичность контекста и явные ограничения улучшают качество ответов на creative-problem-solving задачах. Это не прямой A/B по «шаблонности», но это в том же направлении. Прямой эксперимент про пластик ещё никто не сделал. У меня есть только мой собственный — кейс с курсом. И механизм, который этот кейс объясняет: больше структуры на входе → меньше места для mode collapse на выходе.

Правило архитектора

Сформулирую прямо.

Чем детальнее контракт на входе, тем меньше места для генеративного выхлопа на выходе.

Это не «совет». Это техническое следствие из того, как работает авторегрессионная генерация. Высокоэнтропийный контекст (много фактов, ограничений, заданных образов) сужает пространство правдоподобных продолжений. Низкоэнтропийный («напиши пост про X») оставляет открытыми миллионы путей, и модель идёт по самому статистически вероятному. Самый вероятный путь и есть пластик.

Из этого вытекает три практических правила.

Правило 1. Спека вместо темы. Не «напиши пост про лидерство», а «напиши пост на 800 слов, структура: личный провал → урок → переформулировка → практика, тон — без академизма, аудитория — собственники МСБ, обязательный пример из реальной компании с цифрами». Каждое уточнение режет 90% возможных продолжений.

Правило 2. Фактура от вас, а не от модели. Модель не знает ваших историй, ваших клиентов, ваших цифр, ваших оговорок. Когда вы просите её «придумать пример» — она генерирует медианный пример из своего корпуса. Медианный пример — это пластик по определению. Дайте свой. Один реальный кейс с цифрами стоит двадцати «представим, что компания X».

Правило 3. Метафоры заранее. Если вы хотите, чтобы текст работал с конкретными образами — пропишите их в спеке. «Используй метафору конвейера для описания пайплайна, метафору врача для описания валидации». Иначе модель возьмёт первую попавшуюся метафору из своего корпуса, и она будет статистически медианной — «это как...», «представьте себе», «словно».

Эти три правила режут больше пластика, чем любой фильтр на выходе. Но фильтр на выходе тоже нужен — потому что даже в самом плотном контракте модель по привычке вставит пару дешёвых фигур.

Анти-пластиковый фильтр: десять запретов

Чтобы выжечь окончательно, я зашил в системный промпт своих агентов жёсткий список из десяти классов конструкций. Любой генеративный текст палится не на фактах. Он палится на каркасе. На том, как собрана мысль. И каркас собирается из примерно десяти повторяющихся фигур.

1. Зеркальные оппозиции. «Это не X, это Y». «Не столько X, сколько Y». «Дело не в X, дело в Y». Самая массовая категория. Создаёт иллюзию глубокой мысли через дешёвый разворот.

2. Псевдо-перевороты через «даже не». «Важно даже не X, а Y». «Самое смешное даже не в X». Та же оппозиция, усиленная фальшивой драматургией.

3. «Самое X не в том, что...» «Самое интересное не в том, что...». «Хуже всего не то, что...». Анонс инсайта вместо инсайта.

4. Ложные рамки «не то чтобы». «Не то чтобы это проблема, но...». Уклонение от утверждения, замаскированное под нюансировку.

5. Дешёвые «на самом деле». «На самом деле X». «В реальности X». «По-настоящему важно другое». Претензия на разоблачение без разоблачения.

6. Анонс вывода вместо вывода. «Главный вывод здесь простой». «Если совсем упростить». «Короче говоря, суть в том, что». Фраза, которая обещает мысль, и которую можно вырезать без потери — потому что мысль идёт следом и сама себя показывает.

7. Фальшивые углубления. «Но глубже здесь другое». «Но интереснее другое». «Но настоящий вопрос в другом». Имитация перехода на новый смысловой слой.

8. Псевдо-инсайт через «настоящий X». «Настоящая история в другом». «Реальный смысл в другом». Та же фальшивая глубина, только через прилагательное.

9. Шаблоны «дело / суть / смысл / вопрос в том, что». Универсальный риторический клей, который ничего не значит, но создаёт ощущение утверждения.

10. Дубовые антитезы. «Не победа, а сигнал». «Не ошибка, а стратегия». «Не рынок, а театр». Стилизация под афоризм через оппозицию двух существительных.

Главное правило, которое я заложил в инструкцию агенту: если фразу можно свернуть в прямое человеческое утверждение без потери смысла — сворачивай. Не уговаривай, не нюансируй, не выворачивай. Скажи прямо. Живой текст появляется там, где автор говорит прямо и не прячет мысль за риторическим мусором.

Этот список — рабочий минимум, он ловит примерно 80% случаев. Каждый автор соберёт свой по мере чтения собственных провалов.

Как зашить это в системный промпт

Фильтр должен жить в системном промпте агента. Тогда он режет всю продукцию дальше — без вашего участия. Один раз настроили, и забыли. Час работы, бессрочный эффект.

Минимальный кусок системного промпта, который я использую, выглядит примерно так (упрощённо):

```
ANTI-PLASTIC FILTER (обязательно):

Запрещённые классы конструкций:
1. Зеркальные оппозиции «не X, а Y»
2. Псевдо-перевороты «даже не X»
3. «Самое X не в том, что»
4. «Не то чтобы X, но Y»
5. «На самом деле / в реальности»
6. Анонс вывода («суть проста», «короче говоря»)
7. Фальшивые углубления («но глубже другое»)
8. «Настоящий X / реальный X»
9. «Дело / суть / смысл / вопрос в том, что»
10. Антитезы вида «не X, а Y» в коротких афоризмах

Правило: если фразу можно свернуть в прямое утверждение
без потери смысла — сворачивай. Не уговаривай, не нюансируй,
не выворачивай. Скажи прямо.

Перед выдачей результата прогони текст через этот список.
Каждое нарушение — переписать.
```

Дальше можно поставить второй проход: отдельный agent с одним заданием — найти и удалить все десять классов в готовом тексте. Дешёвый второй слой защиты, особенно для длинных артефактов.

И ещё один трюк, который я подсмотрел у себя же. После генерации можно прогнать grep по тексту простыми регулярками: `не [а-я]+, а [а-я]+`, `на самом деле`, `суть в том`, `дело в том`. Каждый матч смотришь глазами и решаешь — оставить или переписать. Большинство — переписать.

Что не делегируется машине

Здесь нужна жёсткая граница, иначе вся методика рассыпается.

Метафоры, синтез несовместимого, структуру, неожиданные ходы, личные истории, оговорки, провалы, эмоцию — делает человек. Машина эту работу не сделает никогда, потому что её обучающий корпус — это медиана человечества, а интересный текст всегда находится на хвосте распределения. Не там, где модель.

Машина укладывает ваши смыслы в читаемый код текста. Она компилятор. Очень быстрый, очень удобный, очень полезный — и очень тупой по части того, что именно стоит сказать.

Это разделение труда. Творит автор. Машина компилирует. Любой обратный порядок — и вы получаете автопилотный пост в LinkedIn, который читать невозможно. Вы и сами это знаете — потому что сами их пролистываете.

Когда я говорю команде «не просите модель быть креативной», я не борюсь с её способностями. Я её защищаю. В креативном режиме она генерирует медианный шум. В компиляторском — упаковывает ваш смысл. Используйте её там, где она сильна.
Закрытие

Перестаньте просить ИИ «быть креативным». Заберите у него право импровизировать. Дайте ему бетонную форму: спеку, фактуру, метафоры, запреты.

Тогда модель перестанет генерировать пластик — потому что у неё больше нет места его генерировать. Она будет делать то, для чего реально хороша: укладывать ваш смысл в читаемую форму. Быстро, дёшево, без претензий на авторство.

А смысл будет ваш. Как и должно быть.

Я разбираю, как такие фильтры зашиваются в системные промпты агентов и в валидаторы текста, на курсе [AI Architect]. Не для того, чтобы научить «лучше промптить» — этого жанра не существует. А для того, чтобы показать, как строится архитектура: контракт на входе, проверка на выходе, агент как компилятор, человек как автор.

И последнее. Этот текст прошёл через свой собственный фильтр. Если вы дочитали до конца и не почувствовали запаха резины — значит, метод работает. Если почувствовали — напишите мне, где именно. Это самая честная обратная связь, которую можно дать статье про выжигание пластика.

Keep printing.

Источники и данные

Mode collapse и RLHF
- Kirk et al., "Understanding the Effects of RLHF on LLM Generalisation and Diversity", ICLR 2024 — across-input mode collapse, эмпирическое доказательство — https://arxiv.org/abs/2310.06452
- "Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity" (arXiv 2510.01171, октябрь 2025) — typicality bias как причина mode collapse, RLHF amplifies majority-style responses — https://arxiv.org/html/2510.01171v1
- "The Price of Format: Diversity Collapse in LLMs" (arXiv 2505.18949, май 2025) — chat-format вызывает diversity collapse независимо от RLHF — https://arxiv.org/html/2505.18949v1

Гомогенизация языка в реальных корпусах
- "The Homogenizing Effect of Large Language Models on Human Expression and Thought", *Trends in Cognitive Sciences* 2026 (Cell Press) — измеренное снижение стилистического разнообразия в Reddit, научной литературе, peer-reviewed журналах — https://www.cell.com/trends/cognitive-sciences/abstract/S1364-6613(26)00003-3
- arXiv preprint: https://arxiv.org/html/2508.01491v1

Лингвистические маркеры AI-текста
- "A Survey on LLM-Generated Text Detection", *Computational Linguistics* (MIT Press), 2025 — статистические маркеры: лексическая бедность, повторы, синтаксис — https://direct.mit.edu/coli/article/51/1/275/127462
- "Contrasting Linguistic Patterns in Human and LLM-Generated News Text" (PMC 11422446, 2024) — стилометрия, repeat terms внутри параграфа — https://pmc.ncbi.nlm.nih.gov/articles/PMC11422446/
- "The Science of Detecting LLM-Generated Text", Communications of the ACM — почему детекторы не работают — https://cacm.acm.org/research/the-science-of-detecting-llm-generated-text/

«Delve» и overused слова
- Juzek & Ward, "Why Does ChatGPT 'Delve' So Much? Exploring the Sources of Lexical Overrepresentation in Large Language Models", COLING 2025 — 21 фокусное слово, RLHF как механизм, негативная реакция читателей на «delve» — https://aclanthology.org/2025.coling-main.426/
- arXiv: https://arxiv.org/html/2412.11385v1
- Florida State University press release: https://news.fsu.edu/news/science-technology/2025/02/17/why-does-chatgpt-delve-so-much-fsu-researchers-begin-to-uncover-why-chatgpt-overuses-certain-words/
- "Delving Into PubMed Records: How AI-Influenced Vocabulary has Transformed Medical Writing since ChatGPT" (PMC 12679996, 2025) — измеренное проникновение AI-маркеров в медицинскую литературу — https://pmc.ncbi.nlm.nih.gov/articles/PMC12679996/

Constraint-based prompting
- Choi, Lee, Han, Han, "Effects of Prompt Elements on Problem-Solving Performance and User Experience", *SAGE Open* 2025 — specificity и constraints улучшают качество ответов — https://journals.sagepub.com/doi/10.1177/21582440251381680

Авторские концепции и предыдущие лонгриды серии
- [Промпт — пожелание. Спека — контракт.]
- [Вы натренировали ChatGPT вам врать]
- [Язык — это яд]

Исследования AI Architect

Актуальные исследования внедрения ИИ в процессы бизнеса и отдельно человека
Friday, April 10
Три зимы. Как ИИ трижды обещал всё изменить — и только с четвёртого раза начал
История ИИ — это три цикла, в которых технология работала в лаборатории, но не становилась бизнес-ценностью. Каждый раз причина одна: Individual AI работал, Institutional AI — нет. Символисты 1960-х пытались перепрыгнуть с уровня моделей сразу в приложения, не имея ни инфраструктуры, ни данных, ни вычислений. Экспертные системы 1980-х — это C2 (фрагментированный ИИ): блестящие решения в отдельных доменах, которые невозможно оркестрировать и масштабировать. В обоих случаях бизнес ставил электрический мотор вместо парового — и не перестраивал цех. Текущий цикл (2022–2026) — первый, в котором все пять слоёв отрасли (энергия → чипы → инфраструктура → модели → приложения) существуют одновременно, а технология дешёвая и встраиваемая. Но большинство компаний по-прежнему на C1–C2: покупают инструменты, не перестраивая процессы. Тот, кто знает историю зим, видит: единственная страховка — переход от инструментов к процессам, от Individual AI к Institutional AI.
Sunday, April 12
Шестой этаж. Почему нейроинтерфейсы — финальный выход из словесной клетки
Bottleneck в работе с ИИ — не качество модели и не качество промпта. Bottleneck — сам факт, что между мыслью и машиной стоит язык. Язык эволюционно отлажен под голосовые связки приматов: канал шириной в десятки бит в секунду, с потерей ~99% исходного многомерного представления. Пока язык — единственный мост, потолок задаёт не модель, а пропускная способность канала. Brain-Computer Interface убирает этот мост: мысль попадает в машину до того, как её приходится сжать в слова. Это не «улучшение интерфейса» — это вычёркивание целого этажа перевода. И это переопределяет архитектора: уже не тот, кто умеет писать спеки, а тот, кто умеет держать чистый внутренний образ. Тренировка внимания становится главным skill следующих десяти лет — и она работает уже сейчас, без всякого BCI.
Хочешь разобраться системно?
AI Architect — программа менторства для тех, кто строит ИИ-системы, а не промпты. От индивидуального использования к институциональному внедрению.
Made on
Tilda