Yan Lukashin

Картограф, а не карта

В апреле 2025 пользователи Cursor — IDE для программистов на основе LLM — стали получать одно и то же сообщение от службы поддержки: «по нашей политике, одна подписка работает только на одном устройстве». Это объясняло, почему их выбрасывало из аккаунта при переключении между ноутбуком и десктопом.

Через сутки в Reddit вышел co-founder Cursor Майкл Труэлл с одной фразой: «We have no such policy».

Политики не существовало. Бот её придумал. Реальная причина разлогинов была технической — race condition при медленном соединении. Но за двадцать четыре часа достаточное количество пользователей успело отменить подписки. Бот «Sam», обученный на корпусе саппорт-обращений из всей SaaS-индустрии, применил среднее по индустрии определение «политики безопасности» к Cursor. Никто внутри компании не определил, что говорит её саппорт от лица бренда.

Параллельная история. В феврале 2024 Klarna объявила, что AI-ассистент на OpenAI делает работу 700 FTE и обрабатывает 2.3 миллиона чатов за первый месяц. В мае 2025 CEO Себастьян Семятковский сказал в интервью Bloomberg: «As cost unfortunately seems to have been a too predominant evaluation factor when organizing this, what you end up having is lower quality». CSAT упал на 22%. Klarna вернула людей.

Что у них общего с Cursor? Оба отдали модели одно слово.

У Cursor — слово «политика». У Klarna — слово «решённый кейс». Для модели «решено» = «диалог завершён, пользователь не спорит». Для бизнеса = «не вернётся через две недели». Никто эти два определения не сравнил, потому что никто не написал бизнесовое.

И третья история. В апреле 2025 утёк меморандум Тоби Лютке, CEO Shopify: «Reflexive AI usage is now a baseline expectation at Shopify». Лютке его подтвердил публично. То, что Shopify делает внутри — обратное Cursor и Klarna.

Они держат словарь у себя. Инфраструктура, в которой все ключевые определения уже зафиксированы и доступны через структурированный протокол.

Это и есть три сцены. Три разных слова, потерянных или удержанных. И одна позиция, которая определяет, что произойдёт.

Картограф vs пользователь карты

Тест на 30 секунд. Я задаю его на каждом первом курсовом интенсиве.

«Назовите ключевое слово в вашей работе. Что значит это слово в вашей компании? Где это записано? Кто отвечает за определение?»

В 80% команд ответы выглядят так. Слово назвать могут — обычно «качество», «срочность», «релевантность», «эффективность». На «что оно значит» — пять разных версий от пяти человек в команде. На «где записано» — «нигде, как-то так подразумевается». На «кто отвечает» — пауза.

В этих 80% картографа нет. Алфавит размазан по корпоративному фольклору. Когда LLM приходит в такую систему, он заполняет пустоту. Где у вас не определено — там определит он. Через год у вас в системе двадцать пять чужих определений ваших же слов.

Картография — операционная позиция. Право и обязанность сказать: «здесь определение слабое — переписать». Может быть у CEO, у продакта, у инженера, у тимлида. Один человек на одну зону. Никакой «AI-лид» для этого не нужен. Нужен взрослый, который держит карандаш.

В оставшихся 20% команд картограф есть. Я узнаю их по простому признаку: у них есть документ, который раз в квартал пересматривается. В нём написано: «важный клиент = X. Срочный заказ = Y. Качественный ответ = Z». Они не зависят от того, какую модель сегодня запустила OpenAI. Они работают по своей карте, на которой эти слова уже определены.

Делегировать, спаррингироваться, не использовать

Решающее правило для каждой задачи, которая приходит в работу. Три состояния, не два.

Делегировать. Когда есть внешний валидатор и чёткая спека. Внешний валидатор — компилятор, тестовый набор, регулярное выражение, JSON-схема. Чёткая спека — формальный вход и формальный выход. Anthropic в августе 2025 опубликовала отчёт о том, как сами инженеры внутри лаборатории работают с Claude. Они зафиксировали принцип: easily verifiable + low-stakes + self-contained + repetitive. Где все четыре галочки — делегируй. Уровень сложности задач, которые они отдают модели, вырос с 3.2 до 3.8 по их внутренней шкале за полгода. Это нормально, когда позиция держится — рамка остаётся, а внутри неё доверие моделям растёт.

Спаррингироваться. Когда нужен второй мозг для рассуждения, но решение остаётся за человеком. Модель — sparring partner. В статье 17 цикла 2 — [persistence study CMU/Oxford/MIT/UCLA]: solver-режим вызывает атрофию через 10 минут, sparring-режим — нет. На уровне работы это значит: ты пишешь свой первый ответ. Потом просишь модель критиковать. Потом ты решаешь, что взять, что отвергнуть. Решение за тобой. Это сложнее, чем «реши за меня», и даёт результат другого порядка.

Не использовать. Когда никакая определённость не возможна. Air Canada — пример. Их AI-бот выдал клиенту скидку, которую реальная политика компании не поддерживала. Канадский трибунал в феврале 2024 решил: ответ бота = политика компании, выплатить 812 долларов. Причина — компания не определила, какие политики бот может произносить от лица бренда. Правило простое: определите границу или не выпускайте.

Проверка на каждый кейс: где здесь vocabulary, где валидатор, где цена ошибки. Ответ определяет режим. Если все три пустые — задача не для модели.

Метрики удержания позиции

Самопроверка по пяти вопросам. Делается за минуту, ответы дают точную картину.

Первый. Можете за 30 секунд назвать определение ключевого слова вашей работы? Не «срочное по ощущению» — формальное определение, которое можно записать одним предложением. Если запинка длиннее трёх секунд — определения в команде нет.

Второй. Есть ли у команды vocabulary как артефакт? Документ, к которому вы возвращаетесь. Не маркетинг — внутренняя рабочая карта. Если нет файла — нет vocabulary, что бы все ни «знали по умолчанию».

Третий. Есть ли человек с правом сказать «здесь определение слабое»? Без этой роли vocabulary зарастает. Через полгода в нём появляются три определения «качества», все по-разному, никто не помнит, какое верное.

Четвёртый. Есть ли eval, который вы сами написали? Не SaaS-метрика «удовлетворённость». Не дашборд из Mixpanel. Маленький набор задач, который вы прогоняете руками раз в месяц и смотрите, как работает ваш контур. Если eval ваш — карандаш у вас. Если eval из коробки — алфавит у разработчика этой коробки.

Пятый. Можете объяснить, как вы выбрали именно эти метрики? Если ответ «модель так предложила» — у вас уже не ваши метрики.

Если на четыре из пяти ответ «да» — вы картограф. Если на три и меньше — карандаш частично уехал. Чем меньше «да», тем больше у вас в системе чужих определений.

Симптомы потери позиции, которые я слышу постоянно: «модель так предложила». «Давайте возьмём, что выдала». «Не помню, как мы это решили». «Работает же». Каждая из этих фраз — индикатор, что определение пришло снаружи.

Возврат к четырём зазорам

Цикл 2 был про четыре зазора между скоростью машины и скоростью адаптации. Все четыре закрываются одной позицией.

[Когнитивный зазор (статья 17)]: мозг сдаётся, когда отдаёт решение. Persistence study показал водораздел solver/sparring. Картограф остаётся в sparring-режиме, не уступает функцию воли. Это и есть когнитивный аспект позиции.

[Рыночный зазор (статья 18)]: AI Index 88% компаний касается ИИ, Census 18% использует системно, McKinsey 1% — mature. Разница между «касается» и «mature» — вопрос позиции. Кто строит свою карту, тот в третьей категории. Кто покупает чужие — в первой.

[Системный зазор (статья 19)]: институциональный буфер исчез, внешнего стандарта зрелости нет. Картограф пишет внутренний — модель C0–C5 как собственная метрика. Это и есть «карта устарела — черти свою».

[Онтологический зазор (статья 20)]: алфавит держит человек. Модель симулирует акт понимания, не инстанциирует его. Картограф — тот, кто не отдаёт алфавит.

Все четыре — проекции одной позиции. Цикл 2 — это четыре среза одной вещи, которой большинство компаний не удерживают. И это операционная разница между Klarna, которая через 14 месяцев вернула людей, и Shopify, которая 14 месяцев работала на собственной карте.

Что меняется через год

Команды, которые год работают с картографической позицией, я узнаю по нескольким признакам.

У них есть vocabulary, который живёт. В нём двадцать ключевых слов. Раз в квартал пересматривается. Когда новый человек приходит — читает его за час и понимает базовые определения.

Они тратят меньше времени на «доводку» промптов. Основная работа уже сделана в спеке: модель получает контекст, в котором определения уже есть. Промпт превращается из эссе в шаблон.

Они меняют модель за неделю. Vocabulary живёт отдельно от инструмента. Когда выходит GPT-6 или Claude 5 — они подключают и тестируют. Не пересобирают всю систему.

Они могут объяснить, почему результаты выглядят именно так. Через год работы у них есть аудит-логи, evals, истории решений. Никаких «модель так предложила» — везде есть человек и определение, которое он защищал.

Они не зависят от релизов. Anthropic выпустит что-то — посмотрят. OpenAI отзовёт фичу — переключатся. Их операционная модель построена на собственной карте, не на конкретной модели.

Команды без позиции через год выглядят иначе. Каждый новый промпт — новое определение, потому что старого нет. Смена модели — это пересборка всех процессов, потому что определения вшиты в конкретные prompt-шаблоны. Метрики плывут, никто не помнит, почему изначально они выглядели так. Через год компанию нельзя продать — никто не может объяснить устройство своих процессов потенциальному покупателю.

Это операционная реальность 2025–2026. Klarna обнаружила её через 14 месяцев. Cursor — через неделю. Shopify избежал, потому что начал с правильной позиции и инвестировал в инфраструктуру до того, как раздавать модели сотрудникам.

В понедельник утром

Конкретно — что меняется в работе с завтра.

Откройте свой основной промпт. Найдите все размытые слова. Каждое подчёркните. Это места, где алфавит уехал. Час работы — добавить определения в vocabulary-файл и подгрузить в контекст.

Соберите команду на 30 минут. Задайте вопрос: «что значит „качественный результат“ в нашей работе?» Если ответы расходятся — у вас нет картографа. Договоритесь о едином определении, запишите.

Назначьте человека с правом сказать «здесь определение слабое». Один. Без этой роли vocabulary не живёт.

Напишите свой eval. Десять задач. Прогоняйте раз в месяц. Это и есть карта вашей работы — не SaaS-дашборд.

Это сдвиг позиции, не оптимизация промптов. От пользователя инструмента — к картографу, который ставит инструменту рамки.

Закрытие

Карта устаревает каждые шесть месяцев. Институты не догонят в обозримом окне. Модели симулируют акт понимания, не инстанциируют его. Ваш мозг сдаётся в solver-режиме через десять минут.

Всё это правда. И из неё следует одно: либо вы рисуете карту — либо живёте по чужой.

Cursor отдал слово «политика» — потерял подписки. Klarna отдала «решённый кейс» — вернула людей. Shopify не отдал ни одного определения — построил MCP-серверы. Три истории про одно: кто держал карандаш, когда определялись ключевые слова бизнеса.

Курс [AI Architect](https://hype-and-hope.ru/) — это сборка картографической позиции через все четыре слоя цикла 2. Vocabulary, спека, метрика, evals. Не лекции про инструменты. Тренажёр позиции.

Картограф рисует карту. Пользователь живёт по чужой. Это движение делается каждый день — в каждом промпте, в каждой задаче, которая приходит в работу. Кто-то решает, что значат слова в вашем бизнесе.

Карандаш либо у вас, либо у модели. Третьего нет.

Источники и данные

Cursor (апрель 2025)
- The Register, Cursor AI support bot hallucinated company policy (18 апреля 2025): https://www.theregister.com/2025/04/18/cursor_ai_support_bot_lies/
- Fortune, A customer support AI went rogue: https://fortune.com/article/customer-support-ai-cursor-went-rogue/

Klarna (февраль 2024 → май 2025)
- Bloomberg, Klarna Turns From AI to Real Person Customer Service (8 мая 2025): https://www.bloomberg.com/news/articles/2025-05-08/klarna-turns-from-ai-to-real-person-customer-service
- Fortune, Klarna plans to hire humans again, as new landmark survey reveals most AI projects fail to deliver* (9 мая 2025): https://fortune.com/2025/05/09/klarna-ai-humans-return-on-investment/
- Klarna press-release (27 февраля 2024): https://www.klarna.com/international/press/klarna-ai-assistant-handles-two-thirds-of-customer-service-chats-in-its-first-month/

Shopify / Tobi Lütke (апрель 2025)
- Tobi Lütke на X, меморандум: https://x.com/tobi/status/1909251946235437514
- First Round Capital, From Memo to Movement: Shopify's Cultural Adoption of AI (август 2025): https://www.firstround.com/ai/shopify
- MIT CDO Blog, разбор меморандума: https://cdo.mit.edu/blog/2025/04/11/shopify-ceo-tobi-lutke-ai-is-now-a-fundamental-expectation-for-employees

Air Canada (февраль 2024)
- CBC, Air Canada chatbot lawsuit*: https://www.cbc.ca/news/canada/british-columbia/air-canada-chatbot-lawsuit-1.7116416
- American Bar Association, BC Tribunal Confirms Companies Remain Liable: https://www.americanbar.org/groups/business_law/resources/business-law-today/2024-february/bc-tribunal-confirms-companies-remain-liable-information-provided-ai-chatbot/

Anthropic AI fluency (август 2025)
- Anthropic, How AI Is Transforming Work at Anthropic: https://www.anthropic.com/research/how-ai-is-transforming-work-at-anthropic