Инженерия в условиях ограниченного внимания

Инженерия в условиях ограниченного внимания

Статья разбирает фундаментальный парадокс: человеческий мозг способен удерживать примерно четыре дискретных элемента одновременно (не семь, как считалось раньше), но строит системы из десятков миллионов строк кода. Внимание человека работает как узкий луч в темном хранилище, половина людей не замечает гориллу в центре видеоряда, столько же не видят, что их собеседник заменён на другого человека. Информация без репетиции теряется за 20 секунд. Эта ограниченность не баг, а правило, на которое строится вся инженерия. Парадоксально, но чудо, что софт вообще работает. Статья показывает, как эта логика одинаково относится к людям и к нейросетям (их контекстное окно, аналог внимания), и к обоим их выводу свойственны одни ошибки: потеря контекста из середины, невидимые ошибки, рассеяние под нагрузкой. Вывод: инженерия не должна искать волшебный способ вместить огромную систему в маленький мозг. Её задача, оформить систему так, чтобы маленький мозг мог её менять, не роняя. Почти всё хорошее в инженерии, ответ на этот вопрос. Примеры: именование факторизует из головы, границы раздела, обещание, не перепроверяемое, тесты паркуют решение в структуру. Проектирование для самого ограниченного пользователя (пример: удобная ручка для артрита) часто делает продукт лучше для всех.

Ключевые факты

  • Человеческое рабочее внимание удерживает ~4 элемента одновременно; узкий луч внимания пропускает очевидное (горилла, смена собеседника).
  • Софт из десятков млн строк строится мозгами с 4-слотным лимитом, чудо не в надёжности, а что вообще работает.
  • Большая языковая модель ведёт себя как уставший человек: контекстное окно теряет информацию в середине, хуже работает с большим объёмом входных данных.
  • Инженерия, это не поиск способа вместить большое в маленькое, а техника оформить систему для маленького ума: именование, границы, тесты, обратимость.
  • Проектирование для максимально ограниченного пользователя делает инструмент лучше для всех (пример: мягкая ручка для артрита стала миллионной копией).

Почему это важно

Статья переворачивает нарратив об ошибках в софте и АИ. Вместо обвинения оператора в невнимательности (парадигма «будьте внимательнее») она показывает: система, требующая идеального внимания, уже сломана. Это, фундамент переосмысления дизайна как со стороны человека, так и при работе с нейросетями. Авиация, медицина, АЭС уже поняли это; софт-инженерия отстаёт.

Кому это важно

Архитекторам систем, инженерам-лидам, разработчикам, создающим интерфейсы для АИ-моделей. Менеджерам, которые списывают баги на людей. Всем, кто строит продукты для людей, включая интеграции с LLM-агентами.

Как это применить

  1. Переименуйте абстракции в конкретные, запоминающиеся имена, это выводит факты из головы. 2. Рисуйте чёткие границы раздела между компонентами и задавайте контракты (обещания), которые не нужно перепроверять каждый раз. 3. Пишите тесты не для 'покрытия', а как парковку решений: решение живёт в тесте и не уходит в туман. 4. Обратимость везде, разрешение на ошибку. 5. При работе с LLM учитывайте потерю контекста в середине (не налегайте на длинные контексты), повторяйте инструкции.

Можно ли доверять

Статья опирается на научные труды (Miller 1956, Peterson & Peterson 1959, Simons & Chabris 1999, Liu et al. 2023). Исходное значение «семь плюс-минус два» известно как переиначенное; позднейшие исследования честно показали, что реальная цифра около 4 при честной методологии. Данные о LLM из TACL-публикации 2024 (Lost in the Middle). Пример с OXO Good Grips (Sam Farber), известный кейс в дизайне. Построение параллели между человеческим вниманием и контекстным окном LLM корректно и активно обсуждается в сообществе.

Риски и подводные камни

  1. Не путайте это с оправданием небрежности: дизайн для ограниченности не означает допустить хаос. 2. Применение к LLM имеет границы: модели имеют другие типы отказов (hallucinations), чем люди. 3. Гиперболизация 4-слотного лимита: контекст богаче, чем 4 дискретных элемента, если они связаны; чанкинг и структурирование увеличивают ёмкость. 4. Статья написана как эссе-манифест, не как исследование с методологией, публикация экспертного мнения, а не метаанализа.

«Каждый элемент, который вы можете отменить, это разрешение на ошибку. Каждый раз, когда вы выводите факт из хрупкого четырёхслотного ума и помещаете его в структуру, он остаётся на месте, пока вы мигаете глазом.»

— Engineering for Bounded Cognition