В Codex OpenAI остаётся открытой проблема исключения конфиденциальных файлов

На GitHub в репозитории OpenAI Codex остаётся открытым issue #2847, в котором запрашивается механизм для явного исключения конфиденциальных файлов и путей из обработки ИИ-агентами. Предлагается реализовать .codexignore файл на уровне репозитория и глобальный конфиг на уровне системы, аналогично .gitignore. Сценарий: разработчику нужно, чтобы node_modules/ оставался доступен для проверки реализации, но файлы типа .env.env..pem, id_, содержимое .aws/ и .ssh/ ни в коем случае не были прочитаны и не отправлены в модель. Требование, детерминированная, командой/репозиторием делимая конфигурация вместо опоры на документацию и договорённости. Issue указывает на связь с более ранней задачей #205 (которая предлагала закрыть в пользу реализации на Rust в codex-rs), но к 2025-08-28 эквивалентный функционал в codex-rs так и не появился. Переводчик предлагает перезагрузить обсуждение и сойтись на дизайне. На issue 192 балла на HackerNews и 124 комментария, что указывает на высокий интерес сообщества к проблеме.

Ключевые факты

Пользователи требуют .codexignore, механизм для явного исключения конфиденциальных файлов (.env, ключей SSH, AWS-конфига) из обработки ИИ-агентами
Issue открыт с 2025-08-28 и содержит 124 комментария, признак нерешённой критической проблемы безопасности для разработчиков, использующих Codex
Предлагается двухуровневое решение: repo-local .codexignore для конкретного проекта и глобальный конфиг для системных умолчаний пользователя
Связанная задача #205 была закрыта в пользу реализации в codex-rs (Rust-версии), но фактический функционал там отсутствует
Механизм должен быть детерминированным и делимым в команде, противовес недокументированным договорённостям и неявным конвенциям

Почему это важно

При использовании ИИ-агентов для кодирования риск утечки конфиденциальных данных критичен. Если Codex (ИИ-помощник для кода) случайно прочитает и отправит в облачную модель .env с API-ключами, AWS-конфиги или SSH-приватные ключи, это прямой путь к компрометации инфраструктуры. Сейчас этот риск полностью зависит от дисциплины разработчиков, что ненадёжно. Наличие явного механизма исключения (как .gitignore) перевело бы защиту с уровня человеческой ошибки на уровень архитектуры инструмента.

Кому это важно

Разработчикам, использующим OpenAI Codex или подобные ИИ-ассистенты с доступом к файловой системе проекта. Особенно критично для компаний, работающих с production-кодом, где конфиденциальные файлы есть в рабочей директории. DevSecOps-команды, которые вводят ИИ-инструменты в процесс разработки, требуют гарантий, что секреты не будут утекать.

Как это применить

Если issue будет решён, разработчикам нужно будет создать .codexignore в корне проекта и список выражений вроде .env*, .ssh/, .aws/, *.pem, id_*, паттернов для файлов, которые Codex не должен читать. На уровне системы можно настроить глобальный конфиг (например, ~/.codex/ignore) для пользовательских умолчаний. Это интегрируется в рабочий процесс как обычная практика инфраструктуры кода, похожая на .gitignore или .dockerignore.

Можно ли доверять

Issue имеет официальный статус в репозитории OpenAI, помечена как enhancement (улучшение) и sandbox (пермиссии/изоляция). Автор обещает способствовать и писать тесты, что повышает правдоподобность. Однако issue открыта с 2025-08-28 и остаётся незакрытой несколько месяцев при высокой активности (124 комментария, 192 балла), что может указывать на сложность реализации или низкий приоритет для OpenAI. Информация получена из официального GitHub и обсуждения на HackerNews, источники надёжны.

Риски и подводные камни

Риск #1: если .codexignore задействует wildcards или regex неправильно, может произойти over-exclusion полезных файлов или under-exclusion секретов. Риск #2: users могут забыть добавить новые типы чувствительных файлов в игнор, если стандартные паттерны неполны. Риск #3: глобальный конфиг может конфликтовать с repo-local, требуется ясная иерархия приоритетов. Риск #4: даже с .codexignore, ИИ-модель может предложить использовать чувствительные переменные в подсказках или логах, требуется комплексная стратегия, а не только исключение файлов. Кроме того, возможны обходы через косвенное воздействие (комментарии в коде, которые раскрывают секреты).