Сообщество фанфиков объявило войну ИИ, и самому себе

На прошлой неделе в фанфик-сообществе развернулось движение по выявлению авторов, использующих генеративный ИИ. 29 июня анонимный аккаунт @heatedrivalryai опубликовал инструмент (скин для Archive of Our Own, главного репозитория фанфиков) для обнаружения артефактов, оставляемых Claude при копировании текста прямо из чатбота в редактор AO3. Инструмент срабатывает по специфическому CSS-классу 'font-claude-response-body', который Claude добавляет в скопированный текст, при его обнаружении весь фон страницы становится красным.
Хотя методология выглядит логичной и предварительное тестирование показывает её работоспособность, у подхода есть существенные ограничения. Детектор ловит только текст, скопированный прямо из Claude, но не обнаружит текст, отредактированный в Word или Google Docs и затем загруженный в AO3. Инструмент также не различает полностью сгенерированные рассказы и тексты, где Claude использовался лишь для корректуры, проверки орфографии или перевода. Несмотря на оговорки создателя, фанфик-сообщество стало активно публично стыдить авторов, попавших под детектор. Уже один писатель был несправедливо обвинён из-за того, что его редактор использовал Claude без его ведома. В сообществе обеспокоены экологическим влиянием ИИ и способом обучения моделей, которые скребут интернет, включая контент из AO3. Встроенная система тегов AO3 предусмотрена для честного раскрытия использования ИИ через тег «Создано с помощью генеративного ИИ», но авторы не мотивированы быть прозрачными из-за ожидаемого негативного отношения. В будущем авторы смогут легко обойти детектор простым редактированием текста перед загрузкой.
Ключевые факты
- Анонимный аккаунт @heatedrivalryai создал для AO3 детектор, обнаруживающий артефакты Claude через присутствие CSS-класса 'font-claude-response-body'
- Детектор срабатывает только при прямом копировании из Claude в редактор, отредактированный в Word или Google Docs текст останется необнаруженным
- Инструмент не различает, использовался ли Claude для полной генерации или только для вспомогательных функций (корректура, перевод, проверка орфографии)
- Сообщество использует детектор для публичного осуждения авторов, включая невинные жертвы, чей редактор применил ИИ без согласия
- Надёжного технологического решения для общей детекции ИИ в тексте не существует; Google и OpenAI не подтвердили наличие подобных артефактов в их продуктах
Почему это важно
Творческие сообщества, особенно фанфик-сообщество, давно беспокоятся о влиянии ИИ на целостность своих пространств. Главные опасения: деградация окружающей среды при обучении моделей (которые, вероятно, используют контент из AO3 и подобных платформ) и размывание человеческого элемента творчества. Появление технических инструментов для обнаружения сгенерированного контента ставит вопрос о том, как творческие сообщества смогут защитить себя от нежелательного влияния ИИ.
Кому это важно
Авторам фанфиков на AO3, которые рискуют быть неправедно обвинены; читателям, предпочитающим исключительно человеческую креативность; создателям инструментов детекции ИИ; компаниям-разработчикам ИИ (особенно Anthropic); редакторам фанфиков, которые могут использовать ИИ в работе; и в целом всем творческим сообществам, борющимся с внедрением синтетического контента.
Как это применить
Авторам, использующим ИИ для вспомогательных функций, следует осознать риск ложного обвинения, если они скопируют текст прямо из Claude. Редакторы должны информировать авторов о применении ИИ-инструментов. Писатели могут избежать детекции, отредактировав текст перед загрузкой в AO3. Для платформ подобных AO3 целесообразнее укреплять встроенную систему тегирования и честного раскрытия использования ИИ вместо полагания на инструменты общественного контроля.
Можно ли доверять
Детектор Claude работает логично: он обнаруживает реальный артефакт, который Claude действительно добавляет при копировании из чатбота. Тестирование подтверждает, что методология звучит. Однако инструмент имеет явные ограничения: он поймёт только текст, скопированный напрямую из Claude, и не может различить, насколько зависел текст от ИИ. Ни Google, ни OpenAI не ответили на вопросы о подобных артефактах в их моделях. В целом, не существует надёжного технологического решения для общей детекции ИИ в текстовом контенте, хотя прогресс есть в обнаружении ИИ в изображениях и видео через невидимые водяные знаки.
Риски и подводные камни
Инструмент легко обойти редактированием текста перед загрузкой или использованием других ИИ-моделей. Существует высокий риск ошибочного осуждения: авторы, используя ИИ только для корректуры, могут быть восприняты как читающие полностью синтетический контент. Движение создаёт атмосферу «охоты на ведьм», где честные авторы получают незаслуженный ущерб репутации. Более всеобъемлющая проблема: рост синтетического контента может привести к деградации обучающих данных для будущих моделей ИИ (model collapse), но это требует решения со стороны самих компаний ИИ, а не творческих сообществ.
«Фэндом, это уникально связанное, сотрудничающее пространство. Оно процветает благодаря человеческому элементу и творческой искре, которая его движет и питает. Если мы неосознанно позволим ИИ коррумпировать эти пространства, что от них останется?»
— @heatedrivalryai, создатель детектора Claude