Сообщество фанфиков объявило войну ИИ, и самому себе

На прошлой неделе в фанфик-сообществе развернулось движение по выявлению авторов, использующих генеративный ИИ. 29 июня анонимный аккаунт @heatedrivalryai опубликовал инструмент (скин для Archive of Our Own, главного репозитория фанфиков) для обнаружения артефактов, оставляемых Claude при копировании текста прямо из чатбота в редактор AO3. Инструмент срабатывает по специфическому CSS-классу 'font-claude-response-body', который Claude добавляет в скопированный текст, при его обнаружении весь фон страницы становится красным.

Хотя методология выглядит логичной и предварительное тестирование показывает её работоспособность, у подхода есть существенные ограничения. Детектор ловит только текст, скопированный прямо из Claude, но не обнаружит текст, отредактированный в Word или Google Docs и затем загруженный в AO3. Инструмент также не различает полностью сгенерированные рассказы и тексты, где Claude использовался лишь для корректуры, проверки орфографии или перевода. Несмотря на оговорки создателя, фанфик-сообщество стало активно публично стыдить авторов, попавших под детектор. Уже один писатель был несправедливо обвинён из-за того, что его редактор использовал Claude без его ведома. В сообществе обеспокоены экологическим влиянием ИИ и способом обучения моделей, которые скребут интернет, включая контент из AO3. Встроенная система тегов AO3 предусмотрена для честного раскрытия использования ИИ через тег «Создано с помощью генеративного ИИ», но авторы не мотивированы быть прозрачными из-за ожидаемого негативного отношения. В будущем авторы смогут легко обойти детектор простым редактированием текста перед загрузкой.

Ключевые факты

Анонимный аккаунт @heatedrivalryai создал для AO3 детектор, обнаруживающий артефакты Claude через присутствие CSS-класса 'font-claude-response-body'
Детектор срабатывает только при прямом копировании из Claude в редактор, отредактированный в Word или Google Docs текст останется необнаруженным
Инструмент не различает, использовался ли Claude для полной генерации или только для вспомогательных функций (корректура, перевод, проверка орфографии)
Сообщество использует детектор для публичного осуждения авторов, включая невинные жертвы, чей редактор применил ИИ без согласия
Надёжного технологического решения для общей детекции ИИ в тексте не существует; Google и OpenAI не подтвердили наличие подобных артефактов в их продуктах

Почему это важно

Творческие сообщества, особенно фанфик-сообщество, давно беспокоятся о влиянии ИИ на целостность своих пространств. Главные опасения: деградация окружающей среды при обучении моделей (которые, вероятно, используют контент из AO3 и подобных платформ) и размывание человеческого элемента творчества. Появление технических инструментов для обнаружения сгенерированного контента ставит вопрос о том, как творческие сообщества смогут защитить себя от нежелательного влияния ИИ.

Кому это важно

Авторам фанфиков на AO3, которые рискуют быть неправедно обвинены; читателям, предпочитающим исключительно человеческую креативность; создателям инструментов детекции ИИ; компаниям-разработчикам ИИ (особенно Anthropic); редакторам фанфиков, которые могут использовать ИИ в работе; и в целом всем творческим сообществам, борющимся с внедрением синтетического контента.

Как это применить

Авторам, использующим ИИ для вспомогательных функций, следует осознать риск ложного обвинения, если они скопируют текст прямо из Claude. Редакторы должны информировать авторов о применении ИИ-инструментов. Писатели могут избежать детекции, отредактировав текст перед загрузкой в AO3. Для платформ подобных AO3 целесообразнее укреплять встроенную систему тегирования и честного раскрытия использования ИИ вместо полагания на инструменты общественного контроля.

Можно ли доверять

Детектор Claude работает логично: он обнаруживает реальный артефакт, который Claude действительно добавляет при копировании из чатбота. Тестирование подтверждает, что методология звучит. Однако инструмент имеет явные ограничения: он поймёт только текст, скопированный напрямую из Claude, и не может различить, насколько зависел текст от ИИ. Ни Google, ни OpenAI не ответили на вопросы о подобных артефактах в их моделях. В целом, не существует надёжного технологического решения для общей детекции ИИ в текстовом контенте, хотя прогресс есть в обнаружении ИИ в изображениях и видео через невидимые водяные знаки.

Риски и подводные камни

Инструмент легко обойти редактированием текста перед загрузкой или использованием других ИИ-моделей. Существует высокий риск ошибочного осуждения: авторы, используя ИИ только для корректуры, могут быть восприняты как читающие полностью синтетический контент. Движение создаёт атмосферу «охоты на ведьм», где честные авторы получают незаслуженный ущерб репутации. Более всеобъемлющая проблема: рост синтетического контента может привести к деградации обучающих данных для будущих моделей ИИ (model collapse), но это требует решения со стороны самих компаний ИИ, а не творческих сообществ.

«Фэндом, это уникально связанное, сотрудничающее пространство. Оно процветает благодаря человеческому элементу и творческой искре, которая его движет и питает. Если мы неосознанно позволим ИИ коррумпировать эти пространства, что от них останется?»

— @heatedrivalryai, создатель детектора Claude