Современные ИИ-системы превосходят людей в убеждении, стремящихся к искусственному сверхинтеллекту

Исследователи из Оксфорда, UK AI Security Institute, Стэнфорда и LSE провели четыре масштабные эксперимента (18,978 разговоров, 6,923 участников) и выяснили, что современные ИИ-системы надёжно превосходят людей в текстовом убеждении по политическим вопросам и сборе пожертвований. Лучшие результаты показали Opus 4.1 и 4.6, GPT-4o, Gemini 2.5 Pro и Grok 4.20. На первом этапе ИИ переубедил людей эффективнее случайных, отобранных и элитных дебатёров. На втором этапе даже подготовленные элитные дебатёры, обучавшиеся на основе стратегий того же ИИ, остались позади. На третьем этапе, когда ИИ ограничили скоростью и длиной ответов человека, его преимущество исчезло, что указывает на информационную пропускную способность как источник превосходства. На четвёртом этапе с реальными пожертвованиями Save the Children: ИИ собрал на 10,8 пункта больше (в доле £1 стипендии, выданной участникам) и привлёк в 2,9 раза больше денег, чем профессиональные фандрайзеры с опытом сбора £824k за семь лет.

Новость поднимает риск концентрации влияния у владельцев ИИ и встаёт вопросом общественного выбора: дать рынку, правительствам или скомбинировать с мониторингом.

Deepmind опубликовал работу о путях от AGI к ASI (сверхинтеллекту, превосходящему экспертные коллективы человечества по всем задачам). Барьеры: масштабирование вычислений и данных; алгоритмические сдвиги парадигмы; требование к краткосрочным самоулучшениям. Вторая часть новости обсуждает таймлайны самоподдерживающегося ИИ (интегрированного с заводами, копями, фабриками, робототехникой): Ajeya Cotra (METR) даёт 10 лет, Timothy B. Lee, менее 10% шанса за 20 лет. Ключевой показатель: развитие дешёвых, надёжных гуманоидных роботов и решение проблемы неявного знания (tacit knowledge) в индустриях вроде полупроводниковой.

Ключевые факты

ИИ-системы (особенно Opus 4.6) на 4.1, 10.8 пункта превосходят людей в убеждении, даже при материальном стимуле и обучении дебатёров
Преимущество ИИ исчезает, если ограничить его скоростью и объёмом ответов человека, это информационная пропускная способность
На реальных благотворительных сборах ИИ собрал в 2,9 раза больше денег, чем профессионалы с 7-летним опытом
DeepMind обозначил пути к сверхинтеллекту (ASI): масштабирование, алгоритмические сдвиги, краткосрочные самоулучшения
Самоподдерживающийся ИИ требует интеграции с физической инфраструктурой (роботы, фабрики); таймлайны варьируются от 10 лет до 50+ лет

Почему это важно

Результаты показывают, что ИИ может менять общественное мнение и поведение человека с масштабом, недоступным людям. Если такие системы распределены неравномерно, это может концентрировать общественное влияние. С другой стороны, они могут помочь недофинансируемым группам (НКО, правозащитникам, гражданским активистам) конкурировать с установленными игроками. Параллельно работы о путях к искусственному сверхинтеллекту (ASI) подталкивают исследователей осмыслить, как ИИ без человеческого труда интегрируется в экономику и инфраструктуру.

Кому это важно

Политикам и регуляторам (управление возможностями убеждения), благотворительным организациям и малым предприятиям (достаточ дорогим ИИ-инструментам), исследователям ИИ (понимание границ масштабирования и путей к AGI→ASI), компаниям, вкладывающимся в робототехнику и автоматизацию производства.

Как это применить

На практическом уровне: благотворительные организации могут опробовать ИИ для фандрайзинга; компании могут учитывать информационную ёмкость при разработке убедительных интерфейсов. Для исследователей: мониторить развитие гуманоидной робототехники и стоимость их производства как ранний индикатор прогресса к самоподдерживающимся системам. Для регуляторов: настоящее время, выбрать механизм контроля (рынок, государство, гибрид) до того, как технология уйдёт в масс-маркет.

Можно ли доверять

Исследование проведено уважаемыми институтами (Оксфорд, LSE, Stanford, AISI) и опубликовано на arXiv с четырьмя отдельными экспериментами, контролями и встроенными этическими проверками (реальные люди, реальные пожертвования). Методология оценки убеждения, стандартная (до/после рейтинговая шкала). Авторы откровенны о факторах ИИ-преимущества (информационная ёмкость) и граничных условиях (человеческие ограничения). На таймлайны ASI точного ответа нет, это неопределённость, а не невежество авторов.

Риски и подводные камни

Исследование фокусируется на текстовом убеждении; эффективность в видео, аудио или персональной манипуляции, открытый вопрос. 2) Масштаб эксперимента, 6.9k человек; перенос на глобальные кампании требует проверки. 3) Таймлайны для ASI и самоподдерживающихся систем сильно расходятся (10, 50+ лет), предсказание сложно. 4) Неявное знание (tacit knowledge) в промышленности может быть больше, чем предполагается. 5) Концентрация влияния, риск, но благодеяние для малых группировок; социальный выбор требует явного обсуждения.

««ИИ-системы надёжно превосходили экспертов-людей, даже когда эксперты выбирали свои темы, предварительно исследовали, проходили часы структурированной практики и получали денежное вознаграждение £1000. Преимущество ИИ исходило из быстрого развёртывания больших объёмов информации: после тренировки эксперты-люди могли сравняться с ИИ, если ограничить его скоростью и длиной ответов человека».»

— Исследователи (Оксфорд, LSE, Stanford, AISI)