Исследование 26 000 студентов: скрытая стоимость обучения с ИИ проявляется через два года

Исследователи из центрального Китая проанализировали 30 месяцев данных более чем 26 000 студентов 7, 12 классов из округа с населением свыше миллиона человек. В выборку вошли ежемесячные контрольные, оценки за домашние задания с указанием времени их выполнения и результаты ответственных экзаменов с высокими ставками в школы и вузы.

Распространение/освоение ИИ-инструментов среди студентов выросло с нуля до 80% за период исследования. Популярные инструменты, Doubao, DeepSeek, ChatGLM, Ernie Bot и Qwen. Через 6 месяцев после первого использования ИИ оценки за домашние задания выросли на 18%, время выполнения сократилось с 64 до 45 минут. Одновременно баллы на закрытых контрольных упали на 20%.

На вступительные экзамены эффект проявился позже, но столь же сильно: от 18 до 24% падения. У 81% длительных пользователей ИИ выявлены признаки аутсорсинга работы машине: они выполняют задания менее чем за 50 минут, получают высокие оценки за домашние работы, но проваливают экзамены. Студенты, потратившие на домашние задания столько же времени, сколько сверстники без ИИ, показали такие же экзаменационные результаты и получили лучшие оценки за домашние работы.

Социальные науки (политика, география) пострадали сильнее всего: падение на 27%. STEM упал на 22%, английский на 17%, китайский на 9%. Эффект разнился по группам: младшие школьники потеряли больше (24% vs 17%), мальчики, больше девочек (21,6% vs 18,4%). Отличники пострадали сильнее остальных: минус 24% в сравнении с минус 16% у отстающих. Обнаружена дозовая зависимость: студенты, использующие ИИ до часа в неделю, потеряли 5%, те, кто пять часов или больше, 30%.

Учёные отмечают, что реакция была вялой: учителя видят студентов лишь в одном предмете и не замечают общего эффекта. Сами студенты часто не связывают результаты, принимая усилие самостоятельного обучения за признак неудачи. Исследование предлагает давать студентам достоверную информацию о долгосрочных последствиях передачи работы ИИ, увеличить вес очных экзаменов и отслеживать время выполнения вместо оценок за домашние работы.

Ключевые факты

Домашние оценки выросли на 18%, время выполнения сократилось с 64 до 45 минут, но контрольные упали на 20% уже через полгода
81% регулярных пользователей ИИ аутсорсят работу: быстрое выполнение + высокие домашние оценки + низкие экзаменационные баллы
На вступительных экзаменах падение 18, 24%, но полный масштаб проявляется лишь через два года, короткие исследования пропускают истинную стоимость
Социальные науки упали на 27%, STEM на 22%; младшие школьники и отличники пострадали сильнее; дозовая зависимость: 5+ часов ИИ/неделю = 30% потерь
Адаптация к ИИ и смена инструментов (DeepSeek V2.5, R1) ослабили эффект с 25% в начале 2023 до 16% к июню 2025, но потери сохранились

Почему это важно

Исследование выявило критическое несовпадение между краткосрочными выгодами (быстрое выполнение, хорошие домашние оценки) и долгосрочными потерями (падение экзаменационных баллов). Главная опасность, скрытость эффекта: полный ущерб проявляется лишь спустя два года, когда студенты уже сформировали привычку полагаться на ИИ. Регулярное использование ИИ для аутсорсинга прямо подменяет самостоятельное мышление, которое незаменимо на ответственных экзаменах с высокими ставками. Вывод актуален шире образования: везде, где проверяется реальное понимание, а не формальное выполнение задач.

Кому это важно

Студентам и их родителям, ясный сигнал, что ИИ может помочь, но при бездумном использовании разрушает обучение. Учителям и администраторам школ, объяснение, почему на уровне класса или района эффект долго остаётся незаметным. Разработчикам ИИ-инструментов, особенно образовательных платформ, понимание моральной ответственности: инструмент, который облегчает работу, может подорвать фундамент знаний. Политикам в области образования, повод пересмотреть политику домашних заданий и оценивания в эпоху ИИ.

Как это применить

Студентам советуют использовать ИИ не для аутсорсинга, а для понимания: задавать вопросы, просить объяснения, проверять собственные решения, а не копировать готовые ответы. Школам рекомендуется: (1) дать студентам честную информацию о долгосрочных рисках; (2) увеличить вес очных, проктируемых экзаменов, где ИИ недоступен; (3) отслеживать время выполнения домашних работ, так как оно оказалось надёжнее оценок как сигнал непонимания. Учителя могут перейти от оценивания домашних заданий к их использованию как тренировочного материала, а основной вес дать экзаменационным результатам. Семьи могут контролировать время ИИ-использования и просить студентов объяснять материал своими словами.

Можно ли доверять

Исследование использует методологически строгий подход (difference-in-differences design) с большой выборкой (26 000 студентов за 30 месяцев). Данные поступают из реальной школьной системы, из ежемесячных контрольных и вступительных экзаменов, а не из лабораторных условий. Авторы обнаружили, что эффект не универсален: студенты, потратившие столько же времени на задания, что и сверстники без ИИ, не пострадали. Это усиливает доверие, указывая на причинный механизм (аутсорсинг) вместо случайной корреляции. Результаты находят поддержку в других исследованиях (Anthropic, Swiss Business School, UC Berkeley), изучавших ИИ в обучении. Ограничение: данные из одного китайского округа; срок, 30 месяцев, хотя долгосрочный эффект мог бы изучаться дольше.

Риски и подводные камни

Главный риск, поспешное заключение, что ИИ вреден для образования. Исследование показывает, что вред проистекает из аутсорсинга, а не из самого инструмента. Студенты, которые использовали ИИ для углубления понимания, обошлись без падения баллов. Второй риск, игнорирование адаптации: эффект уже смягчается (с 25% в 2023 до 16% в 2025), что намекает на обучение студентов и учителей правильному использованию. Третий, ложное утешение от краткосрочных результатов. Школы и семьи могут заметить улучшение домашних оценок и подумать, что всё хорошо, не осознавая, что экзамены и глубокое обучение подрывают себя. Четвёртый, культурные различия: исследование проведено в Китае, где вступительные экзамены имеют высокий вес; в других странах эффект может быть иным.

«Когда студенты знают, что их будут тестировать без ИИ, они остаются мотивированы действительно учиться материал.»

— Андрей Карпатский, исследователь Anthropic (из обсуждения проблемы в статье)