Дзен в мире ИИ-исследований: как стать учёным

Исследователь из Openai Джэд Мо разбирается, почему успешные учёные в ИИ это не обязательно самые одарённые люди, а те, кто сумел выработать правильный темперамент. Статья пропускает модный гайд-по-prompts и вместо этого предлагает одиннадцать принципов, по которым строится карьера в ИИ. Это про то, как читать статьи и писать код не изолированно, как избежать ловушки модных трендов, когда они живут меньше года, и почему самые полезные дни исследования зачастую проходят вдали от экрана.
Ключевые факты
- Путь в ИИ-исследованиях строится на комбинации чтения и написания кода, а не на одном из них: это невозможно делать отдельно
- Не стоит выбирать топики, популярные меньше полугода, потому что фундаментальные идеи в ИИ не меняются сорок лет
- Часто полезнее идти в глубину на базовых концепциях (кроссэнтропия, SVD, policy gradients), чем гоняться за бенчмарками
Ред. "Перечитай написанное, потом выучи написанное", монашеский подход, но работает.
- Вдохновение приходит чаще во время прогулок, чем за компьютером (научный факт, подтверждённый карьерами Дарвина, Теслы и Фейнмана)
- Опытные исследователи относятся к провальным результатам не как к поражению, а как к полезной информации, равной успешным опытам
- Код ИИ-исследований так запутан, что баги могут скрываться месяцами, причём хорошие результаты часто проваливаются после детальной проверки
Почему это важно
Сейчас огромное количество людей пытается работать в ИИ, не имея ясного представления, как структурировать такую работу. Статья говорит о том, что формула очень проста: дисциплина, честность в оценке результатов и отказ от спешки. ИИ меняется быстро, но принципы исследования стоят неподвижно. Это снижает парализующий страх перед непредсказуемостью тренда и сосредотачивает на том, что реально имеет вес. Особенно актуально в момент, когда агенты и prompt engineering захватили внимание, но завтра будут другие модные слова.
Ред. "Чистите скот, пока вас не просвещают, и чистите скот после", говорил Будда, и он был прав.
Кому это важно
Текст написан в первую очередь для новичков и тех, кто переходит в ИИ-исследования: студентов, работников tech, self-taught разработчиков. Но много полезного и для опытных исследователей, которые могли зациклиться на своём способе мышления. Также актуально для тех, кто работает с ИИ-агентами и кодегенерацией: подсказка прямая, ты должен на сто процентов понимать каждое действие, иначе результаты не имеют научной ценности. И для менеджеров ИИ-проектов: люди, работающие на вас, должны иметь возможность быстро итерировать, а не ждать месяцы результатов.
Ред. "Я не пошёл в ИИ, потому что там деньги", вот идеальный формат резюме для OpenAI.
Как это применить
Если ты собираешься работать с ИИ, начни с основ: запомни, что cross-entropy считается, потом посчитай вручную для маленького примера. Выучи SVD до уровня, когда можешь визуализировать это в голове. Затем выбери проблему, которая тебя интересует, и попробуй решить её раньше, чем полезешь в гугл. Когда упрёшься в стену, только тогда читай статьи. Дизайни рабочий процесс так, чтобы быстро получать обратную связь: краткие эвалуации, короткие cold-start времена, параллель только если критична. Если агент написал код, проверь его полностью. Если результаты выглядят слишком хорошо, они врут. И не забывай про прогулки.
Ред. Кстати, если результаты выглядят хорошо, это повод не отпраздновать, а заподозрить баг. Попробуй.
Можно ли доверять
Текст написан в стиле личного опыта с примерами из истории и ссылками на известных исследователей (Ноам Шазеер, Джейсон Вей, Колин Раффель, Келлер Джордан). Автор работает в OpenAI и имеет прямой доступ к внутреннему опыту того, как работают лучшие исследователи. Принципы не новые (Дзен-философия про медитацию, история про структуру бензола, Оземпик из яда ящерицы), но они выбраны удачно и как-то резонируют со смыслом. Авторская позиция чётко высказана и непротиворечива: эффективность через смирение, а не через амбицию.
Ред. Единственная слабость: "не нужна большая ЦПУ для медитации". Стоп, речь про медитацию или про рисерч?
Риски и подводные камни
Главный риск: статья может прочитаться как обоснование бездействия ("жди вдохновения") или как совет игнорировать новые подходы ради классики. Это неправильно. Автор не против ознакомления с новым, но против выбора его как основной лошадки до того, как ты освоил базу. Второй риск: в OpenAI работают люди, у которых был доступ к ресурсам и менторству, которого нет у большинства. Совет "выбери проблему, которая интересна" легко говорить, когда уже известен, и труднее, когда ты совсем новичок. Также опасно думать, что все провальные эксперименты одинаково полезны: в реальности бюджет на эксперименты ограничен, и нужна тактика отбора проблем.
Ред. "Равнодушие к результатам это не равнодушие, это мудрость" (легче говорить, если тебе платят и не увольняют).
«Temperament greatly outweighs talent.»
— Jed Mo