Дзен в мире ИИ-исследований: как стать учёным

Исследователь из Openai Джэд Мо разбирается, почему успешные учёные в ИИ это не обязательно самые одарённые люди, а те, кто сумел выработать правильный темперамент. Статья пропускает модный гайд-по-prompts и вместо этого предлагает одиннадцать принципов, по которым строится карьера в ИИ. Это про то, как читать статьи и писать код не изолированно, как избежать ловушки модных трендов, когда они живут меньше года, и почему самые полезные дни исследования зачастую проходят вдали от экрана.

Ключевые факты

Путь в ИИ-исследованиях строится на комбинации чтения и написания кода, а не на одном из них: это невозможно делать отдельно
Не стоит выбирать топики, популярные меньше полугода, потому что фундаментальные идеи в ИИ не меняются сорок лет
Часто полезнее идти в глубину на базовых концепциях (кроссэнтропия, SVD, policy gradients), чем гоняться за бенчмарками

Ред. "Перечитай написанное, потом выучи написанное", монашеский подход, но работает.

Вдохновение приходит чаще во время прогулок, чем за компьютером (научный факт, подтверждённый карьерами Дарвина, Теслы и Фейнмана)
Опытные исследователи относятся к провальным результатам не как к поражению, а как к полезной информации, равной успешным опытам
Код ИИ-исследований так запутан, что баги могут скрываться месяцами, причём хорошие результаты часто проваливаются после детальной проверки

Почему это важно

Сейчас огромное количество людей пытается работать в ИИ, не имея ясного представления, как структурировать такую работу. Статья говорит о том, что формула очень проста: дисциплина, честность в оценке результатов и отказ от спешки. ИИ меняется быстро, но принципы исследования стоят неподвижно. Это снижает парализующий страх перед непредсказуемостью тренда и сосредотачивает на том, что реально имеет вес. Особенно актуально в момент, когда агенты и prompt engineering захватили внимание, но завтра будут другие модные слова.

Ред. "Чистите скот, пока вас не просвещают, и чистите скот после", говорил Будда, и он был прав.

Кому это важно

Текст написан в первую очередь для новичков и тех, кто переходит в ИИ-исследования: студентов, работников tech, self-taught разработчиков. Но много полезного и для опытных исследователей, которые могли зациклиться на своём способе мышления. Также актуально для тех, кто работает с ИИ-агентами и кодегенерацией: подсказка прямая, ты должен на сто процентов понимать каждое действие, иначе результаты не имеют научной ценности. И для менеджеров ИИ-проектов: люди, работающие на вас, должны иметь возможность быстро итерировать, а не ждать месяцы результатов.

Ред. "Я не пошёл в ИИ, потому что там деньги", вот идеальный формат резюме для OpenAI.

Как это применить

Если ты собираешься работать с ИИ, начни с основ: запомни, что cross-entropy считается, потом посчитай вручную для маленького примера. Выучи SVD до уровня, когда можешь визуализировать это в голове. Затем выбери проблему, которая тебя интересует, и попробуй решить её раньше, чем полезешь в гугл. Когда упрёшься в стену, только тогда читай статьи. Дизайни рабочий процесс так, чтобы быстро получать обратную связь: краткие эвалуации, короткие cold-start времена, параллель только если критична. Если агент написал код, проверь его полностью. Если результаты выглядят слишком хорошо, они врут. И не забывай про прогулки.

Ред. Кстати, если результаты выглядят хорошо, это повод не отпраздновать, а заподозрить баг. Попробуй.

Можно ли доверять

Текст написан в стиле личного опыта с примерами из истории и ссылками на известных исследователей (Ноам Шазеер, Джейсон Вей, Колин Раффель, Келлер Джордан). Автор работает в OpenAI и имеет прямой доступ к внутреннему опыту того, как работают лучшие исследователи. Принципы не новые (Дзен-философия про медитацию, история про структуру бензола, Оземпик из яда ящерицы), но они выбраны удачно и как-то резонируют со смыслом. Авторская позиция чётко высказана и непротиворечива: эффективность через смирение, а не через амбицию.

Ред. Единственная слабость: "не нужна большая ЦПУ для медитации". Стоп, речь про медитацию или про рисерч?

Риски и подводные камни

Главный риск: статья может прочитаться как обоснование бездействия ("жди вдохновения") или как совет игнорировать новые подходы ради классики. Это неправильно. Автор не против ознакомления с новым, но против выбора его как основной лошадки до того, как ты освоил базу. Второй риск: в OpenAI работают люди, у которых был доступ к ресурсам и менторству, которого нет у большинства. Совет "выбери проблему, которая интересна" легко говорить, когда уже известен, и труднее, когда ты совсем новичок. Также опасно думать, что все провальные эксперименты одинаково полезны: в реальности бюджет на эксперименты ограничен, и нужна тактика отбора проблем.

Ред. "Равнодушие к результатам это не равнодушие, это мудрость" (легче говорить, если тебе платят и не увольняют).

«Temperament greatly outweighs talent.»

— Jed Mo