OpenAI и Broadcom представили специализированный чип для инфренса LLM

OpenAI и Broadcom представили Jalapeño, собственный акселератор OpenAI (Intelligence Processor) для инфренса LLM, разработанный с нуля на основе глубокого понимания фундаментов LLM и дорожной карты будущих моделей компании. Чип проектировался не как универсальный ускоритель, а как специализированная система для современного и будущего инфренса, учитывающая реальные паттерны OpenAI из ChatGPT, Codex, API и будущих агентных продуктов.

Разработка заняла всего девять месяцев, от проектирования до производства, что авторы называют наиболее быстрым циклом разработки ASIC в высокопроизводительных полупроводниках. Эта скорость достигнута благодаря глубокому сотрудничеству между инженерами OpenAI и Broadcom, а также использованием собственных моделей OpenAI для ускорения дизайна и оптимизации чипа.

По ранним тестам, Jalapeño обеспечивает производительность на ватт существенно выше текущих лучших решений (подробный технический отчёт будет опубликован в ближайшие месяцы). Архитектура минимизирует движение данных, балансирует вычисления, память и сетевые ресурсы, достигая реальной загрузки близко к теоретическому максимуму. Инженерные образцы уже выполняют ML-нагрузки на целевой частоте и мощности, включая модели типа GPT‑5.3‑Codex‑Spark.

Jalapeño, первый шаг в многопоколенческой платформе вычислений, спроектированной для начального развёртывания к концу 2026 года. Платформа объединяет OpenAI-разработанные акселераторы с кремниевой реализацией Broadcom, сетевыми технологиями (включая Tomahawk) и опытом Celestica в сборке плат, стоек и систем. Чип предполагается развёртывать на гигаваттном масштабе с датацентрами Microsoft и партнёрами.

Эта разработка отражает стратегию OpenAI строить весь стек: от моделей и продуктов до железа под ними, чтобы каждый слой оптимизировался вокруг одной цели: сделать модели быстрее, надёжнее и доступнее. Инфренс, это точка, где AI касается людей, и любое улучшение в стоимости, скорости и надёжности повлияет на скорость ответов ChatGPT, количество шагов Codex, стоимость API и доступность при пиковом спросе.

Ключевые факты

OpenAI и Broadcom разработали Jalapeño, кастом-акселератор для LLM-инфренса, оптимизированный вокруг реальных паттернов OpenAI (ChatGPT, Codex, API, агенты)
Чип спроектирован за девять месяцев (от дизайна до production-ready), что объявляется рекордно быстрым циклом для ASIC в HPC-секторе
По ранним тестам, Jalapeño обеспечивает производительность на ватт существенно выше лучших текущих решений; архитектура минимизирует данные и достигает близко к теоретическому пику
Платформа будет развёртываться с 2026 года в гигаваттном масштабе у Microsoft и других партнёров как часть многопоколенческой дорожной карты
Full-stack подход OpenAI (модели, продукты, инфраструктура) позволяет оптимизировать каждый уровень вокруг одной цели: faster, reliable, cheaper AI

Почему это важно

Инфренс, это узкое место, где искусственный интеллект встречается с пользователями. Специализированный чип, спроектированный вокруг реальных нужд LLM (а не универсальный акселератор для старых рабочих нагрузок), может дать фундаментальное улучшение в производительности на ватт. Это прямо влияет на скорость ответов, стоимость API и надёжность систем при пиковом спросе. Кроме того, использование собственных моделей OpenAI для оптимизации дизайна чипа показывает, что AI может помочь инженерам разрабатывать лучше и быстрее, это может снизить общую стоимость вычислений по индустрии.

Кому это важно

Стратегически значимо для конкурентов OpenAI (Anthropic, Google, Meta, Tesla, другие разработчики LLM), демонстрирует, что вертикальная интеграция (свои модели + свои чипы) даёт существенное преимущество. Важно для облачных провайдеров (Microsoft, Google Cloud, AWS), которые планируют строить собственные датацентры под AI-нагрузки. Важно для инженеров и стартапов, работающих с инфренсом: открывается новый класс оборудования, более дешёвый и быстрый для LLM-задач.

Как это применить

Для разработчиков и компаний, работающих с LLM-инфренсом в облаке: ожидайте появления платформ и сервисов на базе Jalapeño с 2026 года, которые обещают более дешёвые и быстрые API. Для тех, кто строит свои датацентры: Jalapeño показывает, что специализированное железо окупается (девять месяцев разработки vs годы для универсальных чипов). Для исследователей: факт того, что AI ускорил разработку самого чипа, намекает на новые методологии проектирования полупроводников.

Можно ли доверять

Объявление исходит от OpenAI и Broadcom официально, цифры и графики пока не опубликованы (обещан технический отчёт позже). Ранние тесты показывают обещанный результат, но это всегда условно, финальные спецификации могут отличаться. История развёртывания и реальные тесты в датацентрах с 2026 года покажут, оправданы ли обещания. Скепсис умеренный: факт девятимесячной разработки и инженерных образцов, уже выполняющих нагрузки, звучит правдоподобно для компании масштаба OpenAI с опытом в AI.

Риски и подводные камни

Специализация чипа под LLM-инфренс означает, что он менее гибкий для других рабочих нагрузок, это не универсальный ускоритель (по дизайну). Если архитектура будущих LLM резко изменится, преимущество может испариться. Производство в масштабах гигаватта требует огромных капитальных вложений и логистики, любой сбой в цепочке поставок критичен. Существует риск того, что конкуренты (особенно Google, Meta, Tesla, если они разработают свои чипы) могут разработать что-то более эффективное. Сроки развёртывания, к концу 2026, агрессивны и могут откатываться.

«Инфренс, это точка, где AI касается людей. Любое улучшение в стоимости, скорости и надёжности может проявиться быстрее ответом ChatGPT, задачей Codex, которая может предпринять больше шагов с меньшим ожиданием, продуктом API, который дешевле строить, или более надёжным доступом при высоком спросе.»

— OpenAI, официальное объявление о Jalapeño