News· 6/25/2026· 3 мин чтения

OpenAI сделала свой чип за 9 месяцев — и уже запускает на нём GPT-5.3

OpenAI и Broadcom представили чип Jalapeño для инференса языковых моделей. Разработка за 9 месяцев, деплой в конце 2026-го, Microsoft купит 40% чипов.

AI-assisted, edited by a human reviewer

OpenAI и Broadcom официально представили «Jalapeño» — первый кастомный ускоритель OpenAI, спроектированный с нуля под инференс больших языковых моделей. Деплой запланирован на конец 2026 года, Microsoft уже договорилась выкупить 40% первой партии чипов.

Что такое Jalapeño и кто его делает

Jalapeño — это не адаптированный GPU и не перемаркированный чужой дизайн. OpenAI называет его «Intelligence Processor» и утверждает, что архитектура спроектирована именно под задачи инференса современных LLM, а не под обучение или универсальные вычисления.

Разделение труда между партнёрами выглядит так: OpenAI отвечает за архитектуру чипа, Broadcom — за производство кремния и сетевую обвязку (в том числе собственные сетевые чипы Tomahawk), Celestica занимается платами, стойками и системной интеграцией. То есть OpenAI берёт на себя самую сложную и стратегическую часть — дизайн — и отдаёт производственную цепочку проверенным партнёрам.

Это первый чип в том, что компании называют «многопоколенной платформой». Иными словами, Jalapeño — не разовый эксперимент, а начало собственной линейки железа.

Девять месяцев от идеи до кремния

OpenAI заявляет, что полный цикл от начала разработки до tape-out (финальной передачи дизайна на производство) занял девять месяцев. Для высокопроизводительных ASIC это, по словам компании, быстрее, чем любой известный ей прецедент в индустрии.

Часть ускорения объясняется использованием собственных моделей OpenAI на этапе проектирования — компания не уточняет детали, но это вписывается в общий нарратив про «ИИ, который помогает делать ИИ». Слухи о том, что OpenAI работает над собственным железом, ходили с 2023 года — так что реальный срок разработки мог быть и длиннее, если считать от первых прототипов.

Инженерные образцы уже запущены в лаборатории и обрабатывают реальные ML-нагрузки, включая модель GPT-5.3-Codex-Spark. Примечательно, что эта же модель сейчас работает на железе Cerebras — другого специализированного производителя чипов для инференса. То есть OpenAI параллельно тестирует несколько аппаратных платформ.

Цифры производительности — пока на доверии

OpenAI сообщает, что Jalapeño показывает «существенно лучшую» производительность на ватт по сравнению с актуальным железом. Архитектура якобы снижает перемещение данных внутри чипа и приближает утилизацию к теоретическому максимуму — это критично для инференса, где узкое место часто именно в пропускной способности памяти, а не в вычислительной мощности.

Проблема в том, что все эти цифры самоотчётные: независимой верификации нет, технический отчёт ещё не опубликован, и непонятно, с какими именно чипами сравнивали, на каких задачах и в каких условиях. Пока это маркетинговые заявления, которые нужно проверять.

Почему это важно для рынка

OpenAI годами зависела от NVIDIA — как и весь остальной рынок. Собственный чип меняет несколько вещей сразу.

Во-первых, стоимость инференса. Кастомное железо под конкретную задачу исторически выигрывает у универсальных GPU по соотношению цены и производительности — именно так Google сделала TPU дешевле для своих нагрузок. Если Jalapeño реально эффективнее, OpenAI сможет снижать цены на API или увеличивать маржу.

Во-вторых, надёжность поставок. Зависимость от одного вендора — это риск. Microsoft, которая обязалась купить 40% первой партии, получает доступ к альтернативному железу для Azure.

В-третьих, контроль над стеком. OpenAI прямо говорит: владение цепочкой от чипа до продукта позволяет быстрее итерировать и оптимизировать под свои модели. Это то, что Google и Amazon делают уже несколько лет.

Что остаётся неизвестным

Масштаб деплоя пока описан расплывчато — «гигаваттный масштаб к концу 2026 года» звучит амбициозно, но без конкретных цифр по количеству чипов или мощности дата-центров это сложно оценить. Неясно также, заменит ли Jalapeño NVIDIA в инфраструктуре OpenAI или будет работать параллельно для специфических нагрузок.

Отдельный вопрос — насколько архитектура гибкая. Чипы, оптимизированные под инференс, обычно плохо справляются с обучением. Если OpenAI планирует следующие поколения Jalapeño и под тренировку моделей — это принципиально другая инженерная задача.

Технический отчёт с реальными бенчмарками обещан позже. Вот тогда и будет понятно, насколько «существенно лучше» — это маркетинг или инженерный прорыв.

Источники

The Decoder: OpenAI and Broadcom unveil "Jalapeño," a custom chip built for LLM inference