OpenAI сделала свой чип за 9 месяцев — и уже запускает на нём GPT-5.3
OpenAI и Broadcom представили чип Jalapeño для инференса языковых моделей. Разработка за 9 месяцев, деплой в конце 2026-го, Microsoft купит 40% чипов.

OpenAI и Broadcom официально представили «Jalapeño» — первый кастомный ускоритель OpenAI, спроектированный с нуля под инференс больших языковых моделей. Деплой запланирован на конец 2026 года, Microsoft уже договорилась выкупить 40% первой партии чипов.
Что такое Jalapeño и кто его делает
Jalapeño — это не адаптированный GPU и не перемаркированный чужой дизайн. OpenAI называет его «Intelligence Processor» и утверждает, что архитектура спроектирована именно под задачи инференса современных LLM, а не под обучение или универсальные вычисления.
Разделение труда между партнёрами выглядит так: OpenAI отвечает за архитектуру чипа, Broadcom — за производство кремния и сетевую обвязку (в том числе собственные сетевые чипы Tomahawk), Celestica занимается платами, стойками и системной интеграцией. То есть OpenAI берёт на себя самую сложную и стратегическую часть — дизайн — и отдаёт производственную цепочку проверенным партнёрам.
Это первый чип в том, что компании называют «многопоколенной платформой». Иными словами, Jalapeño — не разовый эксперимент, а начало собственной линейки железа.
Девять месяцев от идеи до кремния
OpenAI заявляет, что полный цикл от начала разработки до tape-out (финальной передачи дизайна на производство) занял девять месяцев. Для высокопроизводительных ASIC это, по словам компании, быстрее, чем любой известный ей прецедент в индустрии.
Часть ускорения объясняется использованием собственных моделей OpenAI на этапе проектирования — компания не уточняет детали, но это вписывается в общий нарратив про «ИИ, который помогает делать ИИ». Слухи о том, что OpenAI работает над собственным железом, ходили с 2023 года — так что реальный срок разработки мог быть и длиннее, если считать от первых прототипов.
Инженерные образцы уже запущены в лаборатории и обрабатывают реальные ML-нагрузки, включая модель GPT-5.3-Codex-Spark. Примечательно, что эта же модель сейчас работает на железе Cerebras — другого специализированного производителя чипов для инференса. То есть OpenAI параллельно тестирует несколько аппаратных платформ.
Цифры производительности — пока на доверии
OpenAI сообщает, что Jalapeño показывает «существенно лучшую» производительность на ватт по сравнению с актуальным железом. Архитектура якобы снижает перемещение данных внутри чипа и приближает утилизацию к теоретическому максимуму — это критично для инференса, где узкое место часто именно в пропускной способности памяти, а не в вычислительной мощности.
Проблема в том, что все эти цифры самоотчётные: независимой верификации нет, технический отчёт ещё не опубликован, и непонятно, с какими именно чипами сравнивали, на каких задачах и в каких условиях. Пока это маркетинговые заявления, которые нужно проверять.
Почему это важно для рынка
OpenAI годами зависела от NVIDIA — как и весь остальной рынок. Собственный чип меняет несколько вещей сразу.
Во-первых, стоимость инференса. Кастомное железо под конкретную задачу исторически выигрывает у универсальных GPU по соотношению цены и производительности — именно так Google сделала TPU дешевле для своих нагрузок. Если Jalapeño реально эффективнее, OpenAI сможет снижать цены на API или увеличивать маржу.
Во-вторых, надёжность поставок. Зависимость от одного вендора — это риск. Microsoft, которая обязалась купить 40% первой партии, получает доступ к альтернативному железу для Azure.
В-третьих, контроль над стеком. OpenAI прямо говорит: владение цепочкой от чипа до продукта позволяет быстрее итерировать и оптимизировать под свои модели. Это то, что Google и Amazon делают уже несколько лет.
Что остаётся неизвестным
Масштаб деплоя пока описан расплывчато — «гигаваттный масштаб к концу 2026 года» звучит амбициозно, но без конкретных цифр по количеству чипов или мощности дата-центров это сложно оценить. Неясно также, заменит ли Jalapeño NVIDIA в инфраструктуре OpenAI или будет работать параллельно для специфических нагрузок.
Отдельный вопрос — насколько архитектура гибкая. Чипы, оптимизированные под инференс, обычно плохо справляются с обучением. Если OpenAI планирует следующие поколения Jalapeño и под тренировку моделей — это принципиально другая инженерная задача.
Технический отчёт с реальными бенчмарками обещан позже. Вот тогда и будет понятно, насколько «существенно лучше» — это маркетинг или инженерный прорыв.