OpenAI сделала свой чип за 9 месяцев — и сразу нацелилась на Nvidia
OpenAI и Broadcom представили Jalapeño — кастомный чип для инференса LLM. Разбираем, что внутри, зачем это OpenAI и что это значит для Nvidia.

24 июня 2026 года OpenAI и Broadcom официально представили Jalapeño — первый кастомный AI-чип компании, разработанный специально под инференс больших языковых моделей. Девять месяцев от идеи до анонса, партнёр по производству — Broadcom, производственная цепочка — через Celestica. Для Nvidia это первый реальный сигнал тревоги от одного из крупнейших покупателей её GPU.
Почему OpenAI вообще понадобился собственный чип
OpenAI годами покупала вычислительные мощности у Nvidia — и платила за это рыночную цену. Инференс (то есть запуск уже обученной модели для ответов пользователям) — это постоянные, масштабные и очень дорогие вычисления. Каждый запрос к ChatGPT, каждый вызов API — это нагрузка на GPU, которая стоит денег здесь и сейчас, в отличие от обучения, которое происходит редко.
Кастомный чип, заточенный именно под инференс LLM, позволяет выжать больше производительности на ватт потребляемой мощности — и тем самым снизить стоимость каждого токена. По имеющимся данным, Jalapeño существенно превосходит текущие GPU Nvidia по метрике performance-per-watt именно на инференс-задачах.
Что внутри Jalapeño и кто его делает
OpenAI проектировала чип с нуля, опираясь на собственное понимание архитектуры LLM: как работают модели, какие операции самые дорогие, как устроены системы сервинга (то есть подачи запросов к модели в реальном времени). Это не адаптация чужого решения — это чип, спроектированный под конкретный тип нагрузки.
Broadcom взял на себя реализацию: физическое проектирование чипа, интеграцию в платы и стойки, высокопроизводительный нетворкинг между чипами в кластере. Celestica отвечает за производство и сборку систем. Схема напоминает то, как Google строила свои TPU (Tensor Processing Units) — самостоятельная разработка архитектуры плюс партнёр по производству.
Чипы будут использоваться самой OpenAI для собственной инфраструктуры — пока речь не идёт о продаже Jalapeño сторонним компаниям.
Что это значит на практике — для рынка и для пользователей
Для конечного пользователя ChatGPT изменения будут незаметны напрямую. Но в перспективе снижение стоимости инференса означает либо более дешёвые тарифы, либо возможность запускать более мощные модели при той же цене.
Для разработчиков, которые строят продукты на OpenAI API, это тоже потенциально хорошая новость: если себестоимость токена падает, рано или поздно это отражается в прайсинге. OpenAI уже несколько раз снижала цены на API за последние два года — кастомный чип даёт для этого дополнительный рычаг.
Для Nvidia ситуация серьёзнее. OpenAI — один из крупнейших покупателей GPU в мире. Если компания начнёт переводить инференс-нагрузку на Jalapeño, это прямо сокращает спрос на продукцию Nvidia. Прецедент уже есть: Google TPU и AWS Trainium/Inferentia показали, что крупные облачные игроки способны частично уйти с Nvidia-железа. Теперь к ним добавляется OpenAI.
Где пока остаются вопросы
Девять месяцев — очень короткий срок для разработки чипа. Обычно цикл от архитектуры до готового кремния занимает два-три года. Это либо означает, что OpenAI использовала готовые IP-блоки (лицензированные архитектурные компоненты) от Broadcom, либо что чип намеренно сделан достаточно простым, чтобы уложиться в этот срок. Детали архитектуры — техпроцесс, количество вычислительных блоков, объём памяти — пока не раскрыты.
Также неизвестно, как Jalapeño справляется с обучением моделей. Судя по всему, чип заточен исключительно под инференс — значит, для тренировки новых моделей OpenAI по-прежнему будет зависеть от Nvidia или других поставщиков. Полной независимости от внешнего железа пока нет.
Наконец, открытый вопрос — масштаб. Один кастомный чип не решает проблему: нужны тысячи и десятки тысяч единиц в кластере, отлаженный нетворкинг между ними, программный стек. Насколько быстро OpenAI сможет нарастить производство — пока неясно.
Следующий шаг: «построить полный стек»
Сэм Альтман давно говорит о стратегии «build the full stack» — контролировать весь путь от чипа до пользовательского интерфейса. Jalapeño — первый материальный шаг в этом направлении на уровне железа. Если чип окажется успешным, следующим логичным шагом будет чип для обучения моделей — и тогда зависимость от Nvidia станет по-настоящему минимальной.
Пока Jalapeño — это заявка, а не готовая альтернатива. Но заявка сделана публично, с конкретным партнёром и конкретными сроками. В AI-индустрии 2026 года это уже само по себе событие.