OpenAI i Broadcom pokazały Jalapeño. Chip do inferencji LLM

OpenAI i Broadcom zaprezentowały chip Jalapeño - ASIC zaprojektowany od zera do inferencji LLM w centrach danych
Projekt trwał dziewięć miesięcy, powstał na podstawie rozmów z badaczami OpenAI i roadmapy przyszłych modeli
Wczesne testy pokazują lepszą wydajność na wat niż obecne rozwiązania, ale szczegółowe dane mają pojawić się w kolejnych miesiącach
Chipy mają trafić do centrów danych do końca 2026 roku

OpenAI właśnie pokazało, że chce kontrolować cały stos technologiczny. Nie tylko modele, nie tylko aplikacje - teraz chipy. Razem z Broadcom ogłosili Jalapeño, chip ASIC zaprojektowany specjalnie do inferencji dużych modeli językowych. Odpowiedź na pytanie "po co im to" jest prosta: żeby przestać być zależnym od Nvidii i wycisnąć więcej mocy z każdego wata energii.

Centra danych to pole bitwy o moc obliczeniową AI - każdy wat się liczy

Dziewięć miesięcy od pomysłu do krzemu

Broadcom i OpenAI nie wzięły gotowego projektu z półki. Jalapeño to ASIC (Application-Specific Integrated Circuit) - chip zaprojektowany od zera pod konkretne zadanie. W tym wypadku: inferencję dużych modeli językowych w centrach danych.

Broadcom twierdzi, że projekt powstał na podstawie szczegółowych rozmów z badaczami OpenAI. Nie chodziło tylko o to, co działa dzisiaj - wzięli pod uwagę roadmapę przyszłych modeli i produktów OpenAI. Od pomysłu do gotowego krzemu minęło dziewięć miesięcy.

To pierwsza generacja. Obie firmy mówią wprost: to długoterminowy projekt, chipy będą udoskonalane w kolejnych iteracjach. Jalapeño to początek, nie koniec.

Chip zaprojektowany do inferencji

Inferencja to moment, kiedy model już wytrenowany odpowiada na Twoje pytanie. Nie uczy się - pracuje. I tu jest haczyk: większość chipów w centrach danych (głównie GPU Nvidii) była projektowana do treningu modeli, nie do inferencji na masową skalę.

Jalapeño ma być bardziej wyspecjalizowany. Zamiast uniwersalnego narzędzia - skalpel do jednego zadania. Obietnica: lepsza wydajność na wat, mniejsze koszty operacyjne, większa przepustowość.

ASIC to chip zaprojektowany pod jedno zadanie - w tym wypadku inferencję LLM

Obietnice bez konkretów

OpenAI twierdzi, że wczesne testy pokazują, że Jalapeño dostarczy wydajność na wat znacznie lepszą niż obecny state-of-the-art. Problem? Nie mamy żadnych liczb.

Firma zaznacza, że wciąż mierzy wydajność i szczegółowy raport techniczny ma się pojawić w kolejnych miesiącach. Do tego czasu - wierzymy na słowo. Albo czekamy.

To typowe dla tego typu ogłoszeń. Zapowiedź jest, konkretów brak. Czy Jalapeño rzeczywiście będzie lepsze od GPU Nvidii? O ile? W jakich scenariuszach? Na to pytanie odpowiedź dostaniemy później.

Dlaczego OpenAI w ogóle to robi

OpenAI chce posiadać pełny stos technologiczny. Od modelu, przez aplikację, po hardware. Cel: mniejsza zależność od zewnętrznych dostawców (czytaj: Nvidia) i potencjalnie lepsza wydajność dzięki integracji pionowej.

Drugi powód - globalny kryzys mocy obliczeniowej. Firmy AI walczą o dostęp do centrów danych. Każdy sposób na wyciśnięcie większej przepustowości z tego samego sprzętu to przewaga konkurencyjna. Rynek AI się zagęszcza, a moc obliczeniowa to wąskie gardło.

Wyścig o moc obliczeniową to dziś kluczowa bitwa w świecie AI

Broadcom zyskuje nowy rynek

Broadcom to nie nowa firma w branży chipów. Ostatnio mocno stawia na klientów budujących infrastrukturę AI. Dostarcza niestandardowe chipy dla hyperscalerów i zespołów pracujących nad modelami frontier.

Boom AI to dla Broadcom nowy rynek. Firma widziała już podobne cykle - teraz wykorzystuje doświadczenie z produkcji chipów do infrastruktury obliczeniowej i przenosi je na grunt AI. Jalapeño to kolejny krok w tej strategii.

Dla OpenAI to partner, który wie jak produkować krzem na skalę. Dla Broadcom to klient, który potrzebuje milionów chipów do centrów danych na całym świecie. Obie strony mają interes, żeby to zadziałało.

Kiedy zobaczysz Jalapeño w akcji

Obie firmy twierdzą, że chipy Jalapeño trafią do centrów danych do końca tego roku. To ambitny plan - mamy czerwiec 2026, więc mówimy o sześciu miesiącach.

Czy to realne? Zależy od tego, na jakim etapie jest produkcja. Jeśli prototypy już działają i testy trwają, to może się udać. Jeśli wciąż są w fazie projektowania - termin jest optymistyczny.

Dla Ciebie jako użytkownika ChatGPT to może oznaczać szybsze odpowiedzi albo niższe koszty (które OpenAI może, ale nie musi, przełożyć na ceny). Albo po prostu większą pojemność - więcej użytkowników obsłużonych tym samym sprzętem. Skala wdrożeń rośnie, więc każda optymalizacja infrastruktury się liczy.

Co to zmienia w praktyce

Jeśli Jalapeño spełni obietnice, OpenAI będzie mogło obsługiwać więcej zapytań tym samym budżetem energetycznym. To oznacza niższe koszty operacyjne albo większą przepustowość - albo jedno i drugie.

Dla rynku to sygnał, że era dominacji Nvidii w AI może się kończyć. Nie od razu, nie całkowicie - jeśli OpenAI, Google, Microsoft i inni zaczną projektować własne chipy, Nvidia straci część monopolu. Firmy szukają sposobów na obniżenie kosztów AI, a własny hardware to jedna z dróg.

Dla Ciebie? Na razie niewiele. Dopóki nie zobaczymy konkretnych liczb i realnych wdrożeń, to tylko zapowiedź. Jeśli trend się utrzyma i więcej firm pójdzie tą drogą, ceny AI mogą w końcu przestać rosnąć. A to byłaby dobra wiadomość.

Najczęstsze pytania

Czym różni się ASIC od GPU?

ASIC (Application-Specific Integrated Circuit) to chip zaprojektowany pod jedno konkretne zadanie - w tym wypadku inferencję LLM. GPU to procesor uniwersalny, który radzi sobie z wieloma zadaniami, ale nie jest zoptymalizowany pod żadne konkretne. ASIC jest szybszy i bardziej energooszczędny w swoim zadaniu, ale nie da się go użyć do niczego innego.

Kiedy Jalapeño trafi do centrów danych?

Według zapowiedzi OpenAI i Broadcom - do końca 2026 roku. Mamy czerwiec, więc mówimy o sześciu miesiącach. Czy to realistyczny termin, przekonamy się w drugiej połowie roku.

Czy to oznacza, że ChatGPT będzie szybszy?

Potencjalnie tak, ale nie od razu. Jeśli Jalapeño rzeczywiście dostarczy lepszą wydajność na wat, OpenAI będzie mogło obsłużyć więcej zapytań tym samym sprzętem. To może przełożyć się na szybsze odpowiedzi albo większą dostępność serwisu w godzinach szczytu. Konkretów nie mamy - czekamy na szczegółowy raport techniczny.

Dlaczego OpenAI nie używa po prostu chipów Nvidii?

Używa, ale chce zmniejszyć zależność od jednego dostawcy. Nvidia ma praktycznie monopol na chipy do AI, co oznacza wysokie ceny i ograniczoną dostępność. Własny chip daje OpenAI większą kontrolę nad kosztami, wydajnością i łańcuchem dostaw. OpenAI inwestuje w infrastrukturę, żeby skalować się szybciej niż konkurencja.

Czy inne firmy AI też projektują własne chipy?

Tak. Google ma TPU (Tensor Processing Units) od lat, Microsoft pracuje nad własnymi chipami, Amazon ma Trainium i Inferentia. To trend - im większa firma, tym większy sens ma inwestycja we własny hardware. Nvidia wciąż dominuje, ale jej pozycja nie jest już tak niepodważalna jak dwa lata temu.

Na podstawie: Ars Technica, OpenAI

OpenAI i Broadcom pokazały Jalapeño. Chip do inferencji LLM

Kurs AI Evolution - od zera do eksperta

Powiązane tematy