OpenAI i Broadcom pokazały Jalapeño. Chip do inferencji LLM
Źródło: Link
Źródło: Link
118 lekcji bez kodowania. ChatGPT, Claude, Gemini, automatyzacje. Notatnik AI i AI Coach w cenie.
OpenAI właśnie pokazało, że chce kontrolować cały stos technologiczny. Nie tylko modele, nie tylko aplikacje - teraz chipy. Razem z Broadcom ogłosili Jalapeño, chip ASIC zaprojektowany specjalnie do inferencji dużych modeli językowych. Odpowiedź na pytanie "po co im to" jest prosta: żeby przestać być zależnym od Nvidii i wycisnąć więcej mocy z każdego wata energii.
Broadcom i OpenAI nie wzięły gotowego projektu z półki. Jalapeño to ASIC (Application-Specific Integrated Circuit) - chip zaprojektowany od zera pod konkretne zadanie. W tym wypadku: inferencję dużych modeli językowych w centrach danych.
Broadcom twierdzi, że projekt powstał na podstawie szczegółowych rozmów z badaczami OpenAI. Nie chodziło tylko o to, co działa dzisiaj - wzięli pod uwagę roadmapę przyszłych modeli i produktów OpenAI. Od pomysłu do gotowego krzemu minęło dziewięć miesięcy.
To pierwsza generacja. Obie firmy mówią wprost: to długoterminowy projekt, chipy będą udoskonalane w kolejnych iteracjach. Jalapeño to początek, nie koniec.
Inferencja to moment, kiedy model już wytrenowany odpowiada na Twoje pytanie. Nie uczy się - pracuje. I tu jest haczyk: większość chipów w centrach danych (głównie GPU Nvidii) była projektowana do treningu modeli, nie do inferencji na masową skalę.
Jalapeño ma być bardziej wyspecjalizowany. Zamiast uniwersalnego narzędzia - skalpel do jednego zadania. Obietnica: lepsza wydajność na wat, mniejsze koszty operacyjne, większa przepustowość.
OpenAI twierdzi, że wczesne testy pokazują, że Jalapeño dostarczy wydajność na wat znacznie lepszą niż obecny state-of-the-art. Problem? Nie mamy żadnych liczb.
Firma zaznacza, że wciąż mierzy wydajność i szczegółowy raport techniczny ma się pojawić w kolejnych miesiącach. Do tego czasu - wierzymy na słowo. Albo czekamy.
To typowe dla tego typu ogłoszeń. Zapowiedź jest, konkretów brak. Czy Jalapeño rzeczywiście będzie lepsze od GPU Nvidii? O ile? W jakich scenariuszach? Na to pytanie odpowiedź dostaniemy później.
OpenAI chce posiadać pełny stos technologiczny. Od modelu, przez aplikację, po hardware. Cel: mniejsza zależność od zewnętrznych dostawców (czytaj: Nvidia) i potencjalnie lepsza wydajność dzięki integracji pionowej.
Drugi powód - globalny kryzys mocy obliczeniowej. Firmy AI walczą o dostęp do centrów danych. Każdy sposób na wyciśnięcie większej przepustowości z tego samego sprzętu to przewaga konkurencyjna. Rynek AI się zagęszcza, a moc obliczeniowa to wąskie gardło.
Broadcom to nie nowa firma w branży chipów. Ostatnio mocno stawia na klientów budujących infrastrukturę AI. Dostarcza niestandardowe chipy dla hyperscalerów i zespołów pracujących nad modelami frontier.
Boom AI to dla Broadcom nowy rynek. Firma widziała już podobne cykle - teraz wykorzystuje doświadczenie z produkcji chipów do infrastruktury obliczeniowej i przenosi je na grunt AI. Jalapeño to kolejny krok w tej strategii.
Dla OpenAI to partner, który wie jak produkować krzem na skalę. Dla Broadcom to klient, który potrzebuje milionów chipów do centrów danych na całym świecie. Obie strony mają interes, żeby to zadziałało.
Obie firmy twierdzą, że chipy Jalapeño trafią do centrów danych do końca tego roku. To ambitny plan - mamy czerwiec 2026, więc mówimy o sześciu miesiącach.
Czy to realne? Zależy od tego, na jakim etapie jest produkcja. Jeśli prototypy już działają i testy trwają, to może się udać. Jeśli wciąż są w fazie projektowania - termin jest optymistyczny.
Dla Ciebie jako użytkownika ChatGPT to może oznaczać szybsze odpowiedzi albo niższe koszty (które OpenAI może, ale nie musi, przełożyć na ceny). Albo po prostu większą pojemność - więcej użytkowników obsłużonych tym samym sprzętem. Skala wdrożeń rośnie, więc każda optymalizacja infrastruktury się liczy.
Jeśli Jalapeño spełni obietnice, OpenAI będzie mogło obsługiwać więcej zapytań tym samym budżetem energetycznym. To oznacza niższe koszty operacyjne albo większą przepustowość - albo jedno i drugie.
Dla rynku to sygnał, że era dominacji Nvidii w AI może się kończyć. Nie od razu, nie całkowicie - jeśli OpenAI, Google, Microsoft i inni zaczną projektować własne chipy, Nvidia straci część monopolu. Firmy szukają sposobów na obniżenie kosztów AI, a własny hardware to jedna z dróg.
Dla Ciebie? Na razie niewiele. Dopóki nie zobaczymy konkretnych liczb i realnych wdrożeń, to tylko zapowiedź. Jeśli trend się utrzyma i więcej firm pójdzie tą drogą, ceny AI mogą w końcu przestać rosnąć. A to byłaby dobra wiadomość.
ASIC (Application-Specific Integrated Circuit) to chip zaprojektowany pod jedno konkretne zadanie - w tym wypadku inferencję LLM. GPU to procesor uniwersalny, który radzi sobie z wieloma zadaniami, ale nie jest zoptymalizowany pod żadne konkretne. ASIC jest szybszy i bardziej energooszczędny w swoim zadaniu, ale nie da się go użyć do niczego innego.
Według zapowiedzi OpenAI i Broadcom - do końca 2026 roku. Mamy czerwiec, więc mówimy o sześciu miesiącach. Czy to realistyczny termin, przekonamy się w drugiej połowie roku.
Potencjalnie tak, ale nie od razu. Jeśli Jalapeño rzeczywiście dostarczy lepszą wydajność na wat, OpenAI będzie mogło obsłużyć więcej zapytań tym samym sprzętem. To może przełożyć się na szybsze odpowiedzi albo większą dostępność serwisu w godzinach szczytu. Konkretów nie mamy - czekamy na szczegółowy raport techniczny.
Używa, ale chce zmniejszyć zależność od jednego dostawcy. Nvidia ma praktycznie monopol na chipy do AI, co oznacza wysokie ceny i ograniczoną dostępność. Własny chip daje OpenAI większą kontrolę nad kosztami, wydajnością i łańcuchem dostaw. OpenAI inwestuje w infrastrukturę, żeby skalować się szybciej niż konkurencja.
Tak. Google ma TPU (Tensor Processing Units) od lat, Microsoft pracuje nad własnymi chipami, Amazon ma Trainium i Inferentia. To trend - im większa firma, tym większy sens ma inwestycja we własny hardware. Nvidia wciąż dominuje, ale jej pozycja nie jest już tak niepodważalna jak dwa lata temu.
Na podstawie: Ars Technica, OpenAI
Podoba Ci się ten artykuł?
Co piątek wysyłam podsumowanie najlepszych artykułów tygodnia. Zapisz się!
90 minut praktycznej wiedzy o AI. Pokaze Ci krok po kroku, jak zaczac oszczedzac 10 godzin tygodniowo dzieki sztucznej inteligencji.
Zapisz sie na webinar