Kup Krypto Rynki Spot FuturesGOLD Earn Centrum wydarzeń

Więcej

Aktualizacja Ray Serve LLM firmy Anyscale umożliwia odporność na awarie grupy DP dla wdrożeń vLLM WideEP, zmniejszając ryzyko przestojów w rozproszonych systemach wnioskowania AI. (CzytajAktualizacja Ray Serve LLM firmy Anyscale umożliwia odporność na awarie grupy DP dla wdrożeń vLLM WideEP, zmniejszając ryzyko przestojów w rozproszonych systemach wnioskowania AI. (Czytaj

Ray 2.55 dodaje odporność na awarie dla wdrożeń modeli AI na dużą skalę

Źródło: BlockChain News

2026/04/03 02:35

3 min. lektury

Udostępnij

Raydium

RAY$0.615-7.83%

W przypadku uwag lub wątpliwości dotyczących niniejszej treści skontaktuj się z nami pod adresem [email protected]

Ray 2.55 Dodaje Tolerancję Awarii dla Wdrożeń Modeli AI na Dużą Skalę

Joerg Hiller 02 kwi 2026 18:35

Aktualizacja Ray Serve LLM firmy Anyscale umożliwia tolerancję awarii grupy DP dla wdrożeń vLLM WideEP, zmniejszając ryzyko przestoju dla rozproszonych systemów wnioskowania AI.

Ray 2.55 Dodaje Tolerancję Awarii dla Wdrożeń Modeli AI na Dużą Skalę

Anyscale wydało znaczącą aktualizację swojego frameworka Ray Serve LLM, która odpowiada na krytyczne wyzwanie operacyjne dla organizacji prowadzących obciążenia wnioskowania AI na dużą skalę. Ray 2.55 wprowadza tolerancję awarii grupy równoległej danych (DP) dla wdrożeń vLLM Wide Expert Parallelism — funkcję, która zapobiega sytuacji, w której awaria pojedynczego GPU powoduje wyłączenie całych klastrów obsługujących model.

Aktualizacja dotyczy konkretnego problemu w obsłudze modeli Mixture of Experts (MoE). W przeciwieństwie do tradycyjnych wdrożeń modeli, gdzie każda replika działa niezależnie, architektury MoE, takie jak DeepSeek-V3, dzielą warstwy ekspertów na grupy GPU, które muszą działać wspólnie. Gdy jeden GPU w tych konfiguracjach ulega awarii, cała grupa — potencjalnie obejmująca od 16 do 128 GPU — staje się niefunkcjonalna.

Problem Techniczny

Modele MoE dystrybuują wyspecjalizowane sieci neuronowe „ekspertów" na wiele GPU. DeepSeek-V3, na przykład, zawiera 256 ekspertów na warstwę, ale aktywuje tylko 8 na token. Tokeny są kierowane do GPU przechowujących potrzebnych ekspertów za pomocą operacji wysyłania i łączenia, które wymagają, aby wszystkie uczestniczące rangi były sprawne.

Wcześniej awaria pojedynczej rangi przerywała te operacje zbiorowe. Zapytania nadal byłyby kierowane do pozostałych replik w dotkniętej grupie, ale każde żądanie kończyłoby się niepowodzeniem. Odzyskanie wymagało ponownego uruchomienia całego systemu.

Jak Ray To Rozwiązuje

Ray Serve LLM traktuje teraz każdą grupę DP jako jednostkę atomową poprzez szeregowanie grupowe. Gdy jedna ranga ulega awarii, system oznacza całą grupę jako niesprawną, zatrzymuje kierowanie ruchu do niej, rozmontowuje uszkodzoną grupę i odbudowuje ją jako całość. Inne sprawne grupy nadal obsługują żądania przez cały czas.

Funkcja jest domyślnie włączona w Ray 2.55. Istniejące wdrożenia DP nie wymagają zmian w kodzie — framework automatycznie obsługuje kontrole stanu na poziomie grupy, szeregowanie i odzyskiwanie.

Autoskalowanie również respektuje te granice. Operacje skalowania w górę i w dół odbywają się w przyrostach wielkości grupy, a nie pojedynczych replik, zapobiegając tworzeniu częściowych grup, które nie mogą obsługiwać ruchu.

Implikacje Operacyjne

Aktualizacja wprowadza ważną kwestię projektową: szerokość grupy w porównaniu z liczbą grup. Według testów porównawczych vLLM cytowanych przez Anyscale, przepustowość na GPU pozostaje względnie stabilna przy równoległych rozmiarach ekspertów wynoszących 32, 72 i 96. Oznacza to, że operatorzy mogą dostroić się w kierunku mniejszych grup bez poświęcania wydajności — a mniejsze grupy oznaczają mniejsze promienie wybuchu w przypadku awarii.

Anyscale zauważa, że ta odporność na poziomie orkiestracji uzupełnia pracę nad elastycznością na poziomie silnika odbywającą się w społeczności vLLM. RFC vLLM Elastic Expert Parallelism dotyczy tego, jak środowisko uruchomieniowe może dynamicznie dostosowywać topologię w obrębie grupy, podczas gdy Ray Serve LLM zarządza tym, które grupy istnieją i otrzymują ruch.

Dla organizacji wdrażających modele w stylu DeepSeek na dużą skalę praktyczna korzyść jest prosta: awarie GPU stają się incydentami zlokalizowanymi, a nie przestojami obejmującymi cały system. Przykłady kodu i kroki reprodukcji są dostępne w repozytorium GitHub firmy Anyscale.

Źródło obrazu: Shutterstock

ray
vllm
infrastruktura ai
uczenie maszynowe
obliczenia rozproszone

Okazja rynkowa

Cena Raydium(RAY)

$0.615

$0.615$0.615

-0.51%

USD

Raydium (RAY) Wykres Ceny na Żywo

Get 20 USDT in Just 1 Minute

Get 20 USDT in Just 1 Minute

Get 20 USDT in Just 1 Minute

Deposit $100 to unlock $300 in GOLD positions

Zastrzeżenie: Artykuły udostępnione na tej stronie pochodzą z platform publicznych i służą wyłącznie celom informacyjnym. Niekoniecznie odzwierciedlają poglądy MEXC. Wszystkie prawa pozostają przy pierwotnych autorach. Jeśli uważasz, że jakakolwiek treść narusza prawa stron trzecich, skontaktuj się z [email protected] w celu jej usunięcia. MEXC nie gwarantuje dokładności, kompletności ani aktualności treści i nie ponosi odpowiedzialności za jakiekolwiek działania podjęte na podstawie dostarczonych informacji. Treść nie stanowi porady finansowej, prawnej ani innej profesjonalnej porady, ani nie powinna być traktowana jako rekomendacja lub poparcie ze strony MEXC.

Możesz także polubić

Prezes Ripple odpowiada założycielowi Avalanche: Miło wiedzieć, że żyjemy w Twojej głowie za darmo

Prezes Ripple odpowiada założycielowi Avalanche: Miło wiedzieć, że żyjemy w Twojej głowie za darmo

Konkurencja między głównymi ekosystemami blockchain nadal się nasila, gdy projekty rywalizują o instytucjonalną istotność i dominację narracyjną w szybko dojrzewającym cyfrowym

Timestabloid2026/04/03 03:05

Kontrakty terminowe Dow Jones gwałtownie spadają, gdy niestabilny cykl strachu i nadziei przyspiesza zawirowania na rynku

Kontrakty terminowe Dow Jones gwałtownie spadają, gdy niestabilny cykl strachu i nadziei przyspiesza zawirowania na rynku

BitcoinWorld Kontrakty terminowe Dow Jones gwałtownie spadają, gdy niestabilny cykl strachu i nadziei przyspiesza zawirowania na rynku NOWY JORK, marzec 2025 – Kontrakty terminowe na Dow Jones Industrial Average doświadczyły

bitcoinworld2026/04/03 02:30

Wiadomości kryptowalutowe: JP Morgan wyznacza cel $170K dla Bitcoina, Dlaczego inteligentny kapitał zwraca się ku temu wschodzącemu tokenowi użytkowemu

Wiadomości kryptowalutowe: JP Morgan wyznacza cel $170K dla Bitcoina, Dlaczego inteligentny kapitał zwraca się ku temu wschodzącemu tokenowi użytkowemu

JP Morgan właśnie podał konkretną liczbę, wokół której rynek krążył bez zobowiązania się. CoinDesk potwierdził, że analitycy JPMorgan ustalili godziwą wartość Bitcoin

Techbullion2026/04/03 03:00

Get 15 USDT Instantly on Deposit

Get 15 USDT Instantly on Deposit

Get 15 USDT Instantly on Deposit

Spin for $200,000 in Gold, Oil, BTC, and more

Popularne wiadomości

Zegar zmian w gabinecie Trumpa tyka, podczas gdy republikańska większość w Senacie wisi w niepewności

Spadek nie jest straszny – oto 5 akcji, które ekspert kupuje w tym kwietniu

Pam Bondi podobno dowiedziała się o swoim zwolnieniu przed wieczornym przemówieniem Trumpa

Google wraca do wyścigu open source AI z Gemma 4

Zhańbiony komik wraca do mainstreamu po przyznaniu się do niewłaściwego zachowania seksualnego

Wiadomości na żywo 24/7

Skarbiec Ripple przetworzył w ubiegłym roku płatności o wartości 13 bilionów dolarów, co podkreśla ogromną skalę infrastruktury w globalnych transakcjach.

Autor: Ripple Bull Winkle | Crypto Researcher 🚀🚨06:02

SWIFT ogłosił, że ponad pięćdziesiąt banków dołącza do nowego systemu płatności transgranicznych, przyćmiewając wiadomość o ratingu BBB Ripple.

Autor: Ripple Bull Winkle | Crypto Researcher 🚀🚨05:40

SWIFT uwzględnia XRP wśród 8 aktywów cyfrowych do integracji z globalną infrastrukturą płatniczą.

Autor: Ripple Bull Winkle | Crypto Researcher 🚀🚨05:02

Michael Saylor omawiał strategię dotyczącą Bitcoina z Elonem Muskiem pięć lat temu, podkreślając wczesną wizję, która teraz się urzeczywistnia.

Autor: Crypto Pump04:05

Dyrektor generalny Ripple ocenia, że istnieje 90% szans na uchwalenie w tym miesiącu ustawy Crypto Clarity Act, co sygnalizuje potencjalny postęp w obszarze regulacji.

Autor: BlockNews03:59

Ceny kryptowalut

Bitcoin

BTC

$66,939.82$66,939.82

+0.13%

Ethereum

ETH

$2,059.67$2,059.67

0.00%

Solana

SOL

-0.10%

Stakestone

STO

$0.23640$0.23640

-38.33%

XRP

XRP

+1.18%

Trade GOLD, Share 1,000,000 USDT

Trade GOLD, Share 1,000,000 USDT

Trade GOLD, Share 1,000,000 USDT

0 fees, up to 1,000x leverage, deep liquidity