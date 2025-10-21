Nový král. Proč GPU NVIDIA RTX PRO 6000 poráží H100 NVL v LLM GPT až o +58 %
Když do hry vstoupí nový hráč, často přepíše pravidla. Přesně to dělá RTX PRO 6000 Blackwell, která v testech s velkými jazykovými modely (LLM) ukazuje, že ani datacentrový obr NVIDIA H100 NVL už nemusí být nepřekonatelný. Model gpt-oss 120B od provozovatele ChatGPT s nároky na 96 GB VRAM konečně našel grafiku, která ho zvládne udržet v jednom kuse – bez kompromisů a bez nutnosti drahé infrastruktury.
Rychlost inference
Rychlost inference je pro praktické použití LLM zásadní. Měří se schopností GPU rychle zpracovat vstupní prompt a generovat výstup.
Ve zpracování promptu, důležitém například pro RAG (retrieval-augmented generation), dosahuje H100 průměrně 575,5 tokenů za sekundu. PRO 6000 ale překvapivě vede s 776,2 tokenů/s. To představuje o 35 % rychlejší zpracování vstupu. V obou případech testy kolíšou ± 10%.
Při samotném generování výstupu je rozdíl ještě výraznější. PRO 6000 vykazuje 108,9 ± 4,3 tokenů/s, zatímco H100 dosahuje 68,75 ± 1,64 tokenů/s, tedy o 58 % rychlejší tvorbu výstupu. I když směrodatné odchylky byly spočítány spíše ilustrativně, výsledky jasně ukazují, že PRO 6000 výrazně urychlí práci s promptem i generováním textu.
Testy byly provedeny s modelem gpt‑oss: 120B (f7f8e2f8f4e0) z knihovny Ollama, v prostředí OpenWebUI v0.6.18 a verzí Ollama 0.11.2. Instance byly uzavřeny po měření, takže výsledky odráží výkon jednotlivého GPU v reálném scénáři, bez dalšího paralelního zatížení.
Cena a provoz
Pořizovací cena a provozní náklady hrají při výběru GPU pro LLM velkou roli, a právě zde PRO 6000 získává výhodu. H100 NVL stojí zhruba jeden milion Kč. To z ní činí investici vhodnou spíše pro velká datacentra.
Naproti tomu RTX PRO 6000 Blackwell vychází na cca 250 tisíc Kč, tedy je 4× levnější, a navíc ji lze pronajmout – například na zonercloud.cz za 14 990 Kč měsíčně. Tím pádem i menší týmy mohou využívat špičkový výkon bez nutnosti velké počáteční investice.
Po stránce provozu má PRO 6000 spotřebu až 600 W, zatímco H100 NVL dosahuje 350‑400 W. Díky tomu, že PRO 6000 pojme celý model lokálně, není nutné pořizovat drahé multi-GPU clustery ani řešit složité síťové propojení. To dále snižuje náklady.
|GPU
|Pořizovací cena
|Poměr cena / H100
|Možnost pronájmu
|Spotřeba
|H100 NVL
|cca 1 000 000 Kč
|1×
|není běžně dostupné pro menší týmy
|350–400 W
|RTX PRO 6000 Blackwell
|cca 250 000 Kč
|0,25× (4× levnější)
|ZonerCloud: 14 990 Kč/měsíc
|až 600 W
Technické parametry PRO 6000 Blackwell
|Parametr
|Hodnota
|Architektura
|NVIDIA Blackwell
|Paměť
|96 GB GDDR7 ECC
|Šířka sběrnice
|512 bit
|Propustnost paměti
|~1,8 TB/s
|CUDA jádra
|24 064
|Tensor jádra
|5. generace (752 jednotek)
|RT jádra
|4. generace (188 jednotek)
|Výkon FP32
|~125 TFLOPS
|Výkon AI / TOPS
|až 4 000 TOPS
|Rozhraní
|PCIe Gen 5 x16
|Spotřeba (max)
|600 W
|Podpora MIG / dělení
|1×96 GB, 2×48 GB, 4×24 GB
Díky těmto parametrům dokáže PRO 6000 držet celý model gpt‑oss 120B v jednom GPU, aniž by bylo nutné jej rozdělovat nebo swapovat paměť.
Srovnání H100 vs PRO 6000
|Aspekt
|PRO 6000 Blackwell
|H100 NVL
|Paměť
|96 GB
|94 GB HBM3
|Propustnost paměti
|~1,8 TB/s
|~3,9 TB/s
|Výkon AI / TOPS
|4 000
|~3 341
|Spotřeba
|až 600 W
|350‑400 W
|Efektivita na watt
|nižší
|vyšší
|Infrastrukturní nároky
|nízké, pracovní stanice
|vysoké, datacentrum
|Držení modelu ≥96 GB
|ano
|může být limitující
|Komplexita clusteru
|snadné
|vyšší
H100 má výhodu ve surovém výkonu a efektivitě na watt, ale PRO 6000 vyhrává praktickým aspektem – celý model pojme v jednom GPU, bez nutnosti složitého dělení nebo datacentrové infrastruktury.
Verdikt
RTX PRO 6000 Blackwell se tedy stává novým lídrem pro provoz velkých LLM modelů. Díky 96 GB VRAM dokáže držet celý model kompletně v jednom GPU. To výrazně zjednodušuje nasazení a práci s obrovskými modely.
Rychlost zpracování promptu i generování výstupu je u PRO 6000 výrazně vyšší než u H100 NVL, což se při reálném použití okamžitě projeví v rychlejších odezvách a efektivnější práci.
Další předností je nižší pořizovací cena a možnost pronájmu. To zajišťuje dostupnost i menším týmům nebo jednotlivcům. H100 NVL zůstává vhodná pro extrémně paralelní datová centra a aplikace vyžadující maximální propustnost, ale pro většinu praktických scénářů se PRO 6000 stává jasnou volbou – a navíc za cenu, která není nedosažitelná.
Pokud hledáte praktické řešení pro provoz velkých LLM modelů, vyzkoušejte PRO 6000 přes ZonerCloud. Kromě pohodlného pronájmu získáte rychlý přístup k výkonu přímo z ČR, což minimalizuje latenci a umožňuje rychlejší odezvy.
Pronájem navíc eliminuje vysoké pořizovací náklady a složitou infrastrukturu – nepotřebujete vlastní serverovnu ani multi-GPU clustery. Pro menší týmy nebo jednotlivce jde o cenově dostupný a flexibilní způsob, jak využívat špičkový hardware s minimální administrativní zátěží.
