Konkrétní AI modely · Levný open-weight

Co je GLM?

Čínský open-weight model od Zhipu, oblíbený ve vibe codingu. Špičkové kódování za zlomek ceny. Skvělý a levný, ale s otazníkem, kam jdou vaše data.

Autor: Jindřich Fáborský · 17 let v marketingu · 2 000+ hodin vibe codingu · 180+ projektů

Open-weight
GLM-5.2
Zhipu AI · Čína
Zdarma v chatu1M kontextExtrémně levné

Rychlá odpověď

Co je tedy GLM?

GLM je řada AI modelů od čínské firmy Zhipu AI. Aktuálně jde o verzi GLM-5.2. Proslavila se špičkovým kódováním za extrémně nízkou cenu, zlomek toho, co stojí GPT-5.5.

Je open-weight: váhy jsou volně ke stažení pod licencí MIT. Vyzkoušíte ho zdarma v chatu, zapojíte přes levné API (i do Claude Code), nebo si ho, pokud máte hodně výkonný hardware, pustíte u sebe.

Má to ale háček, který u čínského modelu musíte znát: kam jdou vaše data. Věnujeme se mu níž, i s důležitým rozdílem mezi cloudem a během u vás.

Vizitka modelu

GLM-5.2 v kostce

Nejdůležitější čísla a odkazy na jednom místě. GLM se aktualizuje rychle, tak berte kartu jako momentku a datum dole.

GLM

Zhipu AI (Z.ai) · Čína

Open-weightlicence MIT

Nejnovější verze

GLM-5.2 · 13. 6. 2026

Varianty

Jen plný model (744 mld. / ~40 mld. aktivních parametrů); menší varianta pro 5.2 zatím není

Kontextové okno

1 milion tokenů

Poběží lokálně u vás?

částečněVáhy jsou volně ke stažení (MIT), ale 744 mld. parametrů se doma na notebooku nerozjedou: chce 256+ GB paměti nebo server. Reálná cesta je API nebo cloud GPU.

Cena

API vstup / výstup$1,40 / $4,40 za 1M tokenů
ChatZdarma (chat.z.ai)
GLM Coding Planod ~$18/měs (promo −30 % do 9/2026)
Váhy ke staženíZdarma (MIT)

Kde ho vyzkoušíte

Chat (chat.z.ai)APIGLM Coding PlanHugging Face (váhy)OpenRouterClaude Code (přes API)

Stav k červenec 2026. Ceny, verze a limity se u AI modelů mění rychle, berte to jako momentku a u důležitého rozhodnutí si aktuální číslo ověřte u zdroje.

V čem je dobrý

Proč se o GLM mluví

GLM se nedostal na výsluní náhodou. Má tři věci, které z něj dělají oblíbence vibe coderů.

Špičkové agentní kódování

GLM je cílený na dlouhé kódovací úlohy a válí: na benchmarku SWE-bench Pro poráží GPT-5.5 a drží se za dražší Claude špičkou. Přesně proto se dostal do hledáčku vibe coderů.

Extrémně levné

Za tokeny u GLM zaplatíte řádově míň, zhruba šestinu ceny GPT-5.5 při srovnatelném výsledku na kódování. Nejlepší poměr výkonu a ceny mezi otevřenými modely.

Open-weight (MIT)

Váhy jsou volně ke stažení pod volnou licencí MIT, bez omezení. Kdo má dost silný hardware, může GLM provozovat jako lokální AI, a data pak zůstanou u něj. To je klíč k celé debatě o bezpečnosti.

Kde reálně stojí

GLM v číslech: fakt drží krok?

Kolem levných čínských modelů je hodně hype. Tady jsou dvě disciplíny, kde GLM-5.2 překvapivě válí, a to za zlomek ceny špičky.

Vending-Bench 2: rok řízení prodejního automatu

vyšší = lepší

Model celý simulovaný rok sám podniká (objednává, nastavuje ceny, vyjednává). Měří se, kolik peněz mu zbyde.

Claude Opus 4.7
vlajkový
10 937 $
GLM-5.2
open, levný
8 314 $
GPT-5.5
vlajkový
7 524 $
Claude Sonnet 5
vlajkový
6 378 $

Co z toho plyne: Tady GLM-5.2 překvapil: skončil DRUHÝ za starším Opusem 4.7 a porazil GPT-5.5 i Sonnet 5. Levný otevřený model, co drží krok s drahou špičkou.

Čísla z Andon Labs (Vending-Bench 2). průměr z 5 běhů; nezávislé měření

Jak GLM dozrával

Historie GLM: od čtyřky po 5.2

Zhipu tlačí nové verze extrémně rychle. Za posledních pár měsíců stihl GLM-5, 5.1 i 5.2.

GLM-5.2

13. 6. 2026Aktuální

Aktuální. Silnější agentní kódování (SWE-bench Pro 62,1 vs 58,4 u 5.1).

GLM-5.1

27. 3. 2026

Inkrementální upgrade, open-source o pár týdnů později.

GLM-5

11. 2. 2026

744 mld. parametrů, trénovaný na čínských čipech Huawei Ascend (bez Nvidie), licence Apache-2.0.

GLM-4.6

září 2025

Vylepšené kódování a delší kontext.

GLM-4.5

červenec 2025

Průlomová generace: silné agentní kódování za nízkou cenu.

GLM-4

červen 2024

Základ řady GLM-4.

Kadence je závratná: GLM-5 → 5.1 → 5.2 za pouhé čtyři měsíce. Čekejte, že benchmarky i ceny na téhle stránce budou rychle stárnout.

Poběží mi to?

V jakých variantách GLM stáhnete

GLM je open-weight, ale narozdíl od DeepSeeku nemá malou variantu „na notebook“. Plný GLM-5.2 (744 miliard parametrů) je práce pro server; doma rozjedete leda staršího sourozence GLM-4.5-Air. Klikněte, kolik máte paměti.

Kolik má váš počítač paměti pro AI?

Nejde o běžnou RAM, ale o paměť dostupnou pro grafiku. Na Macu s čipem M (M1 a novější) se počítá celá unified memory (sdílená pro procesor i grafiku), takže stačí koukat, kolik má Mac paměti. Na Windows/PC rozhoduje hlavně VRAM grafické karty, samotná operační paměť nestačí.

  • GLM-4.5-Air (předchozí generace)106 mld. (~12 mld. aktivních)· ke stažení ~65 GB

    Potřebuje aspoň 64 GB. Jediná reálně domácí varianta: Mac s 64 GB nebo PC s 24GB grafikou. Je to ale starší model GLM-4.5, ne 5.2.

  • GLM-5.2, 2bitová kvantizace744 mld. (~40 mld. aktivních)· ke stažení ~239 GB

    Jen na výkonném serveru, ne na domácím stroji. Nejúspornější plný GLM-5.2. Chce Mac Studio s 256 GB nebo server s 24GB grafikou a 256 GB RAM.

  • GLM-5.2, 4bitová kvantizace744 mld.· ke stažení ~400 GB

    Jen na výkonném serveru, ne na domácím stroji. Vyšší kvalita, potřebuje výkonný server.

  • GLM-5.2, 8 bitů (téměř bez ztráty)744 mld.· ke stažení ~810 GB

    Jen na výkonném serveru, ne na domácím stroji. Prakticky plná kvalita, jen pro serverovou multi-GPU sestavu.

Čísla říkají, jestli se model vejde do paměti (v běžné zmenšené kvantizaci, ta už je v počtu GB započítaná). Vejít se ale neznamená letět: těsně nad hranou model poběží pomaleji a unese jen malý kontext, protože i dlouhý kontext ujídá paměť. Počítejte s rezervou navíc.

Jak GLM reálně stáhnout a spustit? Postup krok za krokem, rozdíl mezi Ollamou a LM Studiem i to, co váš hardware utáhne, najdete v průvodci Lokální AI na vlastním počítači.

Poctivě: na co si dát pozor

Kam jdou vaše data

U čínského modelu je tohle otázka číslo jedna. Rozliší se podle toho, jak GLM používáte.

V cloudu jdou data do Číny

Když píšete do chatu nebo přes oficiální API, vaše dotazy jdou na servery v Číně a podléhají tamním zákonům (včetně zpravodajského zákona z roku 2017). US i EU proto u čínských modelů varují před citlivými daty.

Kdo za GLM stojí

Zhipu AI je pekingská firma, spin-off z Tsinghua University. V květnu 2026 kvůli čínským AI modelům v kritické infrastruktuře otevřela americká Sněmovna vyšetřování, Zhipu jmenovitě. U citlivých firemních dat to zvažte.

Férová pointa: lokálně data nikam nejdou

Všechno výše platí pro cloudovou verzi. Kdo má dost silný hardware (nebo si pronajme cloud GPU) a stáhne si MIT váhy, pustí GLM u sebe, a žádná data ven neodcházejí. Ke stejnému modelu se pak nedostane čínská ani žádná jiná strana. To je hlavní argument pro open-weight.

Levný model může stačit líp, než čekáte.

Který model zrovna nejlíp poslouží, se mění každý měsíc. Co zůstává, je dovednost: umět práci dobře zadat, vybrat na ni vhodný model a vědět, kdy sáhnout po levném, a kdy radši ne.

Přesně to učí kurz AI First na vibe codingu. 21 hodin praktických videí · 1 800+ absolventů.

FAQ

Časté otázky

Co je GLM?+

GLM je řada AI modelů od čínské firmy Zhipu AI (značka Z.ai). Aktuálně jde o verzi GLM-5.2. Je to open-weight model (váhy jsou volně ke stažení pod licencí MIT), který je oblíbený ve vibe codingu: umí špičkové agentní kódování za zlomek ceny západní špičky.

Je GLM zdarma?+

Chat na chat.z.ai je zdarma. Přes API platíte za tokeny, ale GLM je extrémně levný, zlomek ceny GPT-5.5. A protože je open-weight, můžete si váhy stáhnout a (na dostatečně silném hardwaru) provozovat model u sebe zdarma.

Kam jdou moje data u GLM?+

Záleží, jak ho používáte. Přes chat nebo oficiální API jdou vaše dotazy na servery v Číně a podléhají tamní jurisdikci (čínský zpravodajský zákon). Když si ale stáhnete open-weight váhy a pustíte GLM lokálně, běží celý u vás a žádná data ven neodcházejí.

Poběží mi GLM lokálně?+

Teoreticky ano (je open-weight), prakticky pro většinu lidí ne. Plný GLM-5.2 má 744 miliard parametrů a i v úsporné kvantizaci potřebuje kolem 250 GB paměti, tedy Mac Studio s 256 GB nebo server s výkonnou grafikou. Menší varianta „na notebook“ pro tuhle generaci zatím neexistuje. Reálná cesta je proto API nebo pronájem cloud GPU.

Je GLM dobrý na kódování?+

Ano, je to jeho hlavní silná stránka. Na benchmarku SWE-bench Pro předčí GPT-5.5 a v testu Vending-Bench (řízení byznysu celý rok) skončil dokonce druhý, před GPT-5.5 i Claude Sonnetem. Za svou cenu je to výjimečný poměr výkonu k ceně.

Jak GLM použít v Claude Code?+

GLM napojíte do Claude Code i dalších agentních nástrojů přes jeho API (nebo přes OpenRouter). Zhipu k tomu nabízí i vlastní předplatné GLM Coding Plan. Používáte tak známé prostředí a jen v něm přepnete na levnější čínský model.