Průvodce světem AI
Co jsou tokeny?
Měna, ve které AI počítá. Každé slovo, které modelu pošlete i které vám odpoví, se účtuje v tokenech. Na téhle stránce si je osaháte naživo.
Autor: Jindřich Fáborský · 17 let v marketingu · 2 000+ hodin vibe codingu · 180+ projektů

Rychlá odpověď
Co je tedy token?
Token je kousek textu, obvykle část slova, ve kterém jazykové modely čtou i píší. Anglické slovo vyjde průměrně na 1 až 2 tokeny, české na 2 až 3. V tokenech se počítá všechno: cena za použití modelu, velikost jeho paměti i limity vašeho předplatného. Kdo rozumí tokenům, rozumí účtence za AI.
AI tedy nečte po slovech jako my. Větu si nejdřív rozseká na tokeny a pak jen předpovídá, jaký token bude následovat. Přesně tohle uvidíte v ukázce níž.
Vyzkoušejte si to
Takhle vidí váš text umělá inteligence
Vyberte větu, nebo vložte vlastní text. Každý barevný kousek je jeden token. Všimněte si, jak se česká slova rozpadají na víc kousků než anglická.
Kolik by stálo poslat českou větu 10 000× (vstupní tokeny)
Claude Opus 4.8 (nejchytřejší)
1,00 $
Claude Sonnet 4.6 (zlatý střed)
0,60 $
Claude Haiku 4.5 (nejlevnější)
0,20 $
Ceny vstupních tokenů, červen 2026. Výstupní tokeny (to, co model napíše) jsou 5× dražší.
Rozpad vět pochází z veřejného tokenizéru o200k (OpenAI). Claude i Gemini mají vlastní tokenizéry, takže přesná čísla se mírně liší, princip a poměr čeština vs. angličtina ale platí všude.
Co to znamená pro peníze
Milion tokenů zní hrozivě. Stojí pár dolarů.
Čísla z naší praxe, ne z ceníku. V projektech Marketing Festival, Digisemestr, Hack Your Way a AI First provozujeme databázi přes 700 videí přednášek, webinářů a online kurzů. Kolik stojí je všechny pomocí AI popsat, kategorizovat, udělat výpisky a vyhodnotit zpětnou vazbu?
Reálná účtenka z našeho projektu
AI zpracování 767 videí z našich projektů
- Vstup: přepisy videí (průměrně 21 000 znaků)
- 767 videí
- K tomu analýza sentimentu zpětné vazby
- 631 videí
- Volání modelu celkem
- 1 398×
- Vstupní tokeny (přečtené)
- 5 384 672
- Výstupní tokeny (napsané)
- 1 515 781
- Celkem zaplaceno
- 34,48 $ ≈ 800 Kč
Popis, kategorizace, výpisky i analýza zpětné vazby jednoho videa vyjdou zhruba na 1 Kč. Člověka by stejná práce stála hodiny.
Kolik stojí 1 milion tokenů přes API
Stav: červen 2026| Model | Vstup / 1M | Výstup / 1M |
|---|---|---|
| Claude Opus 4.8 (nejchytřejší) | 5 $ | 25 $ |
| Claude Sonnet 4.6 (zlatý střed) | 3 $ | 15 $ |
| Claude Haiku 4.5 (nejlevnější) | 1 $ | 5 $ |
| GPT-5.5 (vlajková loď OpenAI) | 5 $ | 30 $ |
| GPT-5.4 (starší generace) | 2,50 $ | 15 $ |
| GPT-5.4 mini (levná řada) | 0,75 $ | 4,50 $ |
Výstupní tokeny jsou 5× až 6× dražší než vstupní: psaní dá modelu víc práce než čtení. Google Gemini se pohybuje řádově podobně. U předplatných (Claude, ChatGPT) tokeny přímo neplatíte, jen určují vaše limity. Aktuální ceny všech modelů najdete v oficiálních cenících Anthropicu a OpenAI.
Háček
Milion tokenů je hodně. Ale ne tak docela.
Běžný uživatel ChatGPT tokeny řešit nemusí, má je schované v paušálu. Jsou ale dvě situace, kdy se z drobných stanou velké peníze, nebo velký rozdíl v kvalitě.
Ve velkém se to sčítá
Aplikace pro tisíce uživatelů protočí miliony tokenů denně. Třeba 20 milionů:
Rozdíl: přes 600 000 Kč ročně
A nejde jen o peníze: menší model odpovídá i rychleji.
Kontextové okno není nafukovací
Druhý důvod nejsou peníze, ale paměť. AI agent má při vibe codingu krátkodobou paměť typicky 200 000 až 1 000 000 tokenů. A plní se rychle:
← kontextové okno jedné session
Čím plnější okno, tím nižší kvalita odpovědí
Proto existují příkazy jako /compact, které konverzaci zhustí. Celé téma rozebíráme v průvodci Co je kontextové okno?
Praktické tipy
Jak za tokeny platit méně
Tokeny jsou levné, ale při každodenní práci s AI se sčítají. Tohle jsou čtyři návyky, které reálně používáme.
Model podle úlohy
Nejchytřejší model nechte na plánování a složité úlohy, rutinu zvládne levnější. Haiku má 5× levnější tokeny než Opus. Tvůrci, jejichž workflow sledujeme, běžně míchají modely: kvalitní plán z drahého modelu a levné provedení dají skoro stejný výsledek za zlomek ceny.
Hlídejte kontext
S každou zprávou se modelu posílá celá dosavadní konverzace znovu. Čím delší chat, tím dražší každý další dotaz. Nové téma proto začínejte v nové konverzaci, v Claude Code na to stačí příkaz /clear.
Dávky za polovinu
Když výsledek nepotřebujete hned, použijte přes API dávkové zpracování (Batch). Stejné tokeny, poloviční cena. Ideální na hromadné úlohy typu „přelož 500 produktových popisků“.
Cache na opakování
Když se začátek promptu opakuje (stejné instrukce, stejný dokument), modely ho umí číst z cache zhruba za desetinu ceny. Nástroje jako Claude Code to dělají automaticky, u vlastních aplikací si to zapnete v API.
Nejvíc tokenů ale spálí špatně zadaná práce, kterou musíte zadávat znovu. Umět AI správně řídit je největší úspora ze všech. Přesně tohle učíme ve vibe codingu i v celém kurzu.
Tokenům už rozumíte. Teď se naučte AI řídit.
V kurzu AI First se naučíte zadávat AI práci tak, aby výsledek vyšel napoprvé. Vibe coding i marketingové automatizace, všechno na reálných projektech.
20 hodin videí · 1 800+ absolventů · roční licence s aktualizacemi zdarma
FAQ
Časté otázky
Co je to token?+
Token je základní jednotka, ve které jazykové modely (Claude, ChatGPT, Gemini) zpracovávají text. Obvykle jde o část slova: anglické slovo vyjde průměrně na 1 až 2 tokeny, české na 2 až 3. Model v tokenech čte váš dotaz, v tokenech píše odpověď a v tokenech se počítají ceny i limity.
Kolik tokenů má normostrana textu?+
Normostrana (1 800 znaků) vyjde anglicky zhruba na 360 až 380 tokenů, česky na 550 až 600. Pro hrubou orientaci: 1 000 českých slov je přibližně 2 000 až 3 000 tokenů.
Proč čeština spotřebuje víc tokenů než angličtina?+
Tokenizéry se učí hlavně na anglických textech, takže běžná anglická slova mají vlastní token. Česká slova s diakritikou a koncovkami se rozpadají na víc menších kousků. Stejná myšlenka česky proto stojí typicky o 50 až 80 % víc tokenů než anglicky. U promptů to většinou neřešte, u hromadného zpracování velkých objemů textu se ale překlad do angličtiny může vyplatit.
Co znamená token limit v Claude Code nebo ChatGPT?+
Předplatné AI nástrojů (Claude, ChatGPT) funguje jako paušál: platíte fixní částku a nástroj vám počítá spotřebu tokenů v časových oknech. Když limit vyčerpáte, počkáte, než se obnoví, nebo přejdete na vyšší tarif. V Claude Code zjistíte aktuální naplnění kontextu příkazem /context a stav limitů příkazem /usage.
Platím za tokeny, i když mám předplatné?+
Přímo ne. U předplatného je spotřeba tokenů schovaná v paušálu a projevuje se jen limity. Za tokeny platíte napřímo ve chvíli, kdy používáte API, třeba když si postavíte vlastní aplikaci nebo automatizaci, která model volá. Tam přijde každý milion tokenů na jednotky dolarů.
Je token to samé ve všech modelech?+
Ne. Každý model má vlastní tokenizér, takže stejný text vyjde u Claude, GPT a Gemini na trochu jiný počet tokenů. Princip je ale stejný a řádově se počty shodují. Proto všechny srovnávací tabulky cen uvádějí cenu za 1 milion tokenů konkrétního modelu.
Jak souvisí tokeny s kontextovým oknem?+
Kontextové okno je maximum tokenů, které model najednou udrží v paměti: váš dotaz, celou historii konverzace i svou odpověď. Dnešní modely zvládnou stovky tisíc až milion tokenů. Když se okno zaplní, model starší část konverzace zapomene nebo shrne. I proto se delší konverzace prodražují: s každou zprávou se posílá celá historie znovu. Celé téma rozebírá náš průvodce kontextovým oknem.