Průvodce světem AI
Co je kontextové okno?
Krátkodobá paměť AI. Všechno, co model právě teď vidí. A taky důvod, proč kvalita odpovědí během dlouhé session klesá.
Autor: Jindřich Fáborský · 17 let v marketingu · 2 000+ hodin vibe codingu · 180+ projektů

Rychlá odpověď
Co je tedy kontextové okno?
Kontextové okno je krátkodobá paměť jazykového modelu. Vejde se do něj všechno, co model při práci vidí: vaše zadání, načtené soubory, připojené nástroje i celá dosavadní konverzace. Měří se v tokenech a je omezené. Co se nevejde, model nevidí.
Dnešní modely mají okno typicky 200 000 až 1 000 000 tokenů, tedy zhruba 300 až 1 500 normostran textu. Vypadá to jako spousta místa. Při vibe codingu ho ale zaplníte rychleji, než čekáte.
Vyzkoušejte si to
Odehrajte si jednu vibe coding session
Klikáním pracujte jako při vibe codingu: načtěte projekt, připojte nástroje, konverzujte. Sledujte, jak se okno plní a co to dělá s kvalitou. Pak zkuste totéž na menším modelu.
Kontextové okno session
25 tis. / 1 M (3 %)
🟢 Svěží kontext
Sweet spot. Model má přehled o všem, co v okně je, kvalita odpovědí je nejvyšší.
Pracujte: čím plníte okno
Co dělat v Claude Code, když se okno plní
Hodnoty tokenů jsou ilustrační, řádově ale odpovídají reálné praxi. Všimněte si, že MCP servery zůstávají v okně i po nové session: načítají se při každém startu. V jiných nástrojích (Codex, Cursor) se úklid jmenuje a chová trochu jinak, princip je stejný.
Jak velká okna dnes jsou
Stav: červen 2026- Claude Opus 4.8 / Sonnet 4.6
- 1 000 000 tokenů
- GPT-5.5 (API)
- 1 000 000 tokenů
- GPT-5.5 v Codexu
- 400 000 tokenů
- Claude Haiku 4.5
- 200 000 tokenů
Zajímavost: stejný model může mít jinde jiné okno. GPT-5.5 má přes API milion tokenů, v agentu Codex ale 400 tisíc.
V čem je problém
Víc kontextu neznamená lepší odpověď
Plné okno není jen otázka místa. Čím víc toho v okně je, tím hůř model čte. Tohle není dojem, ale měřitelný jev doložený třemi nezávislými zdroji.
Chroma Research, 2025
Context Rot ↗
Test 18 špičkových modelů (GPT, Claude, Gemini…). Všechny odpovídaly hůř, čím delší vstup dostaly. I na triviálních úlohách.
Liu et al., 2023
Lost in the Middle ↗
Modely čtou spolehlivě začátek a konec kontextu. Informace uprostřed přehlížejí, propady přesnosti přesahují 30 %.
Anthropic, 2025
Attention budget ↗
Model má omezený „rozpočet pozornosti“. Každý token v okně z něj ukrajuje, takže s rostoucím kontextem se pozornost ředí.
Praxe zkušených uživatelů Claude Code tomu odpovídá:
Do 50 %: nejlepší výsledky. Tady drží okno ti nejzkušenější.
50 až 75 %: ještě v pořádku, ale plánujte úklid.
Zhruba od 75 %: kvalita znatelně klesá. Zkušení uklízejí už tady.
Při 95 %: Claude Code spouští auto-compact sám.
A ještě jedna věc: do okna stejně nenačtete všechno. Zdrojový kód větší aplikace má stovky tisíc až miliony tokenů. Proto agenti jako Claude Code kód cíleně prohledávají a čtou jen to, co pro úlohu potřebují.
Kam mizí tokeny
Co vám okno žere. A co ne.
Než začnete šetřit, musíte vědět, co okno vlastně plní. Tři věci z praxe, které rozhodují.
MCP servery žerou nejvíc
Definice nástrojů všech připojených MCP serverů se načítají hned při startu session, ještě než cokoli zadáte. Pět serverů klidně ukousne desítky tisíc tokenů. Připojujte proto jen ty, které pro úlohu opravdu potřebujete.
Skills jsou šetrné
Skill do okna načte jen pár řádků popisu. Celý postup se načítá až ve chvíli, kdy ho agent skutečně použije. Stejnou práci tak zabalíte za zlomek režie MCP serveru.
Subagenti mají vlastní okno
Prohledávání kódu, čtení dokumentace nebo analýzu logů zvládne subagent ve svém vlastním kontextovém okně. Do hlavní session vrátí jen krátké shrnutí. Hlavní okno zůstává svěží.
> /context
Okno: 142 tis. / 1 M tokenů (14 %)
- Systémový prompt
- 3,2 tis.
- Nástroje
- 16,8 tis.
- MCP servery
- 52,3 tis.
- CLAUDE.md + memory
- 6,5 tis.
- Konverzace
- 63,5 tis.
Ilustrační příklad výstupu příkazu /context v Claude Code. Všimněte si, kolik ukously MCP servery ještě před začátkem práce.
Co s tím v praxi
Pracujte s oknem vědomě
Nejdůležitější je vůbec vědět, že okno existuje. Pak stačí jeden návyk: než se zaplní, uložte práci a začněte načisto.
Zapište postup
Co je hotové a co zbývá, do dokumentace projektu.
Uložte práci
Git commit. Rozdělaná práce nesmí žít jen v konverzaci.
Čistá session
Nová session si načte jen to podstatné a jede dál.
Rychlá varianta: /compact
Když potřebujete pokračovat hned, /compact konverzaci shrne a uvolní místo. Shrnutí ale není zápis: detaily se ztratí. Berte ho jako záchrannou brzdu, ne jako standardní postup.
Zlaté pravidlo
Čistý kontext = vyšší kvalita výstupů. Nová úloha si zaslouží novou session. A protože okno plníte tokeny, platí i obráceně: kdo šetří tokeny, šetří okno. Podrobně v průvodci Co jsou tokeny?
Tohle je rozdíl mezi frustrací a znalostí
Neznalost práce s kontextovým oknem je jedním z hlavních důvodů, proč se lidem ve vibe codingu nedaří nic pořádného vytvořit. Připojte se ke studentům kurzu AI First a naučte se využít vibe coding naplno.
20 hodin videí · 1 800+ absolventů · roční licence s aktualizacemi zdarma
FAQ
Časté otázky
Co je kontextové okno?+
Kontextové okno je krátkodobá paměť jazykového modelu. Vejde se do něj všechno, co model při práci vidí: vaše instrukce, načtené soubory, připojené nástroje i celá dosavadní konverzace. Měří se v tokenech a je omezené. Co se do okna nevejde, model prostě nevidí.
Jak velké je kontextové okno u Claude a ChatGPT?+
Stav k červnu 2026: Claude Opus 4.8 a Sonnet 4.6 mají okno 1 milion tokenů, Haiku 4.5 má 200 tisíc. GPT-5.5 má 1 milion tokenů přes API, ale v Codexu 400 tisíc. Pro představu: 1 milion tokenů je zhruba 1 500 normostran českého textu.
Co se stane, když se kontextové okno zaplní?+
Nástroje jako Claude Code konverzaci automaticky zhustí (auto-compact, ve výchozím nastavení kolem 95 % zaplnění): starší část nahradí shrnutím a detaily se ztratí. Běžné chaty starší zprávy postupně zapomenou. Kvalita ale klesá už dřív, proto se vyplatí okno hlídat a uklízet průběžně.
Co je /compact?+
Příkaz v Claude Code, který celou dosavadní konverzaci shrne a uvolní místo v okně. Hodí se, když potřebujete pokračovat v rozdělané práci. Počítejte ale s tím, že shrnutí je hrubé: drobnosti z něj vypadnou. Na novou úlohu je skoro vždy lepší čistá session.
Proč si AI nepamatuje, co jsme řešili včera?+
Kontextové okno platí jen pro jednu session. Když ji zavřete, paměť se vynuluje. Dlouhodobou paměť řeší jiné mechanismy: v Claude Code soubor CLAUDE.md s trvalými instrukcemi a memory, kam si agent zapisuje poznatky mezi sessions.
Je větší kontextové okno vždycky lepší?+
Ne. Studie Context Rot testovala 18 špičkových modelů a všechny odpovídaly hůř, čím delší vstup dostaly, i na jednoduchých úlohách. Větší okno znamená, že se do něj víc vejde, ne že to model líp přečte. Čistý, dobře poskládaný kontext porazí velký a zaplněný.
Jak zjistím, kolik kontextu mi zbývá?+
V Claude Code napište /context: ukáže zaplnění okna a rozpad po položkách (systémový prompt, nástroje, MCP servery, konverzace). Limity předplatného zobrazí příkaz /usage. Dobrý návyk je mrknout na /context vždy, když session začne odpovídat hůř.