Průvodce světem AI

Co je kontextové okno?

Krátkodobá paměť AI. Všechno, co model právě teď vidí. A taky důvod, proč kvalita odpovědí během dlouhé session klesá.

▶ Vyzkoušet simulátor Více o kurzu AI First

Autor: Jindřich Fáborský · 17 let v marketingu · 2 000+ hodin vibe codingu · 180+ projektů

Rychlá odpověď

Co je tedy kontextové okno?

Kontextové okno je krátkodobá paměť jazykového modelu. Vejde se do něj všechno, co model při práci vidí: vaše zadání, načtené soubory, připojené nástroje i celá dosavadní konverzace. Měří se v tokenech a je omezené. Co se nevejde, model nevidí.

Dnešní modely mají okno typicky 200 000 až 1 000 000 tokenů, tedy zhruba 300 až 1 500 normostran textu. Vypadá to jako spousta místa. Při vibe codingu ho ale zaplníte rychleji, než čekáte.

Vyzkoušejte si to

Odehrajte si jednu vibe coding session

Klikáním pracujte jako při vibe codingu: načtěte projekt, připojte nástroje, konverzujte. Sledujte, jak se okno plní a co to dělá s kvalitou. Pak zkuste totéž na menším modelu.

Kontextové okno session

25 tis. / 1 M (3 %)

systém + CLAUDE.md (25 tis.)

🟢 Svěží kontext

Sweet spot. Model má přehled o všem, co v okně je, kvalita odpovědí je nejvyšší.

Pracujte: čím plníte okno

Co dělat v Claude Code, když se okno plní

Hodnoty tokenů jsou ilustrační, řádově ale odpovídají reálné praxi. Všimněte si, že MCP servery zůstávají v okně i po nové session: načítají se při každém startu. V jiných nástrojích (Codex, Cursor) se úklid jmenuje a chová trochu jinak, princip je stejný.

Jak velká okna dnes jsou

Stav: červen 2026

Claude Opus 4.8 / Sonnet 4.6: 1 000 000 tokenů
GPT-5.5 (API): 1 000 000 tokenů
GPT-5.5 v Codexu: 400 000 tokenů
Claude Haiku 4.5: 200 000 tokenů

Zajímavost: stejný model může mít jinde jiné okno. GPT-5.5 má přes API milion tokenů, v agentu Codex ale 400 tisíc.

V čem je problém

Víc kontextu neznamená lepší odpověď

Plné okno není jen otázka místa. Čím víc toho v okně je, tím hůř model čte. Tohle není dojem, ale měřitelný jev doložený třemi nezávislými zdroji.

Chroma Research, 2025

Context Rot ↗

Test 18 špičkových modelů (GPT, Claude, Gemini…). Všechny odpovídaly hůř, čím delší vstup dostaly. I na triviálních úlohách.

Liu et al., 2023

Lost in the Middle ↗

Modely čtou spolehlivě začátek a konec kontextu. Informace uprostřed přehlížejí, propady přesnosti přesahují 30 %.

Anthropic, 2025

Attention budget ↗

Model má omezený „rozpočet pozornosti“. Každý token v okně z něj ukrajuje, takže s rostoucím kontextem se pozornost ředí.

Praxe zkušených uživatelů Claude Code tomu odpovídá:

0–50 % sweet spot

ještě OK

compactovat

Do 50 %: nejlepší výsledky. Tady drží okno ti nejzkušenější.

50 až 75 %: ještě v pořádku, ale plánujte úklid.

Zhruba od 75 %: kvalita znatelně klesá. Zkušení uklízejí už tady.

Při 95 %: Claude Code spouští auto-compact sám.

A ještě jedna věc: do okna stejně nenačtete všechno. Zdrojový kód větší aplikace má stovky tisíc až miliony tokenů. Proto agenti jako Claude Code kód cíleně prohledávají a čtou jen to, co pro úlohu potřebují.

Kam mizí tokeny

Co vám okno žere. A co ne.

Než začnete šetřit, musíte vědět, co okno vlastně plní. Tři věci z praxe, které rozhodují.

MCP servery žerou nejvíc

Definice nástrojů všech připojených MCP serverů se načítají hned při startu session, ještě než cokoli zadáte. Pět serverů klidně ukousne desítky tisíc tokenů. Připojujte proto jen ty, které pro úlohu opravdu potřebujete.

Co je MCP server? →

Skills jsou šetrné

Skill do okna načte jen pár řádků popisu. Celý postup se načítá až ve chvíli, kdy ho agent skutečně použije. Stejnou práci tak zabalíte za zlomek režie MCP serveru.

Co jsou Claude Code skills? →

Subagenti mají vlastní okno

Prohledávání kódu, čtení dokumentace nebo analýzu logů zvládne subagent ve svém vlastním kontextovém okně. Do hlavní session vrátí jen krátké shrnutí. Hlavní okno zůstává svěží.

Co jsou subagenti? →

> /context

Okno: 142 tis. / 1 M tokenů (14 %)

Systémový prompt: 3,2 tis.
Nástroje: 16,8 tis.
MCP servery: 52,3 tis.
CLAUDE.md + memory: 6,5 tis.
Konverzace: 63,5 tis.

Ilustrační příklad výstupu příkazu /context v Claude Code. Všimněte si, kolik ukously MCP servery ještě před začátkem práce.

Co s tím v praxi

Pracujte s oknem vědomě

Nejdůležitější je vůbec vědět, že okno existuje. Pak stačí jeden návyk: než se zaplní, uložte práci a začněte načisto.

Zapište postup

Co je hotové a co zbývá, do dokumentace projektu.

Uložte práci

Git commit. Rozdělaná práce nesmí žít jen v konverzaci.

Doplňte paměť

Trvalé poznatky do CLAUDE.md nebo memory.

Co je CLAUDE.md? →

Čistá session

Nová session si načte jen to podstatné a jede dál.

Rychlá varianta: /compact

Když potřebujete pokračovat hned, /compact konverzaci shrne a uvolní místo. Shrnutí ale není zápis: detaily se ztratí. Berte ho jako záchrannou brzdu, ne jako standardní postup.

Zlaté pravidlo

Čistý kontext = vyšší kvalita výstupů. Nová úloha si zaslouží novou session. A protože okno plníte tokeny, platí i obráceně: kdo šetří tokeny, šetří okno. Podrobně v průvodci Co jsou tokeny?

Tohle je rozdíl mezi frustrací a znalostí

Neznalost práce s kontextovým oknem je jedním z hlavních důvodů, proč se lidem ve vibe codingu nedaří nic pořádného vytvořit. Připojte se ke studentům kurzu AI First a naučte se využít vibe coding naplno.

22 hodin videí · 1 800+ absolventů · roční licence s aktualizacemi zdarma

Více o kurzu AI First Cena a koupě