Průvodce světem AI

Co jsou reasoning modely?

AI, která si před odpovědí píše vlastní poznámky. Někdy zázrak, někdy drahé čekání. Rozdíl je v tom, jestli to umíte řídit.

▶ Vyzkoušet rozdíl Více o kurzu AI First

Autor: Jindřich Fáborský · 17 let v marketingu · 2 000+ hodin vibe codingu · 180+ projektů

Rychlá odpověď

Co je tedy reasoning model?

Model AI, který si před odpovědí nejdřív napíše vlastní úvahy a teprve pak odpoví. Jako počtář, který těžký příklad nepočítá zpaměti, ale vezme si papír a tužku.

Těm poznámkám se říká thinking tokeny. Většinou je nevidíte, ale dějí se a platí se. A přesně proto je dobré vědět, kdy se přemýšlení vyplatí a kdy je to jen drahé čekání.

Kde na to narazíte (každý tomu říká jinak):

Claude · extended thinkingChatGPT · reasoningGemini · thinkingDeepSeek · R1

Pro vibe coding je to jedna z nejužitečnějších pák: hloubka přemýšlení přímo rozhoduje o kvalitě, rychlosti i ceně práce.

Vyzkoušejte si to

Stejná úloha, tři hloubky přemýšlení

Přepínejte úlohy a úrovně effortu a sledujte výsledek, čas a spotřebu. Dva aha-momenty: na rutinu je max effort vyhozené peníze, na zapeklitý bug je low effort past.

Claude Code · /effort low

> Najdi, proč sleva 20 % občas zákazníkovi cenu naopak zvýší

Čas

—

Thinking tokeny

—

Vyberte úlohu a úroveň effortu, průběh se rovnou přehraje. Šedé kurzivní řádky jsou přemýšlení modelu, které normálně nevidíte, ale platíte ho.

Průběhy jsou ilustrační, hodnoty řádově odpovídají praxi. Pointa je skutečná: stejný model, stejná úloha, jiná hloubka přemýšlení = jiný výsledek, čas i cena.

Jak to řídíte

Příkaz /effort: posuvník od Faster po Smarter

V Claude Code hloubku přemýšlení řídíte jedním příkazem: /effort otevře posuvník s pěti úrovněmi a polohou ultracode navrch. Přesné chování popisuje oficiální dokumentace, tady je to podstatné.

Úroveň	Co dělá	Kdy ji použít
/effort low	Minimum přemýšlení, nejrychlejší a nejlevnější.	Rutina: přepisy, drobné úpravy, jednoduché dotazy.
/effort medium	Střídmé přemýšlení, úspora tokenů.	Běžná práce, když šetříte limity předplatného.
/effort high	Výchozí úroveň. Plná kvalita s rozumnou spotřebou.	Většina práce. Když nevíte, nechte high.
/effort xhigh	Hlubší uvažování za víc tokenů (výchozí na Opus 4.7).	Zaseknutý bug, architektura, dlouhé samostatné běhy.
/effort max	Bez limitů spotřeby. Platí jen pro aktuální session.	Nejtěžší problémy. Pozor, má sklon k overthinkingu, používejte cíleně.
/effort ultracode	Specialita Claude Code, ne úroveň modelu: pošle xhigh a navíc nechá Clauda orchestrovat dynamické workflow (více agentů). Jen pro session.	Velké zátahy: migrace, audit celého repa, hon na bugy.

Dostupné úrovně závisí na modelu: xhigh mají jen nejnovější (Fable 5, Opus 4.7 a 4.8), starší spadnou na nejbližší podporovanou. Stejné jméno úrovně navíc neznamená u různých modelů stejnou hloubku. Aktuální úroveň vidíte u spinneru („with low effort“) a posuvník je i v /model.

ultrathink na jeden krok

Napište slovo ultrathink kamkoli do zadání a model pro ten jeden úkol přemýšlí hlouběji, bez přepínání nastavení. Ideální na jednorázový těžký oříšek.

Přemýšlení si můžete přečíst

Myšlenky modelu jsou v Claude Code standardně sbalené. Zkratka Ctrl+O je rozbalí jako šedý kurzivní text. Občas se vyplatí nahlédnout, kudy se model ubírá.

Nejnovější modely to řídí samy

Fable 5 a Opus 4.8 mají adaptivní přemýšlení: samy poznají, kolik úvah úloha potřebuje. Effort jim jen říká, jak velkorysé smí být. Vypnout přemýšlení u nich nejde.

Kdy to zapnout

Hluboké přemýšlení se vyplatí jen na zlomek práce

Tohle je nejcennější dovednost kolem reasoning modelů: poznat, kdy hluboké přemýšlení pomáhá a kdy jen prodlužuje čekání a prodražuje práci.

✓ Zapnout výš

Architektura a plánování. Návrh appky, datového modelu, struktura projektu. Tady je hodina přemýšlení nejlevnější část celého projektu.
Zaseknutý bug. Když model dvakrát opravil a neopravil, zvyšte effort nebo přidejte ultrathink. Hlubší průchod často najde skutečnou příčinu.
Analýza hustého podkladu. Smlouva, dlouhá data, vícekrokové rozhodnutí s podmínkami.

✗ Nechat nízko

Rutina a drobné úpravy. Texty, přejmenování, jednoduché opravy. Přemýšlení tu nic nepřidá, jen čekáte a platíte.
Vyhledání informace. Rychlá otázka chce rychlou odpověď, ne minutu úvah.
Hromadné běhy. Batch úlohy nad stovkami položek dělejte úsporně; rozdíl v kvalitě je malý a spotřeba násobná.

Že to není teorie, ukazují čísla: první reasoning model o1 vyřešil 83 % úloh prestižní matematické soutěže AIME, běžný GPT-4o jen 13 %. Na těžké úlohy je to jiná liga. Jenže na běžné úlohy je rozdíl minimální a platí se stejně.

Moje praxe po 2 000+ hodinách: výchozí effort nechávám na 90 % práce. Nahoru jdu při návrhu architektury (u appky Mokabu se hodina plánování vrátila mnohonásobně) a u zaseknutých bugů. Dolů u hromadných běhů, třeba když mi AI generovala 75 grafik pro hru DogTravel: tam by přemýšlení nad každou jen pálilo peníze.

Kategorie je mimochodem velmi mladá: o1 přišel v září 2024, open-source DeepSeek R1 a první hybridní Claude 3.7 Sonnet začátkem roku 2025. A v roce 2026 už je standardem adaptivní přemýšlení, které si model dávkuje sám.

Kolik to stojí

Platíte i myšlenky, které nevidíte

U Claude, ChatGPT i Gemini se thinking tokeny účtují jako výstupní tokeny v plné výši. Píše to přímo dokumentace Anthropicu: platí se celé přemýšlení, i když z něj vidíte jen shrnutí.

Reálný poměr z dokumentace

Odpověď, kterou vidíte~200 tokenů

Co se účtuje (s přemýšlením)~8 000 tokenů

Krátká odpověď s hlubokým přemýšlením může stát jako odpověď o tisících tokenů. U předplatného to znamená rychlejší ujídání limitů, u API vyšší účet. Co přesně je token a jak se počítá, máme v průvodci Co jsou tokeny?

Cit pro AI nezískáte čtením, ale praxí.

V kurzu AI First budete s AI denně tvořit: weby, appky, analytiku i reklamy. A právě u toho přijde sám i cit pro to, kdy nechat model přemýšlet a kdy šlápnout na plyn.

22 hodin videí · 1 800+ absolventů · roční licence s aktualizacemi zdarma

Více o kurzu AI First Cena a koupě

FAQ

Časté otázky

Co je reasoning model?+

Model AI, který si před odpovědí generuje interní úvahy, takzvané thinking tokeny. Díky tomu zvládá vícekrokové problémy: záludné bugy, plánování, analýzu hustých dokumentů. U jednoduchých úloh ale přemýšlení jen přidává čas a cenu, proto se dnes jeho míra dá řídit.

Co jsou thinking tokeny a platí se za ně?+

Interní poznámky, které si model píše během přemýšlení. A ano, platí se: u Claude, ChatGPT i Gemini se účtují jako výstupní tokeny v plné výši, i když z nich vidíte jen shrnutí, nebo vůbec nic. Odpověď o pár stech tokenech tak může stát jako odpověď o tisících.

Co dělá příkaz /effort v Claude Code?+

Nastavuje, kolik úsilí model věnuje práci: úrovně low, medium, high (výchozí), xhigh a max. Samotné /effort otevře posuvník, /effort max nastaví úroveň napřímo. Nastavení přežívá mezi sessions, jen max platí pro aktuální session. V menu je navíc poloha ultracode: pošle xhigh a k tomu nechá Clauda orchestrovat dynamické workflow.

Co znamená ultrathink?+

Klíčové slovo Claude Code: napíšete ho kamkoli do zadání a model pro ten jeden krok přemýšlí hlouběji, bez změny nastavení. Hodí se na jednorázový těžký problém. Jiné fráze jako „think hard“ speciální efekt nemají, projdou jako běžný text.

Jak přemýšlení úplně vypnu?+

U nejnovějších modelů (Fable 5, Opus 4.8) ho nevypnete, přemýšlení je adaptivní: model sám pozná, kdy ho potřebuje. Snížíte ho přes /effort low, u jednoduchých úloh ho pak model sám přeskakuje. Starší modely měly ruční zapínání s pevným rozpočtem tokenů, to už se opouští.

Je reasoning model lepší než běžný model?+

Na těžké úlohy výrazně: první reasoning model o1 vyřešil 83 % úloh prestižní matematické soutěže AIME, běžný GPT-4o jen 13 %. Na běžné úlohy je rozdíl malý, jen platíte víc a čekáte déle. Proto moderní modely míru přemýšlení přizpůsobují obtížnosti úlohy.

Jaký je rozdíl mezi /effort a /fast?+

/effort řídí, jak hluboko model přemýšlí: výš znamená chytřeji, ale pomaleji a dráž. /fast zrychluje samotné generování odpovědi: stejná kvalita, vyšší cena za token. Dají se kombinovat, na přímočaré úlohy třeba low effort + fast mode.