Průvodce lokální AI
Lokální AI: modely na vlastním počítači
Spusťte AI model přímo u sebe: soukromě, zdarma a offline. Poradíme, kde už dnes válí, co rozjede váš hardware a jak začít.
Autor: Jindřich Fáborský · 17 let v marketingu · 2 000+ hodin vibe codingu · 180+ projektů

Lokální AI
Modely běží na mých strojích, ne v cloudu.
Rychlá odpověď
Co je tedy lokální AI?
Lokální AI znamená, že model běží přímo na vašem počítači, ne na cloudových serverech. Data nikam neodchází a neplatíte za tokeny.
Není to 100% náhrada za ChatGPT nebo Claude Code: nejlepší cloudové modely jsou pořád napřed. Na spoustu věcí ale lokál stačí, je zdarma a hlavně soukromý.
Co dnes jde postavit
Kde lokální AI válí už teď
Nejsilnější je lokál na ohraničených úlohách, kde nepotřebujete ten nejvýkonnější mozek. Tohle všechno dělám v praxi na svých počítačích lokálně.
Přepis nahrávek
Whisper přepíše porady, podcasty i videa přímo u vás, zdarma a i v češtině. Tak třeba na Digisemestru mohou díky lokálnímu modelu studenti procházet výpisky ke stovkám přednášek a i v nich pohodlně vyhledávat.
Jak vznikl informační systém Digisemestru →Generování obrázků
FLUX Klein vytvoří obrázek přímo na Apple Silicon za pár vteřin, bez cloudu a poplatků. Používám ho na produktové a webové vizuály, lokálně místo cloudového modelu jako Google Nano Banana.
Návod: lokální obrázky krok za krokem →Citlivá data
Smlouvy, zákaznická a finanční data zpracujete menším modelem u sebe a do cloudu nejde nic. Na náročnou analýzu velkým modelem ale potřebujete výkonný stroj.
Doklady a faktury
Vyfocené účtenky a PDF faktury projede lokální model: vytáhne částky a DPH, najde duplicity, založí řádky do tabulky. Citlivé finance zůstanou doma. PDF faktury přečte líp než vyfocené účtenky.
Jak to mám zapojené
Lokál jako stavební blok
Lokální generování obrázků, přepis i lokální model nemám jako pět samostatných aplikací. Mám je zabalené jako Claude Code skills, které si větší workflow volá subagenticky. Jednou nastavím, pak to jen spouštím jedním příkazem. Lokál se tak stane součástí běžné práce, ne vědeckým projektem na víkend.
Rozhodování
Kdy lokálně a kdy radši cloud
Poctivě: lokál není lepší na všechno. Klikněte na typ úlohy a uvidíte, kam dnes patří a na co si dát pozor.
Když data nesmí opustit firmu, lokální model je řešení: běží u vás a do cloudu neodejde nic. Přesně takhle zpracovávám zákaznické a finanční podklady já, citlivé věci přes cloud vůbec neposílám.
Na co pozor: Velký model na náročnější analýzu chce výkonný stroj. Na běžném notebooku zvládnete menší model a jednodušší úlohy: shrnutí, klasifikaci, vytažení údajů.
Jednoduché pravidlo: ohraničené úlohy a soukromí patří lokálu, frontier kvalita a velký kontext zatím cloudu. Hranice se ale rok co rok posouvá ve prospěch lokálu.
Váš hardware
Co poběží na vašem počítači
O tom, jak velký model rozjedete, rozhoduje paměť. Klikněte na svoji RAM a uvidíte, co se vejde, jak rychle a kterými modely začít.
Klikněte, kolik máte paměti pro model:
Rozhoduje paměť pro grafiku, ne jen běžná RAM. Na Macu s M-čipem se počítá celá unified memory (sdílená pro procesor i grafiku), na PC hlavně VRAM grafické karty. Lidé jedou na Macu i na kartách s velkou VRAM, někdy dohromady.
Co se vejde
7–8 miliard parametrů
Přibližná rychlost
≈ 25–45 tokenů/s
Modely, kterými začít
Ideální na začátek: slušná čeština i lehké kódování. Tady bych na běžném notebooku začínal.
Hodnoty jsou orientační a modely stárnou rychle, nové vychází každých pár týdnů. Aktuální nabídku najdete na ollama.com/library. Detailní žebříček modelů podle úloh a češtiny chystám jako samostatného průvodce.
Jak začít
Tři cesty, jak rozjet první model
Od nejjednodušší klikací aplikace po napojení lokálního modelu do agenta. Vyberte podle toho, jak technicky se cítíte.
LM Studio
Snadnost
Klikací appka pro Mac, Windows i Linux. Stáhnete, vyhledáte model přímo v okně, kliknete a chatujete. Žádný terminál, žádné příkazy. Na Macu navíc rozjede rychlejší MLX verze modelů.
Pro koho
Když chcete lokální AI vyzkoušet bez technického nastavování. Ideální první krok pro netechnické lidi.
Na co pozor: Je to hotová appka, terminál vůbec nepotřebujete. Na začátek přesně dost.
Návod: LM Studio krok za krokem →Doporučená cesta: začněte LM Studiem, k Ollamě přejděte, až budete chtít lokální model napojit do vlastních nástrojů.
Chcete s AI tvořit, ne jen číst návody?
Lokální AI je jeden dílek skládačky. V kurzu AI First vás naučím postavit si vlastní nástroje, weby i automatizace pomocí AI, prakticky a od základu.
21 hodin videí, 1 800+ absolventů, roční licence s aktualizacemi zdarma.
FAQ
Časté otázky
Co je lokální AI a čím se liší od ChatGPT?+
Lokální AI znamená, že jazykový model běží přímo na vašem počítači, ne na cloudových serverech. ChatGPT nebo Claude posíláte dotaz na internet a odpověď se počítá u poskytovatele. Lokální model počítá u vás: data nikam neodchází, neplatíte za tokeny a funguje i offline.
Je lokální AI zdarma?+
Samotné spuštění modelu je zdarma. Modely jako Qwen, Gemma nebo Phi se stahují bez poplatku a inference (počítání odpovědí) nic nestojí. Zaplatíte jen za hardware a elektřinu. Oproti cloudu, kde platíte za každý token, se to u větších objemů rychle vrátí.
Jaký počítač potřebuju? Jaký model si stáhnout?+
Rozhoduje paměť pro grafiku: na Macu s M-čipem unified memory (sdílená), na PC hlavně VRAM grafické karty. Na 8 GB rozjedete malé modely (3–4 miliardy parametrů) na chat a shrnutí. Na 16 GB je to ideální na začátek (7–8 miliard, slušná čeština). Na 32 GB a víc běží znatelně chytřejší modely. Konkrétní doporučení najdete v konfigurátoru výš na téhle stránce.
Zvládne lokální model dlouhý dokument nebo velký kontext?+
Jen omezeně, a bývá to časté hrdlo. Lokální modely sice často deklarují kontextové okno 128 tisíc tokenů, ale na běžném počítači z něj reálně využijete spíš 32 až 64 tisíc: čím delší kontext, tím víc paměti navíc spotřebuje. Frontier modely v cloudu běžně zvládnou 1 milion tokenů i víc. Proto patří dlouhé dokumenty a velké projekty zatím do cloudu.
Je lokální AI bezpečnější? Kam jdou moje data?+
U lokálního modelu data neopustí váš počítač, což je hlavní důvod, proč ho lidé nasazují na citlivé věci (smlouvy, zákaznická data, finance). U cloudových služeb data odchází k poskytovateli, proto si ověřte jeho podmínky a firemní režimy. Sám citlivé podklady přes cloud vůbec neposílám.
Zvládne lokální model česky?+
Lepší modely ano. Nejširší pokrytí češtiny mají dnes Qwen a Gemma. Menší a starší modely jsou na češtině slabší, takže pokud vám na ní záleží, vybírejte právě z těchto rodin a otestujte na vlastním textu.
Musím umět programovat, abych to rozjel?+
Ne. Nejjednodušší cesta je LM Studio: klikací aplikace, ve které model vyhledáte a spustíte myší, bez terminálu. K Ollamě (ovládá se příkazy) přejdete, až budete chtít model napojit do vlastních nástrojů.
Nahradí lokální AI ChatGPT nebo Claude?+
Zatím ne na všechno. Na náročné programování a velké kontexty jsou frontier modely v cloudu stále napřed a lokál na běžném hardwaru u nich drhne. Kde lokál válí už dnes: přepis, generování obrázků, práce s citlivými daty a hromadné dávky. Berte to jako doplněk, ne náhradu.
Jak přepsat audio nebo video zdarma a i česky?+
Lokálním modelem Whisper. Běží přímo u vás, zvládá češtinu a je zdarma. Takhle mám přepsaných 15 epizod podcastu a skoro 200 záznamů z konferencí, bez API klíče a bez poplatků. Delší soubory chvíli běží, ale rozjedete to i na slabším stroji.
Pokračujte ve studiu
- Ollama: lokální modely v terminálu →
- LM Studio: lokální AI klikáním →
- Přepis audia a videa zdarma (Whisper) →
- AI obrázky lokálně na vlastním počítači →
- Kdy se vibe coding (a AI) nehodí? →
- Co jsou Claude Code skills? →
- Subagenti v Claude Code →
- Co jsou tokeny a proč za ně platíte? →
- Co je kontextové okno? →
- Co je vibe coding? →
- Všechny průvodce →