Průvodce lokální AI

Lokální AI: modely na vlastním počítači

Spusťte AI model přímo u sebe: soukromě, zdarma a offline. Poradíme, kde už dnes válí, co rozjede váš hardware a jak začít.

Autor: Jindřich Fáborský · 17 let v marketingu · 2 000+ hodin vibe codingu · 180+ projektů

Jindřich Fáborský ve své pracovně, vedle něj stoh Maců na lokální běh AI modelů

Lokální AI

Modely běží na mých strojích, ne v cloudu.

Rychlá odpověď

Co je tedy lokální AI?

Lokální AI znamená, že model běží přímo na vašem počítači, ne na cloudových serverech. Data nikam neodchází a neplatíte za tokeny.

Není to 100% náhrada za ChatGPT nebo Claude Code: nejlepší cloudové modely jsou pořád napřed. Na spoustu věcí ale lokál stačí, je zdarma a hlavně soukromý.

Rozjedete ho například přes:

Co dnes jde postavit

Kde lokální AI válí už teď

Nejsilnější je lokál na ohraničených úlohách, kde nepotřebujete ten nejvýkonnější mozek. Tohle všechno dělám v praxi na svých počítačích lokálně.

Přepis nahrávek

Whisper přepíše porady, podcasty i videa přímo u vás, zdarma a i v češtině. Tak třeba na Digisemestru mohou díky lokálnímu modelu studenti procházet výpisky ke stovkám přednášek a i v nich pohodlně vyhledávat.

Jak vznikl informační systém Digisemestru

Generování obrázků

FLUX Klein vytvoří obrázek přímo na Apple Silicon za pár vteřin, bez cloudu a poplatků. Používám ho na produktové a webové vizuály, lokálně místo cloudového modelu jako Google Nano Banana.

Návod: lokální obrázky krok za krokem

Citlivá data

Smlouvy, zákaznická a finanční data zpracujete menším modelem u sebe a do cloudu nejde nic. Na náročnou analýzu velkým modelem ale potřebujete výkonný stroj.

Doklady a faktury

Vyfocené účtenky a PDF faktury projede lokální model: vytáhne částky a DPH, najde duplicity, založí řádky do tabulky. Citlivé finance zůstanou doma. PDF faktury přečte líp než vyfocené účtenky.

Jak to mám zapojené

Lokál jako stavební blok

Lokální generování obrázků, přepis i lokální model nemám jako pět samostatných aplikací. Mám je zabalené jako Claude Code skills, které si větší workflow volá subagenticky. Jednou nastavím, pak to jen spouštím jedním příkazem. Lokál se tak stane součástí běžné práce, ne vědeckým projektem na víkend.

Rozhodování

Kdy lokálně a kdy radši cloud

Poctivě: lokál není lepší na všechno. Klikněte na typ úlohy a uvidíte, kam dnes patří a na co si dát pozor.

Lokálně: Spíš lokálně🔒 Citlivá data (smlouvy, klienti, finance)

Když data nesmí opustit firmu, lokální model je řešení: běží u vás a do cloudu neodejde nic. Přesně takhle zpracovávám zákaznické a finanční podklady já, citlivé věci přes cloud vůbec neposílám.

Na co pozor: Velký model na náročnější analýzu chce výkonný stroj. Na běžném notebooku zvládnete menší model a jednodušší úlohy: shrnutí, klasifikaci, vytažení údajů.

Jednoduché pravidlo: ohraničené úlohy a soukromí patří lokálu, frontier kvalita a velký kontext zatím cloudu. Hranice se ale rok co rok posouvá ve prospěch lokálu.

Váš hardware

Co poběží na vašem počítači

O tom, jak velký model rozjedete, rozhoduje paměť. Klikněte na svoji RAM a uvidíte, co se vejde, jak rychle a kterými modely začít.

Klikněte, kolik máte paměti pro model:

Rozhoduje paměť pro grafiku, ne jen běžná RAM. Na Macu s M-čipem se počítá celá unified memory (sdílená pro procesor i grafiku), na PC hlavně VRAM grafické karty. Lidé jedou na Macu i na kartách s velkou VRAM, někdy dohromady.

Co se vejde

7–8 miliard parametrů

Přibližná rychlost

≈ 25–45 tokenů/s

Modely, kterými začít

Ideální na začátek: slušná čeština i lehké kódování. Tady bych na běžném notebooku začínal.

Hodnoty jsou orientační a modely stárnou rychle, nové vychází každých pár týdnů. Aktuální nabídku najdete na ollama.com/library. Detailní žebříček modelů podle úloh a češtiny chystám jako samostatného průvodce.

Jak začít

Tři cesty, jak rozjet první model

Od nejjednodušší klikací aplikace po napojení lokálního modelu do agenta. Vyberte podle toho, jak technicky se cítíte.

LM Studio

Snadnost

Klikací appka pro Mac, Windows i Linux. Stáhnete, vyhledáte model přímo v okně, kliknete a chatujete. Žádný terminál, žádné příkazy. Na Macu navíc rozjede rychlejší MLX verze modelů.

Pro koho

Když chcete lokální AI vyzkoušet bez technického nastavování. Ideální první krok pro netechnické lidi.

Na co pozor: Je to hotová appka, terminál vůbec nepotřebujete. Na začátek přesně dost.

Návod: LM Studio krok za krokem

Doporučená cesta: začněte LM Studiem, k Ollamě přejděte, až budete chtít lokální model napojit do vlastních nástrojů.

Chcete s AI tvořit, ne jen číst návody?

Lokální AI je jeden dílek skládačky. V kurzu AI First vás naučím postavit si vlastní nástroje, weby i automatizace pomocí AI, prakticky a od základu.

21 hodin videí, 1 800+ absolventů, roční licence s aktualizacemi zdarma.

FAQ

Časté otázky

Co je lokální AI a čím se liší od ChatGPT?+

Lokální AI znamená, že jazykový model běží přímo na vašem počítači, ne na cloudových serverech. ChatGPT nebo Claude posíláte dotaz na internet a odpověď se počítá u poskytovatele. Lokální model počítá u vás: data nikam neodchází, neplatíte za tokeny a funguje i offline.

Je lokální AI zdarma?+

Samotné spuštění modelu je zdarma. Modely jako Qwen, Gemma nebo Phi se stahují bez poplatku a inference (počítání odpovědí) nic nestojí. Zaplatíte jen za hardware a elektřinu. Oproti cloudu, kde platíte za každý token, se to u větších objemů rychle vrátí.

Jaký počítač potřebuju? Jaký model si stáhnout?+

Rozhoduje paměť pro grafiku: na Macu s M-čipem unified memory (sdílená), na PC hlavně VRAM grafické karty. Na 8 GB rozjedete malé modely (3–4 miliardy parametrů) na chat a shrnutí. Na 16 GB je to ideální na začátek (7–8 miliard, slušná čeština). Na 32 GB a víc běží znatelně chytřejší modely. Konkrétní doporučení najdete v konfigurátoru výš na téhle stránce.

Zvládne lokální model dlouhý dokument nebo velký kontext?+

Jen omezeně, a bývá to časté hrdlo. Lokální modely sice často deklarují kontextové okno 128 tisíc tokenů, ale na běžném počítači z něj reálně využijete spíš 32 až 64 tisíc: čím delší kontext, tím víc paměti navíc spotřebuje. Frontier modely v cloudu běžně zvládnou 1 milion tokenů i víc. Proto patří dlouhé dokumenty a velké projekty zatím do cloudu.

Je lokální AI bezpečnější? Kam jdou moje data?+

U lokálního modelu data neopustí váš počítač, což je hlavní důvod, proč ho lidé nasazují na citlivé věci (smlouvy, zákaznická data, finance). U cloudových služeb data odchází k poskytovateli, proto si ověřte jeho podmínky a firemní režimy. Sám citlivé podklady přes cloud vůbec neposílám.

Zvládne lokální model česky?+

Lepší modely ano. Nejširší pokrytí češtiny mají dnes Qwen a Gemma. Menší a starší modely jsou na češtině slabší, takže pokud vám na ní záleží, vybírejte právě z těchto rodin a otestujte na vlastním textu.

Musím umět programovat, abych to rozjel?+

Ne. Nejjednodušší cesta je LM Studio: klikací aplikace, ve které model vyhledáte a spustíte myší, bez terminálu. K Ollamě (ovládá se příkazy) přejdete, až budete chtít model napojit do vlastních nástrojů.

Nahradí lokální AI ChatGPT nebo Claude?+

Zatím ne na všechno. Na náročné programování a velké kontexty jsou frontier modely v cloudu stále napřed a lokál na běžném hardwaru u nich drhne. Kde lokál válí už dnes: přepis, generování obrázků, práce s citlivými daty a hromadné dávky. Berte to jako doplněk, ne náhradu.

Jak přepsat audio nebo video zdarma a i česky?+

Lokálním modelem Whisper. Běží přímo u vás, zvládá češtinu a je zdarma. Takhle mám přepsaných 15 epizod podcastu a skoro 200 záznamů z konferencí, bez API klíče a bez poplatků. Delší soubory chvíli běží, ale rozjedete to i na slabším stroji.