Question 1

Co je Ollama a k čemu slouží?

Accepted Answer

Ollama je program, který stáhne a spustí jazykový AI model přímo na vašem počítači. Ovládáte ho jedním příkazem v terminálu (ollama run …) a chatujete s modelem jako s ChatGPT, jen běží lokálně u vás. Hlavní výhoda je, že vystavuje rozhraní, na které napojíte vlastní aplikace a skripty.

Question 2

Je Ollama zdarma?

Accepted Answer

Ano. Ollama i modely, které přes ni stáhnete (gpt-oss, Qwen, Gemma, Llama), jsou zdarma. Neplatíte za žádné tokeny ani předplatné, jen za elektřinu a hardware, který už máte. U hromadných úloh se to oproti placenému cloudu rychle vyplatí.

Question 3

Kolik RAM potřebuju? Běží Ollama bez grafické karty?

Accepted Answer

Minimum je 8 GB paměti a běží i jen na procesoru, bez samostatné grafiky (jen pomaleji). Platí jednoduché pravidlo: 8 GB rozjede malé modely, 16 GB je ideální start (Qwen 3 8B) a 32 GB a víc rozjede znatelně chytřejší modely. Na Macu s M-čipem se počítá celá sdílená paměť, na PC hlavně VRAM grafické karty.

Question 4

Funguje Ollama offline, bez internetu?

Accepted Answer

Ano. Internet potřebujete jen jednou, na stažení modelu. Pak model běží celý u vás a funguje i v letadle nebo bez připojení. Nic z toho, co napíšete, neodchází ven.

Question 5

Ollama, nebo LM Studio? Co si vybrat?

Accepted Answer

LM Studio je klikací appka bez terminálu, nejsnazší start pro netechnické lidi. Ollama se ovládá příkazy a její síla je v napojení na vlastní nástroje (rozhraní kompatibilní s OpenAI). Když chcete jen chatovat, začněte LM Studiem. Když chcete model zapojit do appky, skriptu nebo agenta, sáhněte po Ollamě.

Question 6

Mluví modely v Ollamě česky?

Accepted Answer

Lepší modely ano. Nejširší pokrytí češtiny mají dnes Qwen a Gemma. Menší a starší modely jsou na češtině slabší, takže pokud vám na ní záleží, vybírejte z těchto rodin a otestujte na vlastním textu.

Question 7

Jaký model si stáhnout jako první?

Accepted Answer

Na běžném notebooku s 16 GB paměti je bezpečný start Qwen 3 8B: spustíte ho příkazem ollama run qwen3:8b a má slušnou češtinu i lehké kódování. Výkonnější gpt-oss:20b od OpenAI se vejde díky úspornému formátu taky, ale na 16 GB je to těsné, pohodlně poběží od 24 GB. Na 8GB stroji začněte menším modelem jako Llama 3.2.

Question 8

Můžu Ollamou pohánět přímo Claude Code místo Opusu?

Accepted Answer

Teoreticky ano. Ollama dnes umí mluvit i rozhraním Anthropicu, takže Claude Code se dá přesměrovat na lokální model. Prakticky to ale zatím nedoporučuju: na vážné programování lokální modely nedosahují kvalit cloudových modelů jako Opus nebo Sonnet, a model, který by se jim přiblížil, by chtěl stovky gigabajtů až kolem terabajtu paměti pro grafiku (datacentrum, ne notebook). Lokální model nasaďte na ohraničené úlohy uvnitř appek, ne jako náhradu agenta.

Question 9

Co je llama.cpp a jak souvisí s Ollamou?

Accepted Answer

llama.cpp je výpočetní engine, který umí spustit AI model na běžném počítači. Ollama (i LM Studio) ho mají pod kapotou a obalují ho do pohodlného ovládání: stažení modelu, správa, server. Sami s llama.cpp pracovat nemusíte, Ollama to dělá za vás.

Ollama: lokální AI modely ve vašem terminálu

Co je tedy Ollama?

Rozjeďte první model v pěti příkazech

Vyberte model podle své paměti

Nemusíte umět příkazy: řeknete to Claude Code

Na čem mi Ollama reálně jede

Citlivá data nikdy neopustí Mac

Výběr z 900 přednášek

Výpisky ke stovkám přednášek

Kde má lokální AI své hranice

Claude Code na lokálním modelu? Zatím jen teoreticky

Paměť je strop

Lokální AI je doplněk, ne náhrada

Chcete s AI tvořit, ne jen číst návody?

Časté otázky

Pokračujte ve studiu