Průvodce lokální AI

Co je Hugging Face?

Obří knihovna AI modelů. Něco jako GitHub, ale pro umělou inteligenci. Stáhnete si model a spustíte ho u sebe, zdarma a soukromě.

Autor: Jindřich Fáborský · 17 let v marketingu · 2 000+ hodin vibe codingu · 180+ projektů

Hugging Face jako knihovna AI modelů: mřížka svítících AI mozků

Hugging Face

Knihovna AI modelů.

Rychlá odpověď

Co je tedy Hugging Face?

Hugging Face je největší knihovna open-source AI na světě. Přes dva miliony modelů ke stažení, plus data a hotová dema.

Nejlíp si ho představíte jako GitHub pro umělou inteligenci: jako GitHub hostuje kód, Hugging Face hostuje AI modely. Když chcete spustit AI u sebe v počítači, stáhnete si model právě odsud.

Najdete tu tři věci:

🧠 Modely📊 Datasety🎪 Spaces (dema)

Co tu najdete

Modely, datasety a Spaces

Hugging Face není jen sklad modelů. Tři části dohromady dělají z webu ekosystém open-source AI.

Tři části Hugging Face: modely (AI čipy), datasety (vrstvy dat) a Spaces (běžící mini-aplikace)

Přes 2 miliony modelů ke stažení

Srdce Hugging Face. Předtrénované AI modely od malých, co běží na mobilu, po obří jako 70B (potřebují kolem 40 GB paměti). Každý má svoji stránku se soubory, popisem a tlačítkem ke stažení.

Pro vás: Tady si stáhnete model do Ollamy nebo LM Studia a spustíte ho lokálně, zdarma a soukromě.

huggingface.co/models

Konec šifrám

Rozluštěte název modelu

Mistral-7B-Instruct-Q4_K_M vypadá jako kód z Matrixu. Přitom každá část něco jednoduchého znamená. Proklikejte si je.

Klikněte na kteroukoli část názvu:

Rodina: Mistral

Kdo model vyrobil

Jméno řady modelů a její tvůrce. Mistral dělá francouzská Mistral AI. Llama je od Mety, Qwen od Alibaby, Gemma od Googlu, DeepSeek z Číny.

Stejná rodina = podobná „DNA“: architektura, data i styl odpovědí.

A co „GGUF“? Někdy v názvu uvidíte i formát. GGUF je formát pro běh na běžném počítači a Macu (Ollama, LM Studio). Pro lokální spuštění hledejte právě GGUF.
A čísla verze? Třeba 3.1 nebo v0.3 jsou jen generace modelu. Vyšší číslo = novější, obvykle lepší. Berte to jako verzi aplikace.

Od modelu k běhu

Jak dostat model z Hugging Face k sobě

Dvě cesty pro běžného člověka. Příkaz v Ollamě, nebo klikání v LM Studiu. Vyberte si.

Nejrychlejší cesta. Jeden příkaz model stáhne i spustí. Ollama sama vybere rozumnou kvantizaci.

  1. 1

    Na stránce modelu na Hugging Face klikněte na „Use this model“ a vyberte Ollama. Dostanete hotový příkaz.

  2. 2

    Příkaz vložte do terminálu. Ollama model stáhne z Hugging Face a rovnou spustí.

    ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF

    Pozn.: Chcete konkrétní kvantizaci? Přidejte ji za dvojtečku, třeba :Q5_K_M.

  3. 3

    A je to. Můžete si s modelem psát rovnou v terminálu, nebo ho napojit na další nástroje.

Hugging Face + Ollama (dokumentace)

Nemáte ještě ani jedno? Návod na Ollamu a návod na LM Studio vás provedou instalací.

Než stáhnete 40 GB

Na co si dát pozor

Lokální modely jsou skvělé, ale tři věci je dobré vědět dopředu, ať nestahujete něco, co váš počítač neutáhne.

Nainstalovat ≠ používat

Malý model rozjedete i na 8 GB RAM, ale na reálnou práci je to slabé. Komfort začíná zhruba na 32 až 64 GB. Velikost paměti je tvrdý strop, ne doporučení.

Mac paměť není VRAM

Apple Silicon má sdílenou paměť, takže se do něj vejde velký model. Nvidia GPU ho zase rozběhne rychleji. Neporovnávejte ta čísla jedna ku jedné.

Komprese má mez

Q4_K_M je skvělý kompromis pro běžné psaní. U složitějšího kódování a agentních úloh ale kvantizace ubírá víc, na kritickou práci sáhněte po vyšší kvalitě nebo cloudu.

Z praxe: točím lokální modely z Hugging Face na Macu s 256 GB RAM (běží mi tam i velký gpt-oss:120b přes Ollamu). I tak lokální model zatím nenahradí špičkový cloud na složité kódování. Válí ale na ohraničených úlohách: přepisy, citlivá data, dávkové zpracování. Víc v průvodci lokální AI na vlastním počítači.

Účet a peníze

Co je zdarma a kdy potřebujete účet

🆓 Stahování zdarma

Procházet a stahovat veřejné modely můžete bez limitu, dokonce i bez registrace. Pro lokální běh nepotřebujete platit nic.

🔑 Gated modely

Některé modely (třeba Llama od Mety nebo Gemma od Googlu) chtějí přihlášení a odsouhlasení licence. Kliknete na „Agree“, přístup bývá hned.

💳 Plán Pro

9 USD měsíčně přidá víc soukromého úložiště a kredity na cloudové volání modelů. Pro běžné stahování ho nepotřebujete.

Aktuální podmínky: huggingface.co/pricing

Chcete AI opravdu ovládnout?

Lokální modely jsou jen jeden dílek. Vibe coding vás v kurzu AI First naučí stavět weby, appky a vlastní nástroje s AI od základu.

21 hodin videí, 1 800+ absolventů, roční licence s aktualizacemi zdarma. Provedu vás vším, co sám denně používám.

FAQ

Časté otázky

Co je Hugging Face a proč o něm všichni mluví?+

Hugging Face je největší knihovna open-source AI na světě, přes dva miliony modelů ke stažení plus datasety a hotová dema. Funguje jako GitHub, ale místo kódu hostuje AI modely. Když chcete spustit umělou inteligenci u sebe v počítači, model si stáhnete právě odsud.

Je Hugging Face zdarma?+

Pro stahování a zkoušení veřejných modelů je úplně zdarma, bez limitu, dokonce i bez registrace. Platí se až za nadstavby: plán Pro za 9 USD měsíčně (víc soukromého úložiště, kredity na cloudové volání modelů) nebo dedikované servery pro firmy. Pro lokální běh přes Ollamu nebo LM Studio nic z toho nepotřebujete.

Jak stáhnu model z Hugging Face?+

Nejjednodušeji přes Ollamu jedním příkazem v terminálu, nebo klikáním v aplikaci LM Studio, která má vyhledávání modelů z Hugging Face přímo v sobě. Na stránce modelu navíc najdete tlačítko „Use this model“, které vám hotový postup nabídne.

Co znamená číslo u modelu, třeba 7B?+

Je to počet parametrů modelu v miliardách. Čím vyšší číslo, tím je model chytřejší, ale tím víc paměti (RAM) potřebuje. 7B nebo 8B je rozumný kompromis pro běžný počítač, 70B už chce hodně silný stroj. Orientačně: 7B model v kvantizaci Q4 potřebuje kolem 4 až 5 GB paměti.

Co je kvantizace a proč modely zmenšuje?+

Kvantizace je komprese modelu. Váhy se z přesných 16bitových čísel zhustí na 4 až 8 bitů, takže model zabere míň místa a paměti, za cenu malinké ztráty kvality. Varianta Q4_K_M je rozumný výchozí kompromis: zmenší model zhruba na třetinu při zachování kolem 92 až 95 % kvality.

Jaký je rozdíl mezi modelem z Hugging Face a ChatGPT?+

ChatGPT je hotová služba běžící na cizích serverech, platíte za přístup a data odcházejí do cloudu. Model z Hugging Face si stáhnete a spustíte u sebe: je zdarma, funguje offline a data nikdy neopustí váš počítač. Otevřené modely bývají pár měsíců za špičkovými placenými modely, ale na běžné psaní, přepisy nebo práci s citlivými daty bohatě stačí.

Co jsou Spaces na Hugging Face?+

Spaces jsou hotové demo aplikace běžící přímo v prohlížeči. Můžete si v nich model vyzkoušet bez jakékoli instalace. Ideální první kontakt: než stáhnete velký model k sobě, na Spaces si zdarma ověříte, jestli vám sedí.