Zpět na postřehy

#ai

Ekologický dopad AI: Co se děje v pozadí?

Délka:

12 min

Publikováno:

9. června 2025

Ekologický dopad AI: Co se děje v pozadí?

Pokaždé, když využíváme umělou inteligenci, ať už pro generování či zpracování textů, obrázků, nebo videí, spouštíme v pozadí energeticky náročné procesy. Ty se promítají do spotřeby elektřiny, a dokonce i vody, kterou výpočetní zařízení a jejich chlazení potřebuje přímo i nepřímo.

Abychom mohli k AI přistupovat zodpovědněji, musíme pochopit, co se děje v pozadí. Pak si uvědomíme nejen to, že nejde o neomylný zdroj pravdy, ale i to, že má svůj dopad na životní prostředí.

Co se děje na pozadí zpracování promptu

Naše interakce s AI modely hodně závisí na zdrojích. Jak ale přesně naše psaní zpráv s těmito modely spotřebovává elektřinu a co víc, vodu? Odpověď leží v několika klíčových fázích.

Učení modelu

Než je model připraven generovat odpovědi, projde náročným trénovacím procesem.

Velké jazykové modely (LLM) se učí pomocí samo-supervizovaného učení. Neučí se na datech s explicitními popisky, ale předpovídají následující slovo na základě předchozího kontextu. Díky tomu dokážou efektivně využít rozsáhlé nestrukturované texty.

Základem těchto modelů jsou transformery, které umožní efektivně zpracovat sekvence a zachytit dlouhodobé závislosti v textu. Během tréninku model prochází texty, předpovídá následující slova a podle chyb upravuje své vnitřní parametry. Tento proces běží na rozsáhlých datech, která zahrnují texty z internetu, knih, kódu a dalších zdrojů.

Pro efektivní strojové učení jsou klíčové dvě věci: kvalitní data a jejich dostatečné množství. Díky tomu se modely naučí imitovat lidskou interakci tak, že předpovídají, jaké slovo by mohlo následovat. Vycházejí přitom z předchozího kontextu, který si drží ve své paměti, takzvaném kontextovém okně.

Environmentální dopad

Trénování je náročné nejen na energii pro výpočetní techniku, ale i na vodu. Trénování modelu GPT-3 v datových centrech společnosti Microsoft například spotřebovalo přibližně 700 000 litrů pitné vody ve formě parních emisí. Takové množství vody odpovídá třeba spotřebě potřebné k výrobě zhruba 320 elektromobilů Tesla.

Tato spotřeba vody plyne i z potřeby udržet servery v datových centrech na optimální teplotě. Chladí se často vodními systémy, kde voda absorbuje teplo generované servery a následně se odpařuje v chladicích věžích. Je to energeticky náročný proces, který vyvolává obavy o udržitelnost v době, kdy AI využíváme čím dál víc.

Hostování modelu

Velikost velkých jazykových modelů (LLM) určuje počet parametrů, tedy neuronů, které si lze představit jako váhy v neuronové síti. Tyto parametry ovlivňují, jak dobře model zachytí složité jazykové vzory a vztahy. Obecně platí, že čím víc parametrů model má, tím lépe rozumí přirozenému jazyku a dokáže ho generovat.

Malé modely, například s několika jednotkami miliard parametrů, provozujete lokálně na počítačích. Hodí se pro aplikace, kde záleží na bezpečnosti, rychlosti odezvy a nižších nárocích na hardware.

Naopak největší a nejvýkonnější modely, jako je LLaMA 3.1 se 405 miliardami parametrů, potřebují specializovaný hardware a infrastrukturu. K jejich provozu jsou nezbytné servery s vysokou kapacitou VRAM a výkonnými GPU. Provoz LLaMA 3.1 v režimu fp16 (přesnost vah, floating point) vyžaduje například přibližně 972 GB VRAM.

Tyto rozsáhlé modely se obvykle hostují v datových centrech, která poskytují potřebný výpočetní výkon a infrastrukturu pro jejich běh. Cloudové platformy jako Google Cloud Platform nebo Microsoft Azure nabízejí služby pro nasazení a správu těchto modelů včetně optimalizace výkonu a škálovatelnosti.

Zpracování vstupu

Jakmile zadáte prompt, požadavek okamžitě poputuje do datového centra, kde ho převezme specializovaný hardware. Každý krok zpracování vstupu a generování výstupu velkými jazykovými modely (LLM) přispívá k celkové spotřebě energie.

Tokenizace. Textový vstup se rozdělí na menší jednotky zvané tokeny. Tento proces potřebuje výpočetní výkon, ale ve srovnání s dalšími kroky je energeticky relativně nenáročný.
Převedení na embeddingy. Každý token se převede na číselný vektor (embedding), který zachycuje jeho sémantický význam. Tento krok zahrnuje maticové operace a běží na specializovaném hardwaru, takže přispívá ke spotřebě energie.
Zpracování modelem (inference). Embeddingy dál zpracovává architektura modelu, typicky postavená na transformerech. Tento krok je energeticky nejnáročnější, hlavně u velkých modelů s miliardami parametrů.
Predikce dalšího tokenu. Model vypočítá pravděpodobnosti následujících tokenů a generuje výstup. Náročnost tohoto kroku závisí na délce generovaného textu a složitosti modelu. Modely s asi 7 miliardami parametrů spotřebují přibližně 3–4 Jouly na token.
Ovlivnění výstupu parametry. Parametry jako „teplota“ mění charakter výstupu (deterministický vs. náhodný). Přímý vliv na spotřebu energie nemají, ale mohou ovlivnit délku a složitost textu, a tím nepřímo i energetickou náročnost.

Náročnost výpočtů

Čím větší a složitější model, tím víc energie spotřebuje. Každý krok od tokenizace po generování výstupu běží na specializovaném hardwaru, často na GPU jako NVIDIA H100.

Jak náročné tyto výpočty jsou?

Jediné GPU NVIDIA H100 (SXM) může mít spotřebu až 700 wattů. V datových centrech jsou tato GPU zapojena do racků, které spotřebují desítky kilowattů. Pro představu, se 700 Wh energie provozujete:

| Zařízení / Aktivita | Spotřeba | Doba provozu s 700 Wh | | --- | --- | --- | | NVIDIA H100 GPU (SXM) | 700 W | 1 hodina | | LED žárovka | 10 W | 70 hodin (cca 3 dny) | | Nabíjení chytrého telefonu | 15 Wh na nabití | Přibližně 46 nabití |

Tvorba tepla a chlazení

Provoz LLM generuje značné množství tepla. Datová centra proto používají pokročilé chladicí systémy, které spotřebovávají další energii i vodu. Chlazení může tvořit až 30–40 % celkové spotřeby energie datového centra. Průměrná spotřeba vody na chlazení může dosáhnout 1,8 litru na každou kWh energie. Některá datová centra tak spotřebují denně 11–19 milionů litrů vody, což odpovídá spotřebě města s 30 000 až 50 000 obyvateli.

Spotřeba vody a energie na jeden prompt

Jednotlivý prompt může mít nízkou spotřebu, ale při miliardách dotazů denně se kumulativní dopad výrazně zvyšuje. Studie University of California, Riverside uvádí, že zpracování 5 až 50 AI promptů spotřebuje až 0,5 litru vody (převážně na chlazení).

Inference různých modelů na kratší dotaz

GPT-4o: ~0,421 Wh na dotaz.
Claude 3.7 Sonnet: ~0,836 Wh na dotaz.
GPT-4.1 nano: ~0,103 Wh na dotaz.
DeepSeek-R1 a o3: ~23.82 Wh na dotaz.

Obecně platí, že reasoning modely jsou výrazně náročnější na energii než klasické modely. Vidíme to třeba u DeepSeeku, kde je verze V3 energeticky přibližně 8krát úspornější než R1. Podobně si vede model OpenAI o3 oproti GPT-4.1. Pro detailnější srovnání energetické náročnosti doporučuji pročíst následující článek.

Na obrázku níže je vidět výrazně vyšší využití tokenů u reasoning modelu R1 oproti klasickým modelům.

Odhadovaná spotřeba energie a emisí CO₂ na jeden textový dotaz (orientační)

| Typ úlohy | Spotřeba energie / dotaz | Emise CO₂e / dotaz | Přirovnání spotřeby | | --- | --- | --- | --- | | Prosté vyhledávání | ~0,300 Wh | ~0,2 g | Napájení LED žárovky (10 W) po dobu ~2 minut | | ChatGPT (např. GPT-4o) | ~0,421 Wh | ~0,3 g | Napájení LED žárovky po dobu ~2,5–3 minut | | Energeticky náročnější modely (o3, DeepSeek) | ~23.82 Wh | ~23 g | Nabití mobilu ~3–4× |

Kumulativní dopad při 1 miliardě dotazů denně

Energie: cca 430 MWh denně, což odpovídá spotřebě přibližně 14 000 domácností (průměrná denní spotřeba 30 kWh).

Emise CO₂: přibližně 300 tun denně.

Spotřeba vody: až 10 milionů litrů denně.

Roste energetická náročnost vyhledávání

Integrace LLM modelů (large language models) do digitálních nástrojů, se kterými se běžně setkáváme online, se stává novodobým trendem. Většina velkých vyhledávačů včetně Google Search dnes využívá AI modely k sumarizaci výsledků vyhledávání. Tento přístup ale kombinuje energetickou náročnost tradičního vyhledávání s dalšími výpočetními náklady na provoz LLM. Více si o tom přečtete zde.

Na rozdíl od alternativ jako DuckDuckGo či Ecosia Google aktuálně neumožňuje tyto AI funkce úplně vypnout, takže energetická stopa roste i u jednoduchého vyhledávání.

Shrnutí

Přímý vztah mezi naším dotazem a reálnou spotřebou zdrojů ukazuje, že každá interakce s AI má svou energetickou, a tím i ekologickou cenu. Mezinárodní agentura pro energii (International Energy Agency) odhaduje, že globální spotřeba elektřiny ze strany datových center se do roku 2030 více než zdvojnásobí, na přibližně 945 terawatthodin (TWh). To je zhruba tolik, kolik dnes spotřebuje celé Japonsko.

Vzhledem k těmto nárokům se nabízejí dvě otázky: jak vlastně datová centra fungují, že tak žerou energii i vodu, a co můžeme dělat, abychom tuhle stopu minimalizovali?

Na první otázku, tedy co jsou datová centra, která jsou srdcem všech těchto procesů, a jaké konkrétní environmentální dopady jejich provoz nese, se zaměříme v další části. Na druhou otázku pak v posledním článku této trilogie.

Související články

AI: Pomocník nebo hrozba pro juniory? – AI ve vývoji očima juniora: cenný pomocník, nebo neviditelná berlička, která brzdí růst?
Jak zjistit, že je správný čas na implementaci AI? – Praktický průvodce pro firmy, které uvažují o využití AI, ale ještě váhají.
Květnové AI novinky – Jako každý měsíc jsme pro vás vybrali to nejdůležitější a přehledně shrnuli, co podle nás v AI nejvíc zarezonovalo.
Jak Netflix ví, co chcete sledovat dřív než vy? – Jak funguje systém pro doporučování na Netflixu.

Zpět na postřehy

Chcete být o krok napřed?

Nenechte si utéct naše nejlepší postřehy. Žádný spam, jen praktické analýzy, pozvánky na exkluzivní eventy a shrnutí podcastů přímo do vaší schránky.