1. Úvod do problému

Náš klient, středně velká e-commerce firma, měl před sebou klasický cloudový horor:

  • Monolitická aplikace běžela na několika virtuálních strojích, které byly buď přetížené, nebo zbytečně žraly výkon.
  • Sezónní špičky? Noční můra. Black Friday znamenal výpadky, nervy a ušlý zisk.
  • Chaos v infrastruktuře: Ruční škálování, manuální nasazování verzí a nulový monitoring.
  • Náklady? Nekontrolovatelné.

Rozhodli jsme se pro Azure Kubernetes Service (AKS). Proč? Protože je to stabilní, flexibilní a automatizované řešení, které dává smysl nejen technologicky, ale i finančně.

2. Technická architektura

  1. Azure Kubernetes Service (AKS) — Hlavní orchestrátor. Node Pools pro oddělení různých pracovních zátěží.
  2. Azure Container Registry (ACR) — Privátní úložiště pro Docker kontejnery.
  3. Azure Load Balancer (ALB) — Rozložení zátěže mezi jednotlivé nody s health checks.
  4. Azure Application Gateway (WAF) — Ochrana proti běžným hrozbám. SSL terminace.
  5. Azure Monitor & Log Analytics — Realtime sledování metrik. Centrální úložiště logů. Grafana dashboardy.
  6. Azure Key Vault — Bezpečné úložiště pro API klíče, certifikáty a přihlašovací údaje.
  7. Horizontal Pod Autoscaler (HPA) — Automatické škálování na základě CPU a paměťových metrik.
  8. Azure DevOps Pipelines — Automatizované CI/CD pipeline s Helm Charts.
  9. Azure SQL Database — Spravovaná databáze s vysokou dostupností a replikací.
  10. Azure Virtual Network (VNet) — Síťová izolace s privátním propojením mezi komponenty.

3. CI/CD pipeline: Automatizace nasazování

Continuous Integration: Každý commit spustil automatické buildování Docker image. Testovací skripty ověřily kvalitu kódu.

Continuous Deployment: Každý schválený build se automaticky pushnul do ACR. Helm Chart zajistil konzistentní nasazení do AKS. Rollback byl připraven jedním kliknutím.

Výsledek? Nová verze aplikace mohla být nasazena několikrát denně, bez výpadků a bez nervů.

4. Monitoring a observabilita

  • Metriky v reálném čase: CPU, RAM, I/O operace, síťová aktivita
  • Logování chyb a událostí z každého podu do Log Analytics
  • Automatická upozornění při překročení kritických hodnot
  • Grafana dashboardy pro vývojáře i manažery

5. Výsledky

  • 99,9% dostupnost aplikace během sezónních špiček
  • Snížení nákladů o 35 % díky automatizovanému škálování
  • Rychlejší nasazování (až 10× denně) bez výpadků
  • Přehled o výkonu a nákladech díky monitoringu a alertingu
  • Bezpečnost na enterprise úrovni díky Key Vault a WAF

„S EnterCloud jsme konečně dostali naši infrastrukturu pod kontrolu. Aplikace šlape jako hodinky a my se můžeme soustředit na vývoj nových funkcí." — CTO klienta