Observability

AI-system: egenhostade assistenter, RAG och lokal infrastruktur

De flesta lokala AI-uppställningar börjar med en modell och en körmiljö.

Övervaka LLM-inferens i produktion (2026): Prometheus & Grafana för vLLM, TGI, llama.cpp

LLM-inferens ser ut som “bara en annan API” – tills latens stiger, köer upp, och dina GPU:er sitter på 95% minne utan tydlig förklaring.

Garage - S3 kompatibel objektlagring snabbstart

Garage är en öppen källkod, självvärdbar, S3-kompatibel objektlagringssystem som är utformad för små- till medelstorleksdistributioner, med ett starkt fokus på hållbarhet och geografisk distribution.

Observabilitet i produktion: Övervakning, mått, Prometheus & Grafana-guide (2026)

Observabilitet är grunden för tillförlitliga produktionsystem.

Utan mått, dashboards och varningar drifver Kubernetes-kluster, AI-belastningar misslyckas tyst, och fördröjningsregressioner går obemärkta tills användare klager.