Hardware

Chunking-Strategien im RAG-Vergleich: Alternativen, Kompromisse und Beispiele

Chunking ist der wichtigste unterschätzte Hyperparameter in Retrieval ‑ Augmented Generation (RAG): Er bestimmt still und leise, was Ihr LLM “sieht”, wie teuer die Verarbeitung wird, und wie viel vom LLM-Kontextfenster pro Antwort verbraucht wird.

Rechenhardware im Jahr 2026: GPUs, CPUs, Speicher und AI-Workstations

A hub for compute hardware analysis covering GPUs, CPUs, memory trends, and AI-focused workstation infrastructure.

Selbstgehostete LLMs ermöglichen die Kontrolle über Daten, Modelle und Inferenz – ein praktischer Weg zur AI-Souveränität für Teams, Unternehmen und Nationen.

Vergleich der Leistung von LLMs auf Ollama mit einer GPU mit 16 GB VRAM

Die Ausführung großer Sprachmodelle lokal bietet Ihnen Privatsphäre, die Möglichkeit, offline zu arbeiten, und null API-Kosten.
Dieser Benchmark zeigt genau, was man von 14 beliebten
LLMs auf Ollama auf einem RTX 4080 erwarten kann.

GPU- und RAM-Preise in Australien steigen: RTX 5090 um 15 % erhöht, RAM um 38 % - Januar 2026

Heute untersuchen wir die Top-Level-Verbraucher-GPUs und RAM-Module. Speziell betrachte ich die Preise für RTX-5080 und RTX-5090 sowie 32GB (2x16GB) DDR5 6000.

Beste Linux-Terminal-Emulatoren: Vergleich 2026

Eines der wichtigsten Werkzeuge für Linux-Benutzer ist der Terminal-Emulator.

DGX Spark AU-Preisgestaltung: 6.249–7.999 USD bei großen Einzelhändlern

Die NVIDIA DGX Spark (GB10 Grace Blackwell) ist in Australien bei großen PC-Händlern mit lokaler Lagerbestellung erhältlich. Wenn Sie die globalen Preise und die Verfügbarkeit des DGX Spark verfolgt haben, werden Sie wissen wollen, dass die Preise in Australien je nach Speicherkonfiguration und Händler zwischen 6.249 und 7.999 AUD liegen.

Selbsthosting von Cognee: Auswahl des LLM mit Ollama

Cognee ist ein Python-Framework zur Erstellung von Wissensgraphen aus Dokumenten mithilfe von LLMs. Funktioniert es jedoch mit selbstgehosteten Modellen?

Ubuntu verlor nach Kernel-Upgrade die Netzwerkverbindung

Nach der automatischen Installation eines neuen Kernels hat Ubuntu 24.04 das Ethernet-Netzwerk verloren. Dieses frustrierende Problem trat bei mir ein zweites Mal auf, daher dokumentiere ich hier die Lösung, um anderen zu helfen, die dasselbe Problem haben.

RAM-Preise in Australien – Dezember 2025

Angesichts dieser verrückten Volatilität der RAM-Preise, um ein besseres Bild zu erhalten, lassen Sie uns zunächst die RAM-Preise in Australien selbst verfolgen.

RAM-Preisanstieg: Bis zu 619 % im Jahr 2025

Der Speichermarkt erlebt Ende 2025 eine beispiellose Preisschwankung, bei der die RAM-Preise in allen Segmenten dramatisch gestiegen sind.

Preise für NVIDIA RTX 5080 und RTX 5090 in Australien – November 2025

Vergleichen wir die Preise für Spitzen-Grafikkarten für Endverbraucher, die insbesondere für LLMs und KI im Allgemeinen geeignet sind. Genauer gesagt schaue ich mir die Preise für RTX-5080 und RTX-5090 an.

Die Demokratisierung der KI ist da. Mit Open-Source-LLMs wie Llama, Mistral und Qwen, die nun proprietäre Modelle herausfordern, können Teams eine leistungsstarke KI-Infrastruktur mit Consumer-Hardware aufbauen – und dabei die Kosten drastisch senken, während sie die vollständige Kontrolle über Datenschutz und Bereitstellung behalten.

FLUX.1-dev ist ein leistungsstarkes Text-zu-Bild-Modell, das beeindruckende Ergebnisse liefert, aber dessen Speicherbedarf von über 24GB die Nutzung auf vielen Systemen erschwert. GGUF-Quantisierung von FLUX.1-dev bietet eine Lösung, indem sie den Speicherbedarf um etwa 50% reduziert, während die Bildqualität erhalten bleibt.

Hinzufügen von NVIDIA-GPU-Unterstützung zum Docker-Modell-Runner

Docker Model Runner ist das offizielle Tool von Docker, um KI-Modelle lokal zu verwenden, aber GPU-Beschleunigung mit NVidia in Docker Model Runner erfordert eine spezifische Konfiguration.

NVIDIA DGX Spark vs. Mac Studio vs. RTX-4080: Ollama-Leistungsvergleich

Ich habe einige interessante Leistungsbenchmarks von GPT-OSS 120b gefunden, die auf Ollama unter drei verschiedenen Plattformen durchgeführt wurden: NVIDIA DGX Spark, Mac Studio und RTX 4080. Der GPT-OSS 120b-Modell aus der Ollama-Bibliothek wiegt 65 GB, was bedeutet, dass er nicht in die 16 GB VRAM des RTX 4080 (oder der neueren RTX 5080) passt.

Hardware

Chunking-Strategien im RAG-Vergleich: Alternativen, Kompromisse und Beispiele

Rechenhardware im Jahr 2026: GPUs, CPUs, Speicher und AI-Workstations

LLM-Selbsthosting und KI-Souveränität

Vergleich der Leistung von LLMs auf Ollama mit einer GPU mit 16 GB VRAM

GPU- und RAM-Preise in Australien steigen: RTX 5090 um 15 % erhöht, RAM um 38 % - Januar 2026

Beste Linux-Terminal-Emulatoren: Vergleich 2026

DGX Spark AU-Preisgestaltung: 6.249–7.999 USD bei großen Einzelhändlern

Selbsthosting von Cognee: Auswahl des LLM mit Ollama

Ubuntu verlor nach Kernel-Upgrade die Netzwerkverbindung

RAM-Preise in Australien – Dezember 2025

RAM-Preisanstieg: Bis zu 619 % im Jahr 2025

Preise für NVIDIA RTX 5080 und RTX 5090 in Australien – November 2025

KI-Infrastruktur auf Consumer-Hardware

FLUX.1-dev mit GGUF Q8 ausführen

Hinzufügen von NVIDIA-GPU-Unterstützung zum Docker-Modell-Runner

NVIDIA DGX Spark vs. Mac Studio vs. RTX-4080: Ollama-Leistungsvergleich