Self-Hosting

GPU- und RAM-Preise in Australien steigen: RTX 5090 um 15 % erhöht, RAM um 38 % - Januar 2026

Heute untersuchen wir die Top-Level-Verbraucher-GPUs und RAM-Module. Speziell betrachte ich die Preise für RTX-5080 und RTX-5090 sowie 32GB (2x16GB) DDR5 6000.

Open WebUI: Selbstgehostete LLM-Schnittstelle

Open WebUI ist eine leistungsstarke, erweiterbare und umfangreiche selbstgehostete Web-Schnittstelle zur Interaktion mit großen Sprachmodellen.

vLLM ist ein leistungsstarkes, speichereffizientes Inferenz- und Serving-Engine für Large Language Models (LLMs), entwickelt vom Sky Computing Lab der UC Berkeley.

DGX Spark AU-Preisgestaltung: 6.249–7.999 USD bei großen Einzelhändlern

Die NVIDIA DGX Spark (GB10 Grace Blackwell) ist in Australien bei großen PC-Händlern mit lokaler Lagerbestellung erhältlich. Wenn Sie die globalen Preise und die Verfügbarkeit des DGX Spark verfolgt haben, werden Sie wissen wollen, dass die Preise in Australien je nach Speicherkonfiguration und Händler zwischen 6.249 und 7.999 AUD liegen.

Selbsthosting von Cognee: Auswahl des LLM mit Ollama

Cognee ist ein Python-Framework zur Erstellung von Wissensgraphen aus Dokumenten mithilfe von LLMs. Funktioniert es jedoch mit selbstgehosteten Modellen?

Die Wahl des richtigen LLM für Cognee: Lokale Ollama-Installation

Die Wahl des Besten LLM für Cognee erfordert das Ausbalancieren von Graph-Qualität, Halluzinationsraten und Hardware-Beschränkungen.
Cognee leistet sich besonders gut mit größeren, niedrig-halluzinierenden Modellen (32B+) über Ollama, doch mittelgroße Optionen sind für leichtere Systeme geeignet.

Verwendung der Ollama Web Search API in Python

Ollamas Python-Bibliothek umfasst nun native OLlama Websuche-Funktionen. Mit nur wenigen Codezeilen können Sie Ihre lokalen LLMs mit Echtzeitinformationen aus dem Web erweitern, um Halluzinationen zu reduzieren und die Genauigkeit zu verbessern.

Die Wahl der richtigen Vektordatenbank kann den Erfolg oder Misserfolg Ihrer RAG-Anwendung in Bezug auf Leistung, Kosten und Skalierbarkeit bestimmen. Dieser umfassende Vergleich deckt die beliebtesten Optionen für 2024–2025 ab.

Verwendung der Ollama Web Search API in Go

Ollamas Web-Search-API ermöglicht es Ihnen, lokale LLMs mit Echtzeit-Webinformationen zu erweitern. Diese Anleitung zeigt Ihnen, wie Sie Web-Suchfunktionen in Go implementieren, von einfachen API-Aufrufen bis hin zu vollwertigen Suchagenten.

RAM-Preisanstieg: Bis zu 619 % im Jahr 2025

Der Speichermarkt erlebt Ende 2025 eine beispiellose Preisschwankung, bei der die RAM-Preise in allen Segmenten dramatisch gestiegen sind.

Ollama vs. vLLM vs. LM Studio: Der beste Weg, LLMs 2026 lokal zu betreiben?

Das lokale Ausführen von LLMs ist jetzt für Entwickler, Startups und sogar Enterprise-Teams praktisch geworden.
Aber die Wahl des richtigen Tools — Ollama, vLLM, LM Studio, LocalAI oder andere — hängt von Ihren Zielen ab:

Preise für NVIDIA RTX 5080 und RTX 5090 in Australien – November 2025

Vergleichen wir die Preise für Spitzen-Grafikkarten für Endverbraucher, die insbesondere für LLMs und KI im Allgemeinen geeignet sind. Genauer gesagt schaue ich mir die Preise für RTX-5080 und RTX-5090 an.

Die Demokratisierung der KI ist da. Mit Open-Source-LLMs wie Llama, Mistral und Qwen, die nun proprietäre Modelle herausfordern, können Teams eine leistungsstarke KI-Infrastruktur mit Consumer-Hardware aufbauen – und dabei die Kosten drastisch senken, während sie die vollständige Kontrolle über Datenschutz und Bereitstellung behalten.

Prometheus-Monitoring: Komplette Einrichtung & Best Practices

Prometheus ist zum de facto Standard für die Überwachung cloud-nativer Anwendungen und Infrastruktur geworden und bietet Metriken-Sammlung, Abfragen und Integration mit Visualisierungstools.

Grafana auf Ubuntu installieren und verwenden: Komplettanleitung

Grafana ist die führende Open-Source-Plattform für Überwachung und Observability, die Metriken, Protokolle und Spuren in handlungsorientierte Erkenntnisse durch beeindruckende Visualisierungen umwandelt.

StatefulSets & Persistente Speicherung in Kubernetes

Kubernetes StatefulSets sind die optimale Lösung für die Verwaltung von zustandsbehafteten Anwendungen, die stabile Identitäten, dauerhafte Speicherung und geordnete Bereitstellungsmuster benötigen – essenziell für Datenbanken, verteilte Systeme und Caching-Schichten.

Self-Hosting

GPU- und RAM-Preise in Australien steigen: RTX 5090 um 15 % erhöht, RAM um 38 % - Januar 2026

Open WebUI: Selbstgehostete LLM-Schnittstelle

vLLM Quickstart: Hochleistungs-LLM-Hosting – 2026

DGX Spark AU-Preisgestaltung: 6.249–7.999 USD bei großen Einzelhändlern

Selbsthosting von Cognee: Auswahl des LLM mit Ollama

Die Wahl des richtigen LLM für Cognee: Lokale Ollama-Installation

Verwendung der Ollama Web Search API in Python

Vergleich von Vektordatenbanken für RAG

Verwendung der Ollama Web Search API in Go

RAM-Preisanstieg: Bis zu 619 % im Jahr 2025

Ollama vs. vLLM vs. LM Studio: Der beste Weg, LLMs 2026 lokal zu betreiben?

Preise für NVIDIA RTX 5080 und RTX 5090 in Australien – November 2025

KI-Infrastruktur auf Consumer-Hardware

Prometheus-Monitoring: Komplette Einrichtung & Best Practices

Grafana auf Ubuntu installieren und verwenden: Komplettanleitung

StatefulSets & Persistente Speicherung in Kubernetes