AI - Page 2 - Rost Glukhov | Persönliche Website und technischer Blog

RAG-Tutorial: Architektur, Implementierung und Produktionsleitfaden

Production-focused guide to building RAG systems: chunking, vector stores, hybrid retrieval, reranking, evaluation, and when to choose RAG over fine-tuning.

LLM-Hosting 2026: Lokale, selbstgehostete und Cloud-Infrastrukturen im Vergleich

Strategic guide to hosting large language models locally with Ollama, llama.cpp, vLLM, or in the cloud. Compare tools, performance trade-offs, and cost considerations.

A performance engineering hub for running LLMs efficiently: runtime behavior, bottlenecks, benchmarks, and the real constraints that shape throughput and latency.

Selbstgehostete LLMs ermöglichen die Kontrolle über Daten, Modelle und Inferenz – ein praktischer Weg zur AI-Souveränität für Teams, Unternehmen und Nationen.

Vergleich der Leistung von LLMs auf Ollama mit einer GPU mit 16 GB VRAM

Die Ausführung großer Sprachmodelle lokal bietet Ihnen Privatsphäre, die Möglichkeit, offline zu arbeiten, und null API-Kosten.
Dieser Benchmark zeigt genau, was man von 14 beliebten
LLMs auf Ollama auf einem RTX 4080 erwarten kann.

Top 17 trendige Python-Projekte auf GitHub

Das Python-Ökosystem wird diesen Monat von Claude Skills und KI-Agenten-Tools dominiert. Diese Übersicht analysiert die Top-Trend-Repositorien von Python auf GitHub.

Das Rust-Ökosystem erlebt einen Boom mit innovativen Projekten, insbesondere bei KI-Programmierwerkzeugen und Terminalanwendungen. Diese Übersicht analysiert die Top-Trending-Rust-Repositories auf GitHub dieses Monats.

Top 19 Trendige Go-Projekte auf GitHub - Januar 2026

Das Go-Ökosystem floriert weiterhin mit innovativen Projekten, die sich auf KI-Tools, selbstgehostete Anwendungen und Entwicklerinfrastruktur erstrecken. Diese Übersicht analysiert die Top-Trending-Go-Repositories auf GitHub diesen Monat.

Anaconda vs Miniconda vs Mamba Leitfaden

Dieser umfassende Leitfaden bietet Hintergrundinformationen und einen detaillierten Vergleich von Anaconda, Miniconda und Mamba - drei leistungsstarke Tools, die für Python-Entwickler und Datenwissenschaftler, die mit komplexen Abhängigkeiten und wissenschaftlichen Rechenumgebungen arbeiten, unverzichtbar geworden sind.

Open WebUI: Selbstgehostete LLM-Schnittstelle

Open WebUI ist eine leistungsstarke, erweiterbare und umfangreiche selbstgehostete Web-Schnittstelle zur Interaktion mit großen Sprachmodellen.

Tech-Events in Melbourne, die man 2026 besuchen sollte

Melbournes Tech-Community bleibt 2026 mit einem beeindruckenden Programm aus Konferenzen, Meetups und Workshops zu Themen wie Softwareentwicklung, Cloud Computing, KI, Cybersicherheit und aufstrebenden Technologien weiterhin lebendig.

vLLM ist ein leistungsstarkes, speichereffizientes Inferenz- und Serving-Engine für Large Language Models (LLMs), entwickelt vom Sky Computing Lab der UC Berkeley.

DGX Spark AU-Preisgestaltung: 6.249–7.999 USD bei großen Einzelhändlern

Die NVIDIA DGX Spark (GB10 Grace Blackwell) ist in Australien bei großen PC-Händlern mit lokaler Lagerbestellung erhältlich. Wenn Sie die globalen Preise und die Verfügbarkeit des DGX Spark verfolgt haben, werden Sie wissen wollen, dass die Preise in Australien je nach Speicherkonfiguration und Händler zwischen 6.249 und 7.999 AUD liegen.

Erkennung von AI-Slop: Techniken und Warnsignale

Die Verbreitung von KI-generierten Inhalten hat eine neue Herausforderung geschaffen: den Unterschied zwischen echter menschlicher Schrift und “AI slop” - niedrigwertigen, massenhaft produzierten synthetischen Texten - zu erkennen.

Selbsthosting von Cognee: Auswahl des LLM mit Ollama

Cognee ist ein Python-Framework zur Erstellung von Wissensgraphen aus Dokumenten mithilfe von LLMs. Funktioniert es jedoch mit selbstgehosteten Modellen?

BAML vs Instructor: Strukturierte LLM-Ausgaben

Wenn Sie mit Large Language Models in der Produktion arbeiten, ist es entscheidend, strukturierte, typensichere Ausgaben zu erhalten. Zwei beliebte Frameworks - BAML und Instructor - gehen unterschiedliche Wege, um dieses Problem zu lösen.

AI

RAG-Tutorial: Architektur, Implementierung und Produktionsleitfaden

LLM-Hosting 2026: Lokale, selbstgehostete und Cloud-Infrastrukturen im Vergleich

LLM-Leistung im Jahr 2026: Benchmarks, Engpässe und Optimierung

LLM-Selbsthosting und KI-Souveränität

Vergleich der Leistung von LLMs auf Ollama mit einer GPU mit 16 GB VRAM

Top 17 trendige Python-Projekte auf GitHub

Top 23 aktuelle Rust-Projekte auf GitHub – Januar 2026

Top 19 Trendige Go-Projekte auf GitHub - Januar 2026

Anaconda vs Miniconda vs Mamba Leitfaden

Open WebUI: Selbstgehostete LLM-Schnittstelle

Tech-Events in Melbourne, die man 2026 besuchen sollte

vLLM Quickstart: Hochleistungs-LLM-Hosting – 2026

DGX Spark AU-Preisgestaltung: 6.249–7.999 USD bei großen Einzelhändlern

Erkennung von AI-Slop: Techniken und Warnsignale

Selbsthosting von Cognee: Auswahl des LLM mit Ollama

BAML vs Instructor: Strukturierte LLM-Ausgaben