AI - Page 2 - Rost Glukhov | Persoonlijke website en technische blog

Verlaag LLM-kosten: Tokenoptimalisatiestrategieën

Tokenoptimalisatie is de kritieke vaardigheid die het verschil maakt tussen kostenefficiënte LLM-toepassingen en kostbare experimenten.

MCP-servers bouwen in Python: WebSearch & Scrape gids

De Model Context Protocol (MCP) is revolutionair voor de manier waarop AI-assistenten met externe gegevensbronnen en tools interacteren. In deze gids bespreken we hoe je MCP-servers in Python kunt bouwen, met voorbeelden gericht op webzoekfuncties en web scraping.

Gestructureerde vergelijking van uitvoer over populaire LLM-aanbieders - OpenAI, Gemini, Anthropic, Mistral en AWS Bedrock

Hier is een zij-aan-zij vergelijking van de ondersteuning voor gestructureerde uitvoer (het verkrijgen van betrouwbare JSON) bij populaire LLM-aanbieders, plus minimale Python-voorbeelden

Beperken van LLMs met gestructureerde uitvoer: Ollama, Qwen3 & Python of Go

Large Language Models (LLMs) zijn krachtig, maar in productie willen we zelden vrije tekst. In plaats daarvan willen we voorspelbare data: kenmerken, feiten of gestructureerde objecten die je kunt voeden in een app. Dat is LLM Structured Output.

GitHub Copilot CheatSheet - Beschrijving en nuttige opdrachten

Hier is een up-to-date GitHub Copilot cheat sheet, die essentiële snelkoppelingen, opdrachten, gebruikstips en contextfuncties voor Visual Studio Code en Copilot Chat behandelt

Populariteit van programmeertalen en softwareontwikkelings-tools

Het Pragmatic Engineer letter verscheen een paar dagen geleden met een enquête over de populariteit van programmeertalen, IDEs, AI-tools en andere gegevens voor het midden van 2025.

NVIDIA DGX Spark – een nieuwe, compacte AI-supercomputer

Nvidia staat op het punt om de NVIDIA DGX Spark uit te brengen: een klein AI-supercomputerapparaat gebaseerd op de Blackwell-architectuur, met meer dan 128 GB unified RAM en een AI-prestatie van 1 PFLOPS. Een leuk apparaat om LLM’s op uit te voeren.

Model Context Protocol (MCP), en aantekeningen over het implementeren van een MCP-server in Go

Hier hebben we een beschrijving van het Model Context Protocol (MCP), korte aantekeningen over hoe je een MCP-server in Go kunt implementeren, inclusief berichtstructuur en protocolespecificaties.

Documenten herindexeren met Ollama en het Qwen3 Reranker-model - in Go

Omdat standaard Ollama geen directe rerank-API heeft, moet je reranking implementeren met Qwen3 Reranker in GO door embeddings te genereren voor query-documentparen en deze te scoren.

Op een koude winterdag in juli … dat is in Australië … had ik plotseling het gevoel om een AI-model te trainen voor het detecteren van ongedekte betonversterkbalken…

Reranking van teksten met Ollama en Qwen3 Embedding LLM - in Go

Deze kleine Reranking Go-codevoorbeeld roept Ollama aan om embeddings te genereren voor de query en voor elk kandidaatdocument, en sorteer deze vervolgens aflopend op cosijnsimilariteit.

Qwen3 Embedding- en Reranker-modellen op Ollama: State-of-the-Art-prestaties

De Qwen3 Embedding en Reranker-modellen zijn de nieuwste releases in de Qwen-familie, specifiek ontworpen voor geavanceerde tekst-inbedding (embedding), ophalen (retrieval) en her-ranking taken.

Vibe coding is een AI-gestuurde programmeerbenadering waarbij ontwikkelaars gewenste functionaliteit beschrijven in natuurlijke taal, waardoor AI-tools automatisch code kunnen genereren.

MMdetection wordt niet langer ondersteund

Ik heb MMDetection (mmengine, mdet, mmcv) vrij veel gebruikt,
en nu lijkt het erop dat het niet meer in gebruik is.
Dat is jammer. Ik vond de modelzoo leuk.

Recentie Black Forest Labs heeft een set van tekst-naar-afbeelding AI-modellen gepubliceerd. Deze modellen worden gezegd te hebben veel hogere uitvoerkwaliteit. Laten we ze uitproberen

Prachtige voedsel is ook een genot voor de ogen. Maar in dit bericht vergelijken we twee AI-gebaseerde zoeksystemen, Farfalle en Perplexica.

AI

Verlaag LLM-kosten: Tokenoptimalisatiestrategieën

MCP-servers bouwen in Python: WebSearch & Scrape gids

Gestructureerde vergelijking van uitvoer over populaire LLM-aanbieders - OpenAI, Gemini, Anthropic, Mistral en AWS Bedrock

Beperken van LLMs met gestructureerde uitvoer: Ollama, Qwen3 & Python of Go

GitHub Copilot CheatSheet - Beschrijving en nuttige opdrachten

Populariteit van programmeertalen en softwareontwikkelings-tools

NVIDIA DGX Spark – een nieuwe, compacte AI-supercomputer

Model Context Protocol (MCP), en aantekeningen over het implementeren van een MCP-server in Go

Documenten herindexeren met Ollama en het Qwen3 Reranker-model - in Go

Objectdetectie met Tensorflow

Reranking van teksten met Ollama en Qwen3 Embedding LLM - in Go

Qwen3 Embedding- en Reranker-modellen op Ollama: State-of-the-Art-prestaties

Vibe Coding - Betekenis en Omschrijving

MMdetection wordt niet langer ondersteund

Flux tekst naar afbeelding AI-model

Farfalle vs Perplexica