RAG

Verlaag LLM-kosten: Tokenoptimalisatiestrategieën

Tokenoptimalisatie is de kritieke vaardigheid die het verschil maakt tussen kostenefficiënte LLM-toepassingen en kostbare experimenten.

HTML naar Markdown converteren met Python: een uitgebreid overzicht

HTML naar Markdown converteren is een fundamentele taak in moderne ontwikkelingsworkflows, vooral wanneer je webinhoud voor Large Language Models (LLMs), documentatiesystemen of statische sitegeneratoren zoals Hugo voorbereidt. Deze gids is onderdeel van onze Documentatie-tools in 2026: Markdown, LaTeX, PDF en printworkflows hub.

Go-clients voor Ollama: SDK-vergelijking en voorbeelden met Qwen3/GPT-OSS

Deze gids biedt een uitgebreid overzicht van beschikbare Go SDKs voor Ollama en vergelijkt hun functionaliteiten.

Hier is een vergelijking tussen Qwen3:30b en GPT-OSS:20b
met aandacht voor instructievolgzaamheid en prestatieparameters, specificaties en snelheid.

Ollama integreren met Python: REST API- en Python-clientvoorbeelden

In dit bericht gaan we twee manieren bespreken om je Python-toepassing te verbinden met Ollama: 1. Via de HTTP REST API; 2. Via de officiële Ollama Python-bibliotheek.

Gestructureerde vergelijking van uitvoer over populaire LLM-aanbieders - OpenAI, Gemini, Anthropic, Mistral en AWS Bedrock

Hier is een zij-aan-zij vergelijking van de ondersteuning voor gestructureerde uitvoer (het verkrijgen van betrouwbare JSON) bij populaire LLM-aanbieders, plus minimale Python-voorbeelden

Beperken van LLMs met gestructureerde uitvoer: Ollama, Qwen3 & Python of Go

Large Language Models (LLMs) zijn krachtig, maar in productie willen we zelden vrije tekst. In plaats daarvan willen we voorspelbare data: kenmerken, feiten of gestructureerde objecten die je kunt voeden in een app. Dat is LLM Structured Output.

Documenten herindexeren met Ollama en het Qwen3 Reranker-model - in Go

Omdat standaard Ollama geen directe rerank-API heeft, moet je reranking implementeren met Qwen3 Reranker in GO door embeddings te genereren voor query-documentparen en deze te scoren.

Reranking van teksten met Ollama en Qwen3 Embedding LLM - in Go

Deze kleine Reranking Go-codevoorbeeld roept Ollama aan om embeddings te genereren voor de query en voor elk kandidaatdocument, en sorteer deze vervolgens aflopend op cosijnsimilariteit.

Qwen3 Embedding- en Reranker-modellen op Ollama: State-of-the-Art-prestaties

De Qwen3 Embedding en Reranker-modellen zijn de nieuwste releases in de Qwen-familie, specifiek ontworpen voor geavanceerde tekst-inbedding (embedding), ophalen (retrieval) en her-ranking taken.

Voor een directe analoog van Beautiful Soup in Go, gebruik soup.
Voor ondersteuning van CSS-selectors, overweeg goquery.
Voor XPath-query’s, gebruik htmlquery.
Voor een ander Beautiful Soup-inspiratieoptie, kijk naar Node.

Als je op zoek bent naar een Beautiful Soup equivalent in Go, bieden verschillende bibliotheken vergelijkbare functionaliteit voor het parsen en scannen van HTML:

Converteer HTML-inhoud naar Markdown met behulp van LLM en Ollama

In de Ollama modellenbibliotheek zijn er modellen die in staat zijn HTML-inhoud om te zetten in Markdown, wat handig is voor inhoudsconversietaken. Deze gids is onderdeel van onze Documentatie Tools in 2026: Markdown, LaTeX, PDF & Printing Workflows hub.

Het gebruik van LLMs is niet erg duur, er is mogelijk geen behoefte om een nieuw geweldige GPU aan te schaffen.
Hier is een lijst met LLM providers in de cloud met LLMs die ze hosten.

Wanneer de Ollama-server twee aanvragen tegelijkertijd ontvangt, hangt het gedrag ervan af van de configuratie en de beschikbare systeemresources.

DeepSeek’s eerste generatie redeneingsmodellen met vergelijkbare prestaties als OpenAI-o1, waaronder zes dichte modellen gedistilleerd van DeepSeek-R1 gebaseerd op Llama en Qwen.

Reranking is een tweede stap in Retrieval Augmented Generation (RAG) systemen, direct tussen het ophalen (Retrieving) en het genereren (Generating).

Verlaag LLM-kosten: Tokenoptimalisatiestrategieën

HTML naar Markdown converteren met Python: een uitgebreid overzicht

Go-clients voor Ollama: SDK-vergelijking en voorbeelden met Qwen3/GPT-OSS

Vergelijking: Qwen3:30b vs GPT-OSS:20b

Ollama integreren met Python: REST API- en Python-clientvoorbeelden

Gestructureerde vergelijking van uitvoer over populaire LLM-aanbieders - OpenAI, Gemini, Anthropic, Mistral en AWS Bedrock

Beperken van LLMs met gestructureerde uitvoer: Ollama, Qwen3 & Python of Go

Documenten herindexeren met Ollama en het Qwen3 Reranker-model - in Go

Reranking van teksten met Ollama en Qwen3 Embedding LLM - in Go

Qwen3 Embedding- en Reranker-modellen op Ollama: State-of-the-Art-prestaties

Alternatieven voor Beautiful Soup in Go

Converteer HTML-inhoud naar Markdown met behulp van LLM en Ollama

Cloud LLM-aanbieders

Hoe Ollama Parallel Verzoeken Behandelt

Testen van Deepseek-R1 op Ollama

Reranking met embeddingmodellen