AI

Modellrouting: Stop met het gebruik van één model voor alles

Modellrouting: Stop met het gebruik van één model voor alles

Het juiste model voor de juiste taak.

Het draaien van een model met 70 miljard parameters om een e-mail van 200 woorden samen te vatten, is zonde van de middelen. Het gebruiken van een model van 3 miljard parameters om productiecode te reviewen, is roekeloos. De meeste systemen zitten ergens daar tussenin — en daar komt modelrouting om de hoek kijken.

Geheugensystemen in AI-assistenten

Geheugensystemen in AI-assistenten

Werkend, gestructureerd en ophaalbaar geheugen voor assistenten.

Geheugen verandert assistenten van reactief naar persistent, maar het is ook waar veel systemen stil verlopen. Onderzoeken betoogen dat de splitsing tussen kortetermijn- en langetermijngeheugen niet langer voldoende is voor modern agentengeheugen; OpenAI en LangGraph SDK’s wijzen op een eenvoudigere stack — werkgeheugen, duurzame staat en ophaling.

LLM Wiki - Samengestelde kennis die RAG niet kan vervangen

LLM Wiki - Samengestelde kennis die RAG niet kan vervangen

Gecompileerde kennis voor AI-systemen

De uitgangspunt is eenvoudig: gecompileerde kennis is herbruikbaarder dan opgeroepen fragmenten. RAG (Retrieval-Augmented Generation) is het standaardantwoord geworden op een eenvoudige vraag – hoe geef ik een LLM (Large Language Model) toegang tot externe kennis?

Validatie van gestructureerde LLM-output in Python die stand houdt

Validatie van gestructureerde LLM-output in Python die stand houdt

Stop met het interpreteren van vibes. Valideer contracten.

De meeste tutorials over “gestructureerde output” van GPT-modellen (LLM’s) zijn niet serieus. Ze leren je beleefd om JSON te vragen en hopen daarna dat het model zich gedraagt. Dat is geen validatie. Dat is optimisme met accolades.