Modellrouting: Stop met het gebruik van één model voor alles

Modellrouting: Stop met het gebruik van één model voor alles

Het juiste model voor de juiste taak.

Het draaien van een model met 70 miljard parameters om een e-mail van 200 woorden samen te vatten, is zonde van de middelen. Het gebruiken van een model van 3 miljard parameters om productiecode te reviewen, is roekeloos. De meeste systemen zitten ergens daar tussenin — en daar komt modelrouting om de hoek kijken.

Geheugensystemen in AI-assistenten

Geheugensystemen in AI-assistenten

Werkend, gestructureerd en ophaalbaar geheugen voor assistenten.

Geheugen verandert assistenten van reactief naar persistent, maar het is ook waar veel systemen stil verlopen. Onderzoeken betoogen dat de splitsing tussen kortetermijn- en langetermijngeheugen niet langer voldoende is voor modern agentengeheugen; OpenAI en LangGraph SDK’s wijzen op een eenvoudigere stack — werkgeheugen, duurzame staat en ophaling.

Retrieval versus Representatie in Kennissystemen

Retrieval versus Representatie in Kennissystemen

Zoeken is geen kennisstructuur

De meeste moderne kennissystemen optimaliseren de terugwinning (retrieval), en dat is begrijpelijk. Zoeken is zichtbaar, eenvoudig te demonstreren en voelt magisch wanneer het werkt. Typ een vraag, krijg een antwoord.

LLM Wiki - Samengestelde kennis die RAG niet kan vervangen

LLM Wiki - Samengestelde kennis die RAG niet kan vervangen

Gecompileerde kennis voor AI-systemen

De uitgangspunt is eenvoudig: gecompileerde kennis is herbruikbaarder dan opgeroepen fragmenten. RAG (Retrieval-Augmented Generation) is het standaardantwoord geworden op een eenvoudige vraag – hoe geef ik een LLM (Large Language Model) toegang tot externe kennis?

Abonneren

Ontvang nieuwe berichten over systemen, infrastructuur en AI-engineering.