AI - Page 2 - Rost Glukhov | Personlig webbplats och teknisk blogg

Minska LLM-kostnader: Strategier för tokenoptimering

Tokenoptimering är den kritiska färdigheten som skiljer kostnadseffektiva LLM-applikationer från budgetdrainande experiment.

Bygg MCP-servrar i Python: Guide för webbsökning och skrapning

Model Context Protocol (MCP) revolutionerar hur AI-assistenter interagerar med externa datorkällor och verktyg. I den här guiden kommer vi att utforska hur man bygger MCP servrar i Python, med exempel som fokuserar på webbsökning och skrapning.

Jämförelse av strukturerad utdata hos populära LLM-leverantörer - OpenAI, Gemini, Anthropic, Mistral och AWS Bedrock

Här är en sida vid sida jämförelse av stöd för strukturerad utdata (att få tillförlitligt JSON tillbaka) över populära LLM-leverantörer (https://www.glukhov.org/sv/llm-performance/benchmarks/structured-output-comparison-popular-llm-providers/ “strukturerad utdata över populära LLM-leverantörer”), plus minimala Python exempel

Begränsa LLMs med strukturerad utdata: Ollama, Qwen3 & Python eller Go

Stora språkmodeller (LLMs) är kraftfulla, men i produktion vill vi sällan ha fritt formulerade stycken. Istället vill vi ha förutsägbart data: attribut, fakta eller strukturerade objekt som du kan mata in i en app. Det är LLM Strukturerad Utdata.

GitHub Copilot Cheatsheet - Beskrivning och användbara kommandon

Här är en uppdaterad GitHub Copilot cheat sheet, som täcker viktiga genvägar, kommandon, användningstips och kontextfunktioner för Visual Studio Code och Copilot Chat

Populäritet hos programmeringsspråk och verktyg för mjukvaruutvecklare

The Pragmatic Engineer-nytt publicerade för några dagar sedan undersökningsstatistik om populariteten för programmeringsspråk, IDE:er, AI-verktyg och andra data för mitten av 2025.

NVIDIA DGX Spark – ny liten AI-superdator

Nvidia är på väg att släppa NVIDIA DGX Spark – en liten AI-superdator med Blackwell-arkitektur, 128+ GB enhetligt minne och 1 PFLOPS AI-prestation. En bra enhet att köra LLM på.

Modellkontextprotokoll (MCP) och anteckningar om implementering av MCP-server i Go

Här har vi en beskrivning av The Model Context Protocol (MCP), korta anteckningar om hur man implementerar en MCP-server i Go, inklusive meddelandestruktur och protokollspecificeringar.

Omrangering av dokument med Ollama och Qwen3 Reranker-modellen – i Go

Eftersom standard Ollama inte har en direkt rerank-API, behöver du implementera omrankning med Qwen3 Reranker i GO genom att generera inbäddningar (embeddings) för par av fråga-dokument och sedan betygsätta dem.

Omrankning av texter med Ollama och Qwen3 Embedding LLM – i Go

Detta lilla Reranking-kodexempel i Go anropar Ollama för att generera inbäddningar för frågan och för varje kandidatdokument, och sorterar sedan i fallande ordning baserat på kosinussimilaritet.

Qwen3-inbäddnings- och omklassificeringsmodeller på Ollama: branschledande prestanda

Qwen3-inkapslings- och omklassificeringsmodeller är de senaste tillägg i Qwen-familjen, specifikt utformade för avancerade uppgifter inom textinkapsling, hämtning och omklassificering (reranking).

Vibe kodning är en AI-driven programmeringsmetod där utvecklare beskriver önskad funktionalitet på naturligt språk, vilket tillåter AI-verktyg att generera kod automatiskt.

Jag har använt MMDetection (mmengine, mdet, mmcv), och nu ser det ut som att det är ur spel. Det är synd. Jag gillade deras modellzoo.

Nyligen publicerade Black Forest Labs en uppsättning text-till-bild AI-modeller. Dessa modeller sägs ha mycket högre utdata kvalitet. Låt oss prova dem

Läcker mat är också en njutning för ögonen. Men i den här posten kommer vi att jämföra två AI-baserade söksystem, Farfalle och Perplexica.

När jag började experimentera med LLMs var gränssnitten för dem i aktiv utveckling och nu är några av dem verkligen bra.

AI

Minska LLM-kostnader: Strategier för tokenoptimering

Bygg MCP-servrar i Python: Guide för webbsökning och skrapning

Jämförelse av strukturerad utdata hos populära LLM-leverantörer - OpenAI, Gemini, Anthropic, Mistral och AWS Bedrock

Begränsa LLMs med strukturerad utdata: Ollama, Qwen3 & Python eller Go

GitHub Copilot Cheatsheet - Beskrivning och användbara kommandon

Populäritet hos programmeringsspråk och verktyg för mjukvaruutvecklare

NVIDIA DGX Spark – ny liten AI-superdator

Modellkontextprotokoll (MCP) och anteckningar om implementering av MCP-server i Go

Omrangering av dokument med Ollama och Qwen3 Reranker-modellen – i Go

Omrankning av texter med Ollama och Qwen3 Embedding LLM – i Go

Qwen3-inbäddnings- och omklassificeringsmodeller på Ollama: branschledande prestanda

Vibe Coding - Betydelse och Beskrivning

MMdetection stöds inte längre

Flux text-till-bild AI-modell

Farfalle vs Perplexica

LLM-frontender