Rost Glukhov | Personlig webbplats och teknisk blogg

Ollama bakom en omvänd proxy med Caddy eller Nginx för HTTPS-strömning

Att köra Ollama bakom en omvänd proxy är det enklaste sättet att få HTTPS, valfri åtkontroll och förutsägbart strömmande beteende.

Textinbäddningar för RAG och sökning – Python, Ollama, OpenAI-kompatibla API:er

Om du arbetar med retrieval-augmented generation (RAG), går detta avsnitt igenom textembeddings i enkla termer – vad de är, hur de passar in i sökning och hämtning, och hur du anropar två vanliga lokala konfigurationer från Python med hjälp av Ollama eller en OpenAI-kompatibel HTTP-API (vilket många llama.cpp-baserade servrar exponerar).

Netlify för Hugo och statiska sajter: priser, gratisnivå och alternativ

Netlify är ett av de mest utvecklarvänliga sätten att leverera Hugo-sajter och moderna webbappar med ett arbetsflöge av produktionskvalitet: förhandsvisnings-URL:ar för varje pull request, atomiska leveranser, en global CDN samt valbara serverless- och edge-funktioner.

Apache Flink på K8s och Kafka: PyFlink, Go, drift och hanterad prissättning

Apache Flink är ett ramverk för statusbevarande beräkningar över obegränsade och begränsade dataströmmar.

Neo4j-grafdatabas för GraphRAG, installation, Cypher, vektorer och drift.

Neo4j är det verktyg du vänder dig till när relationerna är datan. Om din domän ser ut som en whiteboard med cirklar och pilar blir det smärtsamt att tvinga den in i tabeller.

Värdade e-posttjänster för egna domäner jämförda: Workspace, Microsoft 365, Zoho, Proton och WorkMail.

Att ha e-post på din egen domän låter som en veckoslutsuppgift för DNS. I praktiken är det ett litet distribuerat system med ett arvtal som är tjugo år gammalt.

IndexNow förklarat – meddela sökmotorer när du publicerar

Statiska webbplatser och bloggar ändras när du deployar. Sökmotorer som stöder IndexNow kan få veta om dessa förändringar utan att vänta på nästa blind krypning.

SGLang-Start: Installera, konfigurera och servera LLM via OpenAI API

SGLang är ett högpresterande ramverk för servering av stora språkmodeller och multimodala modeller, byggt för att leverera inferens med låg latens och hög genomströmning över allt från en enda GPU till distribuerade kluster.

Llama.swap Modellväxlar – Snabbstart för lokala, OpenAI-kompatibla LLM:ar

Snart kastar du mellan vLLM, llama.cpp och mer – varje stack på sin egen port. Allt nedströms vill fortfarande ha en enda bas-URL /v1; annars fortsätter du att shuffla med portar, profiler och skript för enskilda fall. llama-swap är /v1-proxyn som ligger framför dessa stackar.

Apache Kafka Snabbstart – Installera Kafka 4.2 med CLI och lokala exempel

Apache Kafka 4.2.0 är den aktuella supportade utgåvelinjen, och den utgör den bästa basen för ett modernt snabbstartsguide eftersom Kafka 4.x är helt utan ZooKeeper och bygger på KRaft som standard.

Oh My Opencode-granskning: Ärliga resultat, faktureringsrisker och när det är värt det

Oh My Opencode lovar om ett “virtuellt AI-utvecklingsteam” — där Sisyphus dirigerar specialister, uppgifter körs parallellt och magiska nyckelordet ultrawork aktiverar allt.

Oh My Opencode Snabbstart för OpenCode: Installera, Konfigurera och Kör

Oh My Opencode gör OpenCode till en multi-agent kodningsplattform: en orkestrator delegerar arbete till specialiserade agenter som kör parallellt.

Bästa LLM:er för OpenCode – Från Gemma 4 till Qwen 3.6, testat lokalt

Jag har testat hur OpenCode fungerar med flera lokalt körda LLM:er på Ollama och llama.cpp, och för jämförelsens skull har jag även lagt till några kostnadsfria modeller från OpenCode Zen.

En djupdykning och modellguide för Oh My Opencode:s specialiserade agenter

Det största kapacitetsspranget i OpenCode kommer från specialiserade agenter: en medveten separering av orkestrering, planering, exekvering och forskning.

OpenHands Coding Assistant – Snabbstart: Installation, CLI-flaggor och exempel

OpenHands är en öppen källkodsplattform som är modellagnostisk för AI-drivna agenter för mjukvaruutveckling. Den låter en agent bete sig mer som en kodpartner än ett enkelt verktyg för automatisk komplettering.

LocalAI QuickStart: Kör OpenAI-kompatibla LLMs lokalt

LocalAI är en självhostad, lokal-först inferensserver designad för att bete sig som en drop-in OpenAI API för att köra AI-arbetsbelastningar på din egen hårdvara (bärbar dator, arbetsstation eller on-prem-server).

Prenumerera