DevOps

Arkitektur för AI-assistent: LLM, minne, verktyg, routing, observabilitet

Arkitektur för AI-assistent: LLM, minne, verktyg, routing, observabilitet

Så allvarliga assistenter faktiskt byggs.

En produktionsklar AI-assistent är inte “en LLM med en prompt”. Det är ett system som tar emot avsikt, behåller tillstånd, beslutar när det ska hämta information eller utföra åtgärder, och exponerar tillräckligt med detaljer om körningen för att kunna felsöka fel.

Avladda alla llama.cpp-routermodeller utan att starta om

Avladda alla llama.cpp-routermodeller utan att starta om

Frigör VRAM utan att stoppa llama-server.

Routerläge för llama.cpp är en av de mest användbara förändringarna i llama-server på flera år. Det ger slutligen lokala aktörer av LLM (Large Language Models) något som liknar modellhanteringsupplevelsen som man förväntar sig från Ollama, samtidigt som det behåller den råa prestanda och den lågnivåkontroll som gör llama.cpp värd att använda i första hand.

Hermes AI-assistent – installation, konfiguration, arbetsflöden och felsökning

Hermes AI-assistent – installation, konfiguration, arbetsflöden och felsökning

Hermes Agent: installation och snabbstart för utvecklare

Hermes Agent är en självhostad, modellagnostisk AI-assistent som körs på en lokal maskin eller en lågkostnadsvirtuell server (VPS), fungerar via terminal- och meddelandegränssnitt och förbättras över tid genom att omvandla upprepade uppgifter till återanvändbara färdigheter.

Ollama i Docker Compose med GPU och bestående modelllagring

Ollama i Docker Compose med GPU och bestående modelllagring

Ollama-server med komposition i förgrunden, GPU och uthållighet.

Ollama fungerar utmärkt på “bare metal”. Det blir ännu mer intressant när du behandlar det som en tjänst: en stabil slutpunkt, fastlagda versioner, beständig lagring och en GPU som antingen är tillgänglig eller inte.

Llama.swap Modellväxlar – Snabbstart för lokala, OpenAI-kompatibla LLM:ar

Llama.swap Modellväxlar – Snabbstart för lokala, OpenAI-kompatibla LLM:ar

Byt lokala LLM:ar utan att ändra klienterna.

Snart kastar du mellan vLLM, llama.cpp och mer – varje stack på sin egen port. Allt nedströms vill fortfarande ha en enda bas-URL /v1; annars fortsätter du att shuffla med portar, profiler och skript för enskilda fall. llama-swap är /v1-proxyn som ligger framför dessa stackar.

Utvecklarverktyg: Den kompletta guiden till moderna utvecklingsarbetsflöden

Utvecklarverktyg: Den kompletta guiden till moderna utvecklingsarbetsflöden

Utveckling av programvara involverar Git för versionskontroll, Docker för containerisering, bash för automatisering, PostgreSQL för databaser och VS Code för redigering — tillsammans med otaliga andra verktyg som avgör din produktivitet. Denna sida samlar de nödvändiga kommandoreferenserna, arbetsflödena och jämförelserna du behöver för att arbeta effektivt över hela utvecklingsstacken.