Ollama i Docker Compose med GPU och bestående modelllagring

Ollama i Docker Compose med GPU och bestående modelllagring

Ollama-server med komposition i förgrunden, GPU och uthållighet.

Ollama fungerar utmärkt på “bare metal”. Det blir ännu mer intressant när du behandlar det som en tjänst: en stabil slutpunkt, fastlagda versioner, beständig lagring och en GPU som antingen är tillgänglig eller inte.

Netlify för Hugo och statiska sajter: priser, gratisnivå och alternativ

Netlify för Hugo och statiska sajter: priser, gratisnivå och alternativ

Git-baserade deployment, CDN, krediter och avvägningar.

Netlify är ett av de mest utvecklarvänliga sätten att leverera Hugo-sajter och moderna webbappar med ett arbetsflöge av produktionskvalitet: förhandsvisnings-URL:ar för varje pull request, atomiska leveranser, en global CDN samt valbara serverless- och edge-funktioner.

Llama.swap Modellväxlar – Snabbstart för lokala, OpenAI-kompatibla LLM:ar

Llama.swap Modellväxlar – Snabbstart för lokala, OpenAI-kompatibla LLM:ar

Byt lokala LLM:ar utan att ändra klienterna.

Snart kastar du mellan vLLM, llama.cpp och mer – varje stack på sin egen port. Allt nedströms vill fortfarande ha en enda bas-URL /v1; annars fortsätter du att shuffla med portar, profiler och skript för enskilda fall. llama-swap är /v1-proxyn som ligger framför dessa stackar.

Prenumerera

Få nya inlägg om system, infrastruktur och AI-ingenjörskonst.