LLM

Användning av LLM:er är inte särskilt kostsam, det kan inte behövas köpa nya fantastiska GPU:er. Här är en lista över LLM-leverantörer i molnet med LLM:er de värdar.

Test: Hur Ollama använder Intel CPU-prestanda och effektiva kärnor

Jag har en teori att testa – om man använder alla kärnor på Intel CPU skulle det öka hastigheten hos LLMs? Det är irriterande att den nya gemma3 27-bit model (gemma3:27b, 17GB på ollama) inte passar in i min GPU:s 16GB VRAM och delvis kör på CPU.

Jämförelse av NVidia GPU-lämplighet för AI

I mitt håll i den moderna världens kaos här är jag jämförande tekniska specifikationer av olika kort som är lämpliga för AI uppgifter (Deep Learning, Objektidentifiering och LLM). De är alla otroligt dyra dock.

Hur Ollama hanterar parallella begäranden

När Ollama-servern får två begäranden samtidigt, beror dess beteende på dess konfiguration och tillgängliga systemresurser.

Vad är Vibe Coding? Betydelse, verktyg, fördelar och risker 2026

Vibe coding är ett AI-drivet programmeringssätt där utvecklare beskriver önskad funktionalitet på naturligt språk och låter AI-verktyg generera koden automatiskt – med minimal direkt kodning.

DeepSeek’s första generation av resonemodeller med jämförbar prestanda med OpenAI-o1, inklusive sex tätmodeller distillerade från DeepSeek-R1 baserade på Llama och Qwen.

Denna Ollama CLI-snabbkurs fokuserar på kommandon du använder varje dag (ollama ls, ollama serve, ollama run, ollama ps, hantering av modeller och vanliga arbetsflöden), med exempel du kan kopiera och klistra in.

Inte för länge sedan släpptes. Låt oss uppdatera och
testa hur Mistral Small presterar jämfört med andra LLMs.

Reranking är ett andra steg i Retrieval Augmented Generation (RAG) system, precis mellan hämtning (Retrieving) och generering (Generating).

Nyligen publicerade Black Forest Labs en uppsättning text-till-bild AI-modeller. Dessa modeller sägs ha mycket högre utdata kvalitet. Låt oss prova dem

Underbar mat är också en njutning för ögonen. Men i detta inlägg jämför vi två AI-baserade söksystem, Farfalle och Perplexica.

Det är väldigt spännande! Istället för att ringa Copilot eller perplexity.ai och berätta för hela världen vad du letar efter, kan du nu värdshålla en liknande tjänst på din egen PC eller bärbara dator!

Nyligen har vi sett flera nya LLM:er släppas. Spännande tider. Låt oss testa och se hur de presterar när de upptäcker logiska fall.

Även om det finns några vanliga metoder för att skriva bra instruktioner så att LLM inte blir förvirrad när den försöker förstå vad du vill ha av den.

Jämförelse av LLM:s sammanfattningsförmåga

Testa hur modeller med olika antal parametrar och kvantisering beter sig.

Efter att ha installerat Ollama är det bättre att omedelbart omkonfigurera Ollama så att den lagrar modellerna på en ny plats. Så när vi drar ner en ny modell, laddas den inte ner till den gamla platsen.

molntjänstleverantörer för LLM

Test: Hur Ollama använder Intel CPU-prestanda och effektiva kärnor

Jämförelse av NVidia GPU-lämplighet för AI

Hur Ollama hanterar parallella begäranden

Vad är Vibe Coding? Betydelse, verktyg, fördelar och risker 2026

Testa Deepseek-R1 på Ollama

Ollama-kommandoskivsnabbhänvisning: ls, serve, run, ps + kommandon (uppdatering 2026)

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 och Phi - LLM-test

Omranking med inbäddningsmodeller

Flux text-till-bild AI-modell

Farfalle jämfört med Perplexica

Självhyst Perplexica – med Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Att skriva effektiva promptar för LLMs

Jämförelse av LLM:s sammanfattningsförmåga

Flytta Ollama-modeller till en annan plats