LLM

Użycie modeli językowych dużych (LLM) nie jest bardzo drogie, może nie być potrzeby zakupu nowego, wspaniałego GPU.
Oto lista, jeśli dostawcy LLM w chmurze z LLM, które hostują.

Test: Jak Ollama wykorzystuje wydajność i efektywne jądra procesora Intel

Mam teorię do przetestowania – czy wykorzystanie Wszystkich rdzeni na procesorze Intel podniesie prędkość LLM? Zdenerwuje mnie fakt, że nowy model gemma3 27 bit (gemma3:27b, 17GB na ollama) nie mieści się w 16GB VRAM mojej karty graficznej, a częściowo działa na procesorze.

Porównanie odpowiedniości GPU NVidia do AI

Wśród burzy współczesnego świata tutaj porównuję specyfikacje techniczne różnych kart odpowiednich do zadań AI
(uczenia głębokiego,
wykrywania obiektów
i modeli językowych).
Są one jednak ogromnie drogie.

Gdy serwer Ollama otrzymuje dwa żądania jednocześnie, jego zachowanie zależy od konfiguracji i dostępnych zasobów systemowych.

Czym jest Vibe Coding? Znaczenie, narzędzia, korzyści i ryzyka w 2026 roku.

Vibe coding to napędzane przez sztuczną inteligencję podejście do programowania, w którym deweloperzy opisują pożądaną funkcjonalność w języku naturalnym, a narzędzia AI automatycznie generują kod – przy minimalnym bezpośrednim pisaniu.

Modeli DeepSeek pierwszego pokolenia z wydajnością porównywalną do modeli OpenAI-o1, w tym sześć gęstych modeli oddestylowanych z DeepSeek-R1 opartych na Llama i Qwen.

Ten ściągawka CLI Ollama skupia się na poleceniach, których używasz na co dzień (ollama ls, ollama serve, ollama run, ollama ps, zarządzanie modelami i typowe przepływy pracy), wraz z przykładami do kopiowania i wklejenia.

Nieco wcześniej wydano. Przejdźmy do sprawy i
testuj jak Mistral Small radzi sobie w porównaniu do innych LLM.

Reranking to drugi krok w systemach RAG (Retrieval Augmented Generation), znajdujący się bezpośrednio między pobieraniem (Retrieving) a generowaniem (Generating).

Niedawno Black Forest Labs opublikowała zestaw modeli AI tekst-do-obrazu text-to-image AI models.
Te modele mają być znane z znacznie wyższej jakości wyjściowych obrazów.
Spróbujmy ich

Wspaniałe jedzenie to również przyjemność dla oczu. Ale w tym poście porównamy dwa systemy wyszukiwania oparte na AI: Farfalle i Perplexica.

To jest bardzo ekscytujące! Zamiast korzystać z Copilota lub perplexity.ai i informować cały świat o swoich potrzebach, możesz teraz hostować podobną usługę na własnym komputerze lub laptopie!

Niedawno widzieliśmy kilka nowych LLM, które zostały wydane. Wspaniałe czasy. Zróbmy test i zobaczmy, jak działają, gdy wykrywają błędy logiczne.

Nadal istnieją pewne powszechne podejścia do pisania dobrych promptów, dzięki czemu LLM nie będzie się pogubił, próbując zrozumieć, czego od niego oczekujesz.

Testowanie zachowania modeli o różnej liczbie parametrów i różnym stopniu kwantyzacji.

Po zainstalowaniu Ollama lepiej jest od razu skonfigurować Ollama tak, aby przechowywał je w nowej lokalizacji. Dzięki temu po pociągnięciu nowego modelu nie zostanie on pobrany do starego miejsca.

Dostawcy LLM w chmurze

Test: Jak Ollama wykorzystuje wydajność i efektywne jądra procesora Intel

Porównanie odpowiedniości GPU NVidia do AI

Jak Ollama Obsługuje Wątki Równoległe

Czym jest Vibe Coding? Znaczenie, narzędzia, korzyści i ryzyka w 2026 roku.

Testowanie Deepseek-R1 na Ollama

Skrót komend Ollama CLI: ls, serve, run, ps i inne (aktualizacja 2026)

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 i Phi – test modeli językowych

Ponowne rankowanie za pomocą modeli osadzeń

Model AI Flux tekst na obraz

Farfalle kontra Perplexica

Hostowanie Perplexica z wykorzystaniem Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Napisywanie skutecznych promptów dla LLMs

Porównanie możliwości skracania LLM

Przeniesienie modeli Ollama do innego lokalizacji