Przydzielanie pamięci i harmonogramowanie modeli w nowej wersji Ollama - v0.12.1
Moje własne testy harmonogramowania modeli ollama
Oto porównanie jak dużo VRAM nowa wersja Ollama przydziela modelowi z poprzednią wersją Ollama. Nowa wersja jest gorsza.