Speicherzuordnung und Modellscheduling in der neuen Ollama-Version – v0.12.1
Meine eigene Testung der ollama-Modellplanung
Hier vergleiche ich, wie viel VRAM die neue Version von Ollama für das Modell allokiert wie viel VRAM neue Version von Ollama für das Modell allokiert
im Vergleich zur vorherigen Ollama-Version. Die neue Version ist schlechter.