Modo Router do Llama-Server - Comutação Dinâmica de Modelos Sem Reinícios
Servir e trocar LLMs sem reinícios.
Por muito tempo, o llama.cpp teve uma limitação gritante:
era possível servir apenas um modelo por processo, e a troca exigia uma reinicialização.