LLM Hosting

Docker Model Runner: Guia de Configuração do Tamanho do Contexto

A configuração de tamanhos de contexto no Docker Model Runner é mais complexa do que deveria.

Adicionando Suporte a GPU NVIDIA ao Docker Model Runner

Docker Model Runner é a ferramenta oficial da Docker para executar modelos de IA localmente, mas habilitar a aceleração de GPU da NVidia no Docker Model Runner requer configuração específica.

Apostila do Docker Model Runner: Comandos e Exemplos

Docker Model Runner (DMR) é a solução oficial do Docker para executar modelos de IA localmente, introduzida em abril de 2025. Esta lista de comandos essenciais fornece uma referência rápida para todos os comandos, configurações e melhores práticas.

Docker Model Runner vs Ollama (2026): Qual é Melhor para LLMs Locais?

Execução local de grandes modelos de linguagem (LLMs) tornou-se cada vez mais popular devido à privacidade, controle de custos e capacidades offline. O cenário mudou significativamente em abril de 2025, quando a Docker introduziu o Docker Model Runner (DMR), sua solução oficial para implantação de modelos de IA.

Clientes Go para o Ollama: comparação de SDKs e exemplos com Qwen3/GPT-OSS

Este guia oferece uma visão abrangente dos SDKs Go para Ollama e compara seus conjuntos de funcionalidades.

Integração do Ollama com Python: Exemplos de API REST e Cliente Python

Neste post, exploraremos duas maneiras de conectar sua aplicação Python ao Ollama: 1. Via API REST HTTP; 2. Via a biblioteca oficial Python do Ollama.

Enshittification do Ollama - os Primeiros Sinais

A Ollama tornou-se rapidamente uma das ferramentas mais populares para executar LLMs localmente.

Sua CLI simples e gestão de modelos simplificada tornaram-na uma opção preferencial para desenvolvedores que desejam trabalhar com modelos de IA fora da nuvem.

Interfaces de Chat para Instâncias Locais do Ollama

O Ollama hospedado localmente permite executar modelos de linguagem grandes na sua própria máquina, mas usá-lo via linha de comando não é amigável. Aqui estão vários projetos de código aberto que oferecem interfaces estilo ChatGPT que se conectam a uma instância local do Ollama.

Comparação da qualidade da tradução de páginas do Hugo - LLMs no Ollama

Neste teste, estou comparando como diferentes LLMs hospedados no Ollama traduzem páginas do Hugo de inglês para alemão.

Usar LLMs não é muito caro; pode ser que não haja necessidade de comprar uma nova GPU incrível. Abaixo está uma lista de provedores de LLM na nuvem com os LLMs que hospedam.

A primeira geração de modelos de raciocínio da DeepSeek com desempenho comparável ao OpenAI-o1, incluindo seis modelos densos destilados do DeepSeek-R1 com base em Llama e Qwen.

Este resumo de comandos da CLI do Ollama foca nos comandos que você usa todos os dias (ollama ls, ollama serve, ollama run, ollama ps, gerenciamento de modelos e fluxos de trabalho comuns), com exemplos que você pode copiar e colar.

Comida incrível é um prazer também para os seus olhos. Mas, neste post, compararemos dois sistemas de busca baseados em IA, Farfalle e Perplexica.

Isso é muito emocionante! Em vez de chamar o Copilot ou o Perplexity.ai e contar a todos o que você busca, agora você pode hospedar um serviço similar no seu próprio PC ou laptop!

Após instalar o Ollama, é melhor reconfigurar o Ollama para armazená-los em um novo local imediatamente. Assim, após baixar um novo modelo, ele não será baixado para o local antigo.

LLM Hosting

Docker Model Runner: Guia de Configuração do Tamanho do Contexto

Adicionando Suporte a GPU NVIDIA ao Docker Model Runner

Apostila do Docker Model Runner: Comandos e Exemplos

Docker Model Runner vs Ollama (2026): Qual é Melhor para LLMs Locais?

Clientes Go para o Ollama: comparação de SDKs e exemplos com Qwen3/GPT-OSS

Integração do Ollama com Python: Exemplos de API REST e Cliente Python

Enshittification do Ollama - os Primeiros Sinais

Interfaces de Chat para Instâncias Locais do Ollama

Comparação da qualidade da tradução de páginas do Hugo - LLMs no Ollama

Provedores de LLM na Nuvem

Testando o Deepseek-R1 no Ollama

Resumo de Comandos do Ollama CLI: ls, serve, run, ps + comandos (atualização de 2026)

Farfalle x Perplexica

Hospedagem própria do Perplexica - com Ollama

Mova os modelos do Ollama para uma localização diferente