SelfHosting

GPUs para IA em 2026: NVIDIA, AMD e Intel Comparadas

O cenário do hardware de IA mudou significativamente em 2026, com NVIDIA, AMD e Intel competindo por desenvolvedores que necessitam de GPUs capazes de executar modelos de linguagem grandes (LLMs) e cargas de trabalho de inferência de IA localmente.

Agente Hermes: Servidor Headless + Configuração de Área de Trabalho Remota

Executar o Hermes Agent em um servidor sem interface gráfica (headless) enquanto se conecta a partir de um cliente desktop em outra máquina requer dois processos de servidor e uma única conexão de cliente.

Execute o Docker Compose como um Serviço Linux com systemd

O Docker Compose em um servidor Linux deve iniciar na boot, parar limpaamente durante o desligamento e sobreviver a reinicializações sem intervenção manual.

Instalando o Docker no Ubuntu: APT, Snap, Rootless — Guia Completo 2026

Instalar o Docker no Ubuntu deveria ser simples, mas na prática, várias opções relacionadas ao Docker competem pelo mesmo nome de comando, cada uma com empacotamento, comportamento de atualização e implicações de segurança diferentes.

Solução de problemas do APT no Ubuntu: corrigir pacotes quebrados, retenções e erros de GPG

Falhas no APT são comuns em máquinas Ubuntu de longa duração e geralmente surgem após uma atualização de versão, uma mudança em repositórios de terceiros, a remoção de um PPA, a instalação manual de um .deb ou uma instalação de pacote interrompida.

Sistemas de Memória em Assistentes de IA

A memória transforma assistentes de reativos em persistentes, mas também é onde muitos sistemas se deterioram silenciosamente. Pesquisas argumentam que a divisão entre memória de curto e longo prazo já não é suficiente para a memória moderna de agentes; os SDKs da OpenAI e do LangGraph apontam para uma pilha mais simples — memória de trabalho, estado durável e recuperação.

OpenClaw vs Hermes Agent: Estrelas, Downloads e Uso em 2026

Frameworks de agentes de IA de código aberto estão explodindo em popularidade no GitHub. Dois projetos no centro do ecossistema de sistemas de IA auto-hospedados — OpenClaw e Hermes Agent — avançaram tanto que o resto do campo luta por um distante terceiro lugar.

Qwen 3.6 27B e 35B MTP versus Padrão em GPU de 16GB

Testei o desempenho da Decodificação Especulativa (Previsão de Múltiplos Tokens, MTP) nos modelos Qwen 3.6 27B e 35B em uma RTX 4080 com 16 GB de VRAM.

Descarregar todos os modelos do roteador llama.cpp sem reiniciar

o modo roteador do llama.cpp é uma das mudanças mais úteis no llama-server em anos. Ele finalmente oferece aos operadores de LLMs locais uma experiência de gerenciamento de modelos próxima do que as pessoas esperam do Ollama, mantendo o desempenho bruto e o controle de baixo nível que tornam o llama.cpp digno de uso em primeiro lugar.

Referência de Parâmetros de Inferência de LLMs Agentes para Qwen e Gemma

Esta página é uma referência prática para ajuste de inferência de LLMs agênicos (temperatura, top_p, top_k, penalidades e como elas interagem em fluxos de trabalho multi-step e com uso intenso de ferramentas).

Controle de Voz do Hermes pelo Seu Telefone

Você já conversa com o Hermes Agent pelo seu telefone usando texto. Agora você quer falar com ele diretamente e receber respostas faladas. Geralmente, essa é a melhor abordagem, especialmente se você já usa o Hermes como um assistente auto-hospedado persistente. Digitar prompts longos em uma tela pequena é lento e propenso a erros.

Kanban no Hermes Agent para Fluxos de Trabalho de LLMs Auto-Hospedados

O Hermes Agent vem com um quadro estilo Kanban e o Hermes Gateway, que podem saturar seu LLM auto-hospedado se muitas tarefas forem despachadas de uma só vez.

Criação de Habilidades do Agente Hermes — Estrutura e Melhores Práticas do SKILL.md

O Hermes Agent trata skills (habilidades) como a forma padrão de ensinar fluxos de trabalho repetíveis. A documentação oficial descreve-os como documentos de conhecimento sob demanda, alinhados com a especificação aberta agentskills.io, carregados através de revelação progressiva para que o modelo veja primeiro um índice pequeno e só carregue as instruções completas quando uma tarefa realmente precisar delas.

Resumo de atalhos do Hermes Agent CLI — comandos, sinalizadores e atalhos de barra

O Hermes Agent da Nous Research é um assistente agnóstico ao modelo e utilizador de ferramentas que você executa localmente ou em um VPS.

MinIO CE em 2026: upstream descontinuado, apenas código-fonte e o que usar

A MinIO Community Edition não é mais uma opção padrão segura para novos sistemas em produção.

Memória de Sistemas de IA — Conhecimento Persistente e Memória de Agentes

Esta seção reúne guias sobre conhecimento persistente e memória para sistemas de IA — como assistentes mantêm fatos, preferências e contexto distilado entre sessões, sem sobrecarregar um único prompt com todos os tokens. Aqui, memória refere-se à retenção intencional (fatos do usuário, resumos, armazenamentos suportados por plugins), não à memória RAM da GPU ou aos pesos do modelo.