Assistente de IA Hermes - Instalação, Configuração, Fluxo de Trabalho e Solução de Problemas
Instalação e início rápido do Hermes Agent para desenvolvedores
O Hermes Agent é um assistente de IA auto-hospedado e agnóstico em relação ao modelo, que roda em uma máquina local ou em um VPS de baixo custo, opera através de interfaces de terminal e mensagens, e melhora com o tempo, transformando tarefas repetidas em habilidades reutilizáveis.
Ele é muito semelhante em funcionalidade ao OpenClaw, outro conjunto de assistentes auto-hospedados construído em torno de ferramentas, memória e controle local. Muitos desenvolvedores encontraram o Hermes após a Anthropic bloquear o acesso à assinatura do Claude pelo OpenClaw em abril de 2026 — o Cronologia da ascensão e queda do OpenClaw explica por que o Hermes emergiu como o destino natural para usuários que desejam automação persistente e auto-hospedada sem dependência de provedores.
Se você deseja uma visão mais ampla sobre assistentes auto-hospedados, recuperação e infraestrutura local em torno do Hermes, este panorama de sistemas de IA conecta esses tópicos aos mesmos problemas que o Hermes está tentando resolver.
Para compensações de implantação e escolhas de tempo de execução, Hospedagem de LLM em 2026: Local, Auto-Hospedado e Infraestrutura em Nuvem Comparados fornece o mapa de hospedagem, enquanto Desempenho de LLM em 2026: Benchmarks, Gargalos e Otimização cobre o lado do throughput e latência uma vez que o Hermes está em execução. Para um mapa compacto de comandos de shell (hermes gateway, hermes memory, hermes doctor, atalhos de barra e mais), use a Folha de Trapaça da CLI do Hermes Agent. Se seu principal ponto de entrada for mensagens em dispositivos móveis, use o Controle por Voz do Hermes do Seu Telefone para a pilha de voz e configuração específica da plataforma.

Minha opinião enviesada: o Hermes é mais interessante quando tratado como infraestrutura, não como uma aba que você abre ocasionalmente. Uma vez que ele roda como um serviço e tem um diretório de casa estável, seus prompts começam a parecer menos como “conversa” e mais como “operações”.
O que é o Hermes Agent e por que isso importa
O Hermes Agent é um agente de IA de código aberto construído pela Nous Research. Ele é projetado para rodar persistentemente, usar ferramentas (terminal, arquivos, web e mais) e melhorar seu próprio comportamento ao longo do tempo com um sistema de habilidades e memória.
Duas escolhas de design valem a pena ser explicitadas porque elas moldam tudo o resto neste guia.
Primeiro, o Hermes não está travado em um único provedor de modelos. O fluxo de configuração oficial suporta múltiplos provedores e qualquer endpoint compatível com a OpenAI, e a troca é feita via o comando hermes model em vez de edições de código.
Segundo, o Hermes traça uma linha dura entre “conversa” e “execução”. O agente pode falar o dia todo, mas quando precisa agir, o faz através de ferramentas explícitas e um backend de execução configurável. É aí que a segurança, reprodutibilidade e solução de problemas residem.
Custo e licenciamento são refrescantemente chatos. O próprio Hermes Agent é software livre sob a licença MIT. Se você usar modelos hospedados, o custo contínuo é o que seu provedor cobrar. Se você rodar modelos locais, pode evitar taxas de API inteiramente.
Se sua configuração do Hermes usa o Claude através de camadas de ferramentas externas, esta mudança na assinatura da Anthropic é uma referência útil sobre por que a faturamento baseado em API é agora o caminho esperado.
Instalar o Hermes Agent
O Hermes tem um caminho de instalação rápida para Linux, macOS e WSL2. A documentação oficial mantém a simplicidade intencional.
Instalação do Hermes no Linux
sudo apt-get update
sudo apt-get upgrade
sudo apt-get install curl git
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
Após a instalação, recarregue seu shell e inicie a CLI.
source ~/.bashrc # ou source ~/.zshrc
hermes
O instalador não é apenas um wrapper fino. De acordo com o guia de instalação, ele configura dependências, o repositório, um ambiente virtual e o comando hermes, levando você a um primeiro estado pronto para chat.
Notas para Windows e Android
Windows nativo não é suportado. A documentação recomenda o WSL2 e rodar o Hermes dentro dele.
Para Android, o Hermes suporta um caminho de instalação via Termux. Ele é projetado para detectar o Termux e adaptar sua configuração de dependências e ambiente conforme necessário.
Início Rápido
A primeira execução mais rápida é literalmente apenas hermes, mas um início rápido significativo significa duas decisões extras: qual provedor de modelo usar e quais ferramentas devem ser habilitadas.
Escolha um provedor e modelo
O Hermes expõe três pontos de entrada complementares:
hermes modelpara escolher um provedor e modelo padrãohermes toolspara habilitar ou desabilitar conjuntos de ferramentashermes setuppara executar um assistente interativo nas principais áreas de configuração
Um fluxo mínimo parece com isto:
hermes model
hermes tools
hermes
Em termos do que é realmente suportado, o Início Rápido oficial lista uma variedade de provedores e também destaca que o Hermes funciona com APIs compatíveis com a OpenAI. Isso importa porque inclui tanto serviços hospedados quanto endpoints auto-hospedados.
Comprove a execução de ferramentas cedo
Antes de criar hábitos em torno do Hermes, vale a pena verificar se o uso de ferramentas funciona em seu ambiente. O Início Rápido sugere explicitamente o uso do terminal como o primeiro recurso a tentar.
Na prática, um pequeno prompt de “teste de fumaça” faz dois trabalhos: verifica a ferramenta de terminal e valida os prompts de permissão.
Exemplo de prompt:
Mostre meu uso de disco e os cinco maiores diretórios.
Se o Hermes não conseguir rodar a ferramenta de terminal, pule para Solução de Problemas. A má configuração do backend do terminal é uma das causas mais comuns, e a correção geralmente é óbvia uma vez que você olha para a configuração.
Configuração que escala
O Hermes recompensa pessoas que entendem onde ele armazena estado e como resolve a configuração. Este também é o lugar de onde muitos problemas “funcionava ontem” surgem.
Onde a configuração e o estado vivem
O Hermes armazena suas configurações e estado sob ~/.hermes. O guia de configuração oficial documenta o layout, incluindo config.yaml para configurações, .env para segredos, auth.json para credenciais OAuth, SOUL.md para identidade, e pastas para memórias, habilidades, cron, sessões e logs.
Isso importa por duas razões.
- A depuração torna-se mecânica porque você sabe exatamente onde olhar.
- Os backups tornam-se diretos porque um único diretório captura a maior parte do estado do agente que lhe importa.
Precedência de configuração e mantendo segredos fora do config.yaml
O Hermes resolve a configuração com uma ordem de precedência. No topo estão as substituições da CLI, depois o config.yaml, depois o .env, com padrões internos na base.
O detalhe legal é que hermes config set roteia valores para o arquivo correto: chaves de API para .env e configurações não-secretas para config.yaml.
hermes config set model openrouter/meta-llama/llama-3.1-70b-instruct
hermes config set terminal.backend docker
hermes config set OPENROUTER_API_KEY sk-or-v1-xxxxxxxx
O Hermes também suporta substituição de variáveis de ambiente dentro do config.yaml via sintaxe ${VAR_NAME}. Isso é útil quando você deseja manter certos valores no ambiente enquanto ainda os referencia na configuração estruturada.
Sandbox e backends de execução
O Hermes suporta múltiplos backends de terminal que definem onde os comandos de shell realmente rodam. O guia de configuração lista local, docker, ssh, modal, daytona e singularity.
A maneira opinativa, mas não evangelizadora, de pensar sobre isso é:
localé o mais rápido e simples, mas não é isoladodockeré uma camada pragmática de segurança e reprodutibilidadesshé uma maneira limpa de separar seu dispositivo de chat de sua caixa de computaçãomodaledaytonase encaixam em fluxos de trabalho “serverless, mas persistentes o suficiente”singularityé a opção amigável para HPC (Computação de Alto Desempenho)
Um exemplo mínimo de backend Docker:
# ~/.hermes/config.yaml
terminal:
backend: docker
docker_image: "nikolaik/python-nodejs:python3.11-nodejs20"
docker_volumes:
- "/home/user/projects:/workspace/projects"
docker_forward_env:
- "GITHUB_TOKEN"
A documentação também descreve o endurecimento de segurança para o backend Docker, como remover capacidades e desabilitar escalada de privilégios.
Habilidades, memória e perfis
O Hermes tem dois mecanismos relacionados para compor valor.
As habilidades são memória procedural. O Hermes pode criar, atualizar e excluir suas próprias habilidades e pode oferecer para salvar uma abordagem como uma habilidade após completar uma tarefa complexa.
A memória embutida é armazenada como arquivos como MEMORY.md e USER.md sob ~/.hermes, e o Hermes também pode usar provedores de memória externos para recuperação mais profunda. A documentação de memória lista vários plugins de provedores, e o guia de provedores de memória documenta um fluxo de configuração interativa. Para uma análise técnica completa de como a arquitetura de memória funciona — snapshots congelados, limites de caracteres, os oito provedores externos e a filosofia por trás da memória delimitada — veja Sistema de Memória do Hermes Agent: Como a Memória Persistente de IA Realmente Funciona.
Se você deseja múltiplos agentes independentes na mesma máquina, os perfis do Hermes fornecem isolamento. Cada perfil recebe seu próprio diretório com sua própria configuração, segredos, memórias, sessões, habilidades, trabalhos cron e estado do gateway.
Para uma visão mais aprofundada de quais habilidades funcionam bem em produção por papel — engenheiros, pesquisadores, operadores e fluxos de trabalho executivos — veja Habilidades do Assistente de IA Hermes para Configurações de Produção Reais. Quando estiver pronto para autorar ou depurar os próprios arquivos SKILL.md — metadados YAML, níveis de divulgação progressiva, visibilidade condicional e instalações de hub — use [Autoração de Habilidades do Hermes Agent — Estrutura e Melhores Práticas do SKILL.md]({< ref “/ai-systems/hermes/authoring-hermes-skill/” >}} “Autore habilidades do Hermes com frontmatter YAML, divulgação progressiva, ativação condicional, segredos versus configuração e solução de problemas de índice.”).
Fluxo de trabalho típico
Se você tratar o Hermes como um agente que você manterá por perto, o fluxo de trabalho começa a parecer com engenharia de serviços.
Uma base estável
Uma base que tende a não se deteriorar é:
- Instale e rode um primeiro chat na CLI.
- Escolha um provedor e modelo com
hermes model, depois confirme os custos. - Configure os conjuntos de ferramentas e decida se a execução do terminal é local ou sandboxed.
- Faça uma mudança rápida no
SOUL.mdapenas após ter usado o padrão por um tempo. Mudanças de identidade importam mais do que as pessoas esperam porque é o “slot 1” no prompt do sistema.
Uso diário que se compõe
O Hermes tem uma interface de terminal UI em vez de uma interface web, e é projetado para sessões longas com comandos de barra, sessões retomáveis e saída de ferramentas em streaming.
Na prática, um ritmo útil é:
- rodar trabalho em uma sessão nomeada para um projeto
- comprimir o contexto quando ele cresce demais
- deixar o Hermes transformar rotinas repetidas em habilidades
- manter uma fronteira mental entre “perguntar” e “agir” para que a execução de ferramentas permaneça auditável
Gateway de mensagens para acesso 24/7
O gateway de mensagens é a peça que faz o Hermes parecer um assistente em vez de um aplicativo de terminal. A documentação o descreve como um único processo que se conecta a múltiplas plataformas, lida com sessões, roda trabalhos cron e entrega mensagens.
A configuração é invocada via hermes gateway setup, e o gateway pode rodar em primeiro plano ou como um serviço de usuário. A referência da CLI documenta subcomandos do gateway como run, install, start, stop, status e restart.
Para filas de múltiplos agentes e agendamento controlado, veja Kanban no Hermes Agent para Fluxos de Trabalho de LLM Auto-Hospedados, que cobre limites do dispatcher, cadeias de dependência e lotes baseados em cron.
A segurança para um bot que usa ferramentas importa. A documentação do gateway descreve listas de permissão para plataformas específicas e um fluxo de emparelhamento de DM que emite códigos de emparelhamento de uso único e requer aprovação via hermes pairing approve.
Atualizações sem drama
As atualizações do Hermes são um comando de primeira classe. O guia de atualização documenta hermes update, verificações de migração de configuração e uma pequena rotina de validação pós-atualização incluindo hermes doctor e hermes gateway status.
hermes update
hermes doctor
hermes gateway status
Solução de problemas e diagnósticos
A maioria das falhas do Hermes não é misteriosa. Elas parecem misteriosas porque as pessoas só verificam a camada de modelo e ignoram a camada de tempo de execução.
Comandos de triagem rápida
A referência da CLI posiciona explicitamente três comandos como o loop central:
hermes doctorpara diagnósticos interativoshermes statuspara uma visão geral rápidahermes dumppara um resumo de configuração compartilhável e redigido
Para logs, hermes logs faz tail dos arquivos armazenados sob ~/.hermes/logs.
hermes doctor --fix
hermes status
hermes dump --show-keys
hermes logs errors -f
Falhas comuns de instalação
A FAQ e o guia de solução de problemas lista vários problemas recorrentes e suas correções, incluindo problemas de versão do Python, uv não encontrado e problemas de permissão causados por misturar instalações sudo com instalações de usuário.
Se você encontrar esses erros, a documentação fornece etapas de remediação específicas, como atualizar o Python, instalar o uv e reinstalar o Hermes sem sudo.
Problemas de provedor e modelo
Quando as chaves de API não funcionam, a FAQ recomenda verificar a configuração, re-executar hermes model ou definir uma chave diretamente via hermes config set. Ela também destaca uma armadilha comum: as chaves são específicas do provedor.
Para problemas de “modelo não encontrado”, a FAQ aponta de volta para usar hermes model para escolher um identificador válido e mostra tanto substituições de configuração quanto por sessão.
Limites de taxa e problemas de comprimento de contexto também são cobertos. A FAQ sugere aguardar erros 429, mudar de provedor ou modelo, e reduzir a pressão de contexto via compressão ou uma sessão fresca.
Problemas de backend de terminal e gateway
Se os comandos de terminal falharem imediatamente, o guia de configuração inclui uma seção de “problemas comuns de backend de terminal” e aponta para as causas típicas por backend, incluindo Docker não rodando e variáveis SSH ausentes. Ele também nota que reverter para local é uma jogada de depuração válida quando a configuração do sandbox está em questão.
Para problemas de gateway, o guia de mensagens destaca listas de permissão e emparelhamento como os padrões seguros, o que significa que muitos incidentes de “bot está silencioso” são na verdade a autorização fazendo seu trabalho.