SelfHosting

Qwen 3.6 27B e 35B MTP versus Padrão em GPU de 16GB

Qwen 3.6 27B e 35B MTP versus Padrão em GPU de 16GB

MTP versus decodificação padrão na RTX 4080 — benchmarks reais

Testei o desempenho da Decodificação Especulativa (Previsão de Múltiplos Tokens, MTP) nos modelos Qwen 3.6 27B e 35B em uma RTX 4080 com 16 GB de VRAM.

Criação de Habilidades do Agente Hermes — Estrutura e Melhores Práticas do SKILL.md

Criação de Habilidades do Agente Hermes — Estrutura e Melhores Práticas do SKILL.md

Habilidades do autor Hermes que carregam rapidamente e comportam-se de forma confiável

O Hermes Agent trata skills (habilidades) como a forma padrão de ensinar fluxos de trabalho repetíveis. A documentação oficial descreve-os como documentos de conhecimento sob demanda, alinhados com a especificação aberta agentskills.io, carregados através de revelação progressiva para que o modelo veja primeiro um índice pequeno e só carregue as instruções completas quando uma tarefa realmente precisar delas.

Memória de Sistemas de IA — Conhecimento Persistente e Memória de Agentes

Memória de Sistemas de IA — Conhecimento Persistente e Memória de Agentes

Conhecimento persistente além de uma única conversa.

Esta seção reúne guias sobre conhecimento persistente e memória para sistemas de IA — como os assistentes mantêm fatos, preferências e contexto distilado entre sessões, sem sobrecarregar um único prompt com todos os tokens. Aqui, memória significa retenção intencional (fatos do usuário, resumos, repositórios apoiados por plugins), não RAM de GPU ou pesos do modelo.

Provedores de Memória de Agentes Comparados — Honcho, Mem0, Hindsight e mais cinco

Provedores de Memória de Agentes Comparados — Honcho, Mem0, Hindsight e mais cinco

Oito backends plugáveis para memória persistente de agentes.

Assistentes modernos ainda esquecem tudo quando você fecha a aba, a menos que algo persista além da janela de contexto. Provedores de memória de agentes são serviços ou bibliotecas que mantêm fatos e resumos entre sessões — frequentemente integrados como plugins para que o framework permaneça leve enquanto a memória escala.

Sistema de Memória do Hermes Agent: Como a Memória Persistente de IA Realmente Funciona

Sistema de Memória do Hermes Agent: Como a Memória Persistente de IA Realmente Funciona

A memória é a diferença entre uma ferramenta e um parceiro.

Você já conhece o processo. Você abre um chat com um agente de IA, explica seu projeto, compartilha suas preferências, realiza algum trabalho e fecha a aba. Volta na semana seguinte e é como falar com um estranho — todo o contexto se foi, cada preferência foi esquecida, o projeto precisa ser reexplicado do zero.