Hermes AI-assistent vaardigheden voor productieomgevingen

Profile-first Hermes-configuraties voor zware workloads

Inhoud

Hermes AI-assistent, officieel gedocumenteerd als Hermes Agent, is niet gepositioneerd als een eenvoudige chat-wraper.

Voor installatie, provider-instelling, tool-sandboxing en gateway-configuratie, zie de Hermes AI Assistant handleiding. Dit artikel richt zich op de skills- en profielarchitectuur die bepaalt hoe Hermes zich gedraagt eenmaal deze draait.

De officiële documentatie en repository beschrijven een zichzelf verbeterende agent met een ingebouwde leerlus die skills creëert uit ervaring, deze tijdens gebruik verbetert, kennis behoudt tussen sessies, en draait op alles van een goedkope VPS tot cloud-sandboxen.

hermes ai assistant skills

In april 2026 toonde de publieke GitHub-repository ongeveer 94.600 sterren, 13.200 forks en een laatste release met tag v0.10.0 op 16 april 2026. Dat is genoeg activiteit om het project als snel veranderend, goed geadopteerd en toch operationeel jong te beschrijven.

Die dubbele aard is belangrijk voor productieontwerp. Hermes is volwassen genoeg om echt werk te ondersteunen, maar dynamisch genoeg dat een rommelige instelling snel veroudert. Het onderstaande artikel behandelt configuratie en skills als een vraagstuk van operationele architectuur, niet als een feature-checklist.

Waarom Hermes een profiel-gerichte architectuur nodig heeft

Hermes skills zijn kennisdocumenten op aanvraag. Ze gebruiken progressieve openbaarmaking zodat de agent eerst een compacte skills-index kan zien en alleen de volledige skills-inhoud laadt wanneer nodig, wat het tokengebruik onder controle houdt zelfs wanneer veel skills zijn geïnstalleerd. Elke geïnstalleerde skill wordt een slash-commando in de CLI en in messaging-oppervlakken, en de documentatie positioneert skills expliciet als het voorkeursmechanisme voor extensies wanneer een capaciteit kan worden uitgedrukt met instructies, shell-commando’s en bestaande tools in plaats van aangepaste agent-code.

De complicatie in productie is dat Hermes skills behandelt als levende staat, niet als bevroren pakketten. Ingebundelde skills, via hub geïnstalleerde skills en door de agent gemaakte skills leven allemaal onder ~/.hermes/skills/, en de documentatie stelt dat de agent skills kan wijzigen of verwijderen. Hetzelfde systeem biedt acties voor het maken, patchen, bewerken, verwijderen en ondersteunende bestanden voor skills-beheer. Dat is krachtig, maar het betekent ook dat een te grote “do everything”-agent snel een procedurale rommelbak wordt.

Profielen zijn het antwoord. Hermes profielen zijn volledig geïsoleerde omgevingen, elk met hun eigen config.yaml, .env, SOUL.md, herinneringen, sessies, skills, cron-taken en statedatabase. De CLI maakt van een profiel ook een eigen commando-alias, zodat een profiel genaamd coder wordt coder chat, coder setup, coder gateway start, enzovoort. In de praktijk maakt dat profielen de echte eenheid van productie-eigendom, niet de individuele skill.

De productie-basis

De basisvorm is verrassend schoon. Hermes slaat niet-geheimhoudend gedrag op in ~/.hermes/config.yaml, geheimen in ~/.hermes/.env, identiteit in SOUL.md, blijvende feiten in memories/, procedurele kennis in skills/, geplande taken in cron/, sessies in sessions/ en logs in logs/. Het commando hermes config set routeert API-sleutels naar .env en alles andere naar config.yaml, en de gedocumenteerde prioriteitsvolgorde is CLI-vlaggen eerst, dan config.yaml, dan .env, dan ingebouwde standaardwaarden. Dat is ook het schoonste antwoord op de productie-FAQ over hoe geheimen en configuratie moeten worden gesplitst.

Een praktische multi-profiel-indeling ziet er meestal zo uit, met één profiel per verantwoordelijkheid in plaats van één profiel per persoon:

~/.hermes/profiles/
  eng/
  research/
  ops/
  execops/
  ml/

Dat patroon komt overeen met hoe Hermes profielen zijn gedocumenteerd: elk profiel is een eigen geïsoleerde omgeving, en profielen kunnen worden gekloned vanuit een basisconfiguratie wanneer gemeenschappelijke standaardwaarden nuttig zijn. De documentatie merkt ook op dat profielen geen herinneringen of sessies delen, en dat bijgewerkte skills kunnen worden gesynchroniseerd tussen profielen wanneer de hoofdinstallatie wordt bijgewerkt.

De volgende productiegrenze is uitvoering. Hermes ondersteunt zes terminal-backends - lokaal, Docker, SSH, Modal, Daytona en Singularity - en de beveiligingsdocumentatie beschrijft een defense-in-depth-model dat gevaarlijke commando-goedkeuring, container-isolatie, MCP-referentiefiltering, contextbestanden-scannen, cross-sessie-isolatie en input-sanitisering omvat. Met andere woorden, de beslissing voor “profiel eerst” beantwoordt wie eigenaar is van de staat, en de backend-beslissing beantwoordt waar riskant werk mag plaatsvinden.

Automatisering rust bovenop die basis. Hermes cron-taken kunnen nul, één of meerdere skills koppelen, en ze draaien in verse agentsessies in plaats van de huidige chat over te nemen. De messaging-gateway is ook het achtergrondproces dat sessies beheert, cron uitvoert en resultaten terugstuurt naar platforms zoals Telegram, Discord, Slack, WhatsApp, E-mail, Matrix en anderen. De officiële MCP-handleiding voegt nog één productieregel toe die makkelijk over het hoofd wordt gezien: het beste patroon is niet alles te verbinden, maar het kleinste nuttige oppervlak bloot te stellen.

Het software-ontwikkelingsprofiel

De meest voor de hand liggende Hermes-persoon is de softwareontwikkelaar die wil dat de agent zich minder gedraagt als een chatvenster en meer als een herhaalbare repo-operator. Dit profiel maakt zich meestal zorgen over repository-authenticatie, issue-triage, PR-creatie, code-review, debugging en plan-gedreven uitvoering. In de Hermes-catalogi is de kern van de ingebouwde skills-pakketten ongebruikelijk coherent voor dat werk: github-auth, github-issues, github-pr-workflow, github-code-review, code-review, plan, writing-plans, systematic-debugging en test-driven-development. Als delegatie belangrijk is, levert Hermes ook ingebouwde autonome agentskills zoals codex, claude-code, opencode en hermes-agent-spawning.

Wat dat pakket nuttig maakt, is niet één enkele skill. Het is de manier waarop de skills ontwikkelprocedure coderen. github-pr-workflow dekt de volledige PR-levenscyclus, github-issues formaliseert issue-operaties, github-code-review en code-review maken review een aparte stap in plaats van een afterthought, en systematic-debugging houdt de agent ervan om direct naar prematuur fixes te springen. Dat beantwoordt ook de praktische vraag welke AI-assistantskills het meest belangrijk zijn voor codeerworkflows. De skills met de hoogste waarde zijn meestal die welke repo-hygiëne en review-discipline vastleggen, niet die welke meer ruwe codegeneratie beloven.

Hermes delegatie versterkt dit profiel verder. Het platform kan geïsoleerde kind-agents spawnen met hun eigen conversatie, terminalsessie en toolset, en alleen de uiteindelijke samenvatting wordt teruggegeven aan de ouder. Voor codebases is dat een schonere fit dan elke tussentijdse diff, stacktrace en reviewnotitie in één conversatie te stoppen. In productietermen profiteert het engineeringprofiel van smalle skills-sets, een sandboxed backend zoals Docker of SSH, en ruim gebruik van delegatie wanneer contextruim begint te domineren.

Het onderzoeks- en kennisprofiel

Het onderzoeksprofiel is waar Hermes begint te verschillen van gewone assistenten. De ingebouwde catalogi bevatten al arxiv, duckduckgo-search, blogwatcher, llm-wiki, ocr-and-documents, obsidian, domain-intel en ml-paper-writing, terwijl de officiële optionele catalogus qmd, parallel-cli, scrapling en een bredere onderzoekstier voor gespecialiseerde domeinen toevoegt. Die stack dekt paper-zoekopdrachten, bronmonitoring, OCR, lokale notitiesystemen, domeinreconnaissance, schrijven en hybride retrieval zonder alles in één RAG-patroon te dwingen.

Dit profiel is ook de duidelijkste plek om de vraag herinnering versus skills te beantwoorden. Hermes-documentatie definieert herinnering als feiten over gebruikers, projecten en voorkeuren, terwijl skills procedures opslaan voor hoe dingen moeten worden gedaan. Onderzoekswerk heeft beide nodig. Herinnering houdt vast wat de assistent al heeft geleerd over het domein en de voorkeuren van de lezer; skills coderen herhaalbare procedures zoals “scan arXiv, vat nieuwe papers samen en schrijf notities naar Obsidian.” Dat onderscheid is belangrijk omdat productie-onderzoeksysteem falen wanneer alles als herinnering wordt behandeld of alles als workflow. Hermes geeft die zorgen aparte woningen. Voor het volledige technische beeld van hoe herinnering werkt — de twee-bestandsarchitectuur, karakterlimieten, prefix-caching en alle acht externe provider-opties — zie Hermes Agent Memory System.

Het onderzoeksprofiel profiteert ook disproportioneel van cron. Hermes cron-taken kunnen expliciet skills laden voordat ze worden uitgevoerd, en de automatiseringsgidsen benadrukken dat geplande prompts volledig zelfstandig moeten zijn omdat ze in verse sessies draaien. Een terugkerende pipeline die blogwatcher, arxiv, obsidian of llm-wiki combineert, is daarom betrouwbaarder dan een vage “check wat er vandaag is veranderd”-taak. Met andere woorden, onderzoeksprofielen werken het beste wanneer bronontdekking, notitieschrijven en lange-termijnopslag elk worden vertegenwoordigd door een genoemde skill in plaats van verborgen te zijn in één lange natuurlijke-taal-prompt.

Het automatiserings- en operatieprofiel

Het ops-profiel is minder glamourus en vaak waardevoller. Dit is de gebruiker die wil dat Hermes reageert op gebeurtenissen, systemen inspecteert, gescriptte checks uitvoert, output naar een kanaal stuurt, en dat allemaal doet zonder de host tot een risico te maken. Hermes heeft de juiste bouwstenen voor die stijl van werk: ingebouwde webhook-subscriptions voor gebeurtenis-gestuurde activatie, ingebouwde native-mcp en mcporter voor MCP-based tools, en officiële optionele skills zoals docker-management, fastmcp, cli en 1password wanneer de workflow uitbreidt naar containers, aangepaste MCP-servers of secret-injectie.

De reden waarom dit pakket werkt, is dat elke skill één grenze bezit. webhook-subscriptions behandelt ingress van externe systemen. docker-management maakt van container-chorens een genoemde procedure in plaats van een free-form shell-spel. fastmcp is nuttig wanneer Hermes de orchestrator moet worden rond nieuwe MCP-tools, en 1password houdt secret-behandeling expliciet in plaats van het te smokkelen in shell-geschiedenis of markdown-bestanden. De officiële MCP-richting versterkt hetzelfde productie-instinct: verbind het juiste ding met het kleinste nuttige oppervlak.

Dit profiel is ook de schoonste plek om te beantwoorden hoe geplande AI-workflows betrouwbaar blijven. Hermes cron-documentatie zegt dat taken draaien in verse sessies, één of meerdere skills kunnen koppelen, en gebruik moeten maken van zelfstandige prompts. De cron-troubleshooting-gids voegt toe dat automatisch afvuren afhangt van de gateway-ticker in plaats van een gewone CLI-chatsessie. Dus het betrouwbare patroon is straightforward, hoewel de implementatie dat niet is: expliciete skills, expliciet leveringsdoel, zelfstandige prompt, geïsoleerde backend en een gateway die daadwerkelijk draait.

Het executive operatieprofiel

Er is een stillere maar zeer reale Hermes-persoon die eruitziet als een chief of staff, operatie-lead of zwaar overbeladen founder. De relevante skills zijn minder flashy en meer kantoor-vormig: google-workspace, notion, linear, nano-pdf, powerpoint en de ingebouwde himalaya e-mailskill, plus officiële optionele skills zoals agentmail, telephony en one-three-one-rule. Die mix geeft Hermes toegang tot inbox, agenda, docs, taken, decks, PDF-opruiming, een gestructureerd communicatiekader en zelfs telefoon- en SMS-workflows waar dat echt belangrijk is.

De flow hier is belangrijker dan de catalogus. google-workspace verankert dag-tot-dag uitvoering. Notion en Linear voorkomen dat de assistent het taaksysteem van record wordt. one-three-one-rule is verrassend nuttig omdat beslissingsondersteuning vaak het moeilijkst te standaardiseren is, en die skill geeft Hermes een genoemde procedure voor voorstellen in plaats van generiek “vat dit samen”-gedrag. nano-pdf en powerpoint zijn het soort operationele vermenigvuldigers die klein lijken tot een team elke dag decks en PDFs begint aan te raken.

Hermes messaging- en voice-functies maken dit profiel praktischer dan het eerst lijkt. De gateway kan de agent blootstellen via Slack, Telegram, Discord, WhatsApp, E-mail, Matrix en enkele andere kanalen, en de voice-stack ondersteunt microfooninput, gesproken antwoorden in messaging en live Discord voice-conversaties. De documentatie merkt ook op dat één Hermes-instantie meerdere gebruikers kan bedienen via allowlists en DM-pairing, terwijl bot-tokens exclusief blijven voor een enkel profiel. Dat is waarom een communicatie-zware deployment meestal profiteert van ten minste één toegewijd profiel in plaats van dezelfde bot-identiteit te delen met engineering of ops.

Het ML- en data-platformprofiel

Hermes is gebouwd door een onderzoekslab, en die afstamming toont zich. De catalogi bevatten jupyter-live-kernel voor stateful notebook-stijl werk, huggingface-hub voor model- en dataset-operaties, evaluating-llms-harness en weights-and-biases voor evaluatie en experiment-tracking, qdrant-vector-search voor productie RAG-opslag, en een grote ingebouwde en optionele MLOps-tier met skills zoals axolotl, fine-tuning-with-trl, modal-serverless-gpu, lambda-labs-gpu-cloud, flash-attention, tensorrt-llm, pinecone, qdrant en nemo-curator.

Wat hier opvallend is, is niet alleen de breedte. Het is dat de skills de hele stack overspannen van notebook-iteratie tot data-curatie, evaluatie, vector-zoekopdracht, fine-tuning en inferentie-optimalisatie. Voor een ML-platformgebruiker begint Hermes niet meer als een assistent te voelen, maar als een controlplane die procedures kan dragen door de levenscyclus. jupyter-live-kernel behandelt iteratieve exploratie, evaluating-llms-harness en weights-and-biases formaliseren meting, en de optionele compute- en optimalisatieskills laten Hermes coherent praten over zowel experimentatie als deployment.

Dit is ook het profiel waar terughoudingheid het meest belangrijk is. Omdat de optionele MLOps-catalogus zo groot is, profiteert een productie-Hermes-instelling voor ML-werk meestal van meningsverschil over scope. Een platform-engineeringprofiel dat eigenaar is van evaluatie en deployment heeft niet elke training framework geïnstalleerd. Een onderzoeksprofiel dat eigenaar is van papers en notitiesystemen heeft niet elke vector database skill nodig. Hermes kan enorme skills-inventarissen dragen, maar productie-nut komt nog steeds van het vernauwen van het actieve oppervlak.

Waar skills tot lasten worden

Het sterkste onderdeel van het Hermes skills-systeem is ook de plek waar productie-instellingen fout gaan. Hermes kan browsen en skills installeren vanuit zijn ingebouwde catalogus, de officiële optionele catalogus, Vercel’s skills.sh, bekende skill-endpoints, directe GitHub-repositories en marketplace-stijl gemeenschapsbronnen. Het beveiligingsmodel onderscheidt tussen builtin, official, trusted en community bronnen, voert beveiligings-scans uit voor hub-geïnstalleerde skills, en staat --force alleen toe voor niet-gevaarlijke policy-blokken. Een gevaarlijke scan-von blijft geblokkeerd. Hermes toont ook upstream-metadata zoals repository-URL, wekelijkse installs en audit-signalen tijdens inspectie. Dat is een solide trust-model, maar het is geen vervanging voor smaak.

Er is ook een limiet aan wat van een skill gevraagd kan worden. Hermes-documentatie is expliciet dat skills de voorkeuzemethode zijn wanneer het werk kan worden uitgedrukt als instructies plus shell-commando’s plus bestaande tools, terwijl plugins de eerlijkere abstractie zijn voor aangepaste tools, hooks en lifecycle-gedrag. De plugin-gids toont zelfs hoe een plugin zijn eigen skill kan bundelen. In productie betekent dat dat skills het beste worden behandeld als herbruikbare procedures, niet als een geforceerd vervanging voor juiste tool- of plugin-ontwerp.

Gemeenschap en ondersteuning zien er gezond uit, maar ze wissen veranderingssnelheid niet weg. Hermes-documentatie verwijst gebruikers naar Discord, GitHub Discussions, Issues en de Skills Hub, en de publieke repository toont frequente releases en een groot bijdragevoetafdruk. De operationele les is eenvoudig genoeg: updates zijn onderdeel van het systeem, niet een gebeurtenis daarbuiten. Een echte productie-instelling gaat ervan uit dat profielen, skills en workflow-aannames zullen evolueren, en gebruikt dan isolatie en smalle skills-pakketten zodat verandering lokaal blijft wanneer deze onvermijdelijk aankomt.

Hermes werkt het beste wanneer skills worden behandeld als procedurele contracten rond duidelijk gescheiden profielen. Het moment dat één profiel het engineering-agent, de onderzoeksassistent, de ops-werker, de inbox-bot en het ML-platform allemaal tegelijk wordt, stopt het systeem met composteren en begint het met lekken van verantwoordelijkheden. Het schone productiepatroon gaat minder over het hebben van meer skills en meer over het geven van elk profiel een jobdescription die het daadwerkelijk kan bewaken.

Dit artikel is onderdeel van de AI Systemen cluster, dat zelfgehoste assistenten, retrieval-architectuur, lokale LLM-infrastructuur en observability dekt.

Abonneren

Ontvang nieuwe berichten over systemen, infrastructuur en AI-engineering.