실제 프로덕션 환경에서의 Hermes AI 어시스턴트 스킬

심각한 워크로드를 위한 프로파일 우선 Hermes 설정

Page content

공식 문서상 ‘Hermes 에이전트(Hermes Agent)‘로 기록된 허메스 AI 어시스턴트는 단순한 채팅 래퍼(chat wrapper)로 포지셔닝되지 않습니다.

설치, 제공자 설정, 도구 샌드박스화 및 게이트웨이 구성에 대해서는 허메스 AI 어시스턴트 가이드를 참조하십시오. 이 기사는 허메스가 실행된 후 어떻게 작동하는지를 결정하는 기술(skill) 및 프로필(profile) 아키텍처에 초점을 맞추고 있습니다.

공식 문서 및 저장소는 경험으로부터 기술을 생성하고, 사용 중에 이를 개선하며, 세션 간 지식을 지속하고, 저가형 VPS부터 클라우드 샌드박스까지 다양한 환경에서 실행되는 내장 학습 루프를 갖춘 자기 개선형 에이전트를 설명합니다.

hermes ai assistant skills

2026년 4월 기준, 공개된 GitHub 저장소는 약 94.6k개의 스타, 13.2k개의 포크를 기록했으며, 최신 릴리스는 2026년 4월 16일 기준 v0.10.0으로 태그되었습니다. 이는 해당 프로젝트가 빠르게 진화하고 있으며 널리 채택되고 있지만, 여전히 운영 측면에서는 초기 단계에 있음을 시사합니다.

이러한 양면성은 프로덕션 설계에 중요합니다. 허메스는 실제 작업을 지원할 만큼 성숙했지만, 설정이 엉성하면 빠르게 구식 기술이 될 정도로 역동적입니다. 아래 기사는 구성과 기술을 기능 목록이 아닌 운영 아키텍처 관점에서 다룹니다.

허메스가 프로필 중심 아키텍처가 필요한 이유

허메스 기술들은 온디맨드 지식 문서입니다. 에이전트가 먼저 간결한 기술 색인을 확인하고 필요할 때만 전체 기술 내용을 로드할 수 있도록 점진적 공개(progressive disclosure) 방식을 사용하여, 많은 기술이 설치되어 있더라도 토큰 사용량을 제어할 수 있습니다. 설치된 모든 기술은 CLI 및 메시징 인터페이스에서 슬래시 명령어(slash command)가 되며, 문서에서는 커스텀 에이전트 코드보다 지시사항, 셸 명령어 및 기존 도구로 표현 가능한 기능을 확장하는 방법으로 기술을 선호하는 확장 메커니즘으로 명시하고 있습니다.

프로덕션 환경에서의 복잡성은 허메스가 기술을 고정된 패키지가 아닌 살아있는 상태(living state)로 취급한다는 점에 있습니다. 번들 기술, 허브에서 설치된 기술, 에이전트가 생성한 기술은 모두 ~/.hermes/skills/ 디렉토리 아래에 위치하며, 문서에 따르면 에이전트가 기술을 수정하거나 삭제할 수 있습니다. 동일한 시스템은 기술 관리를 위해 생성, 패치, 편집, 삭제 및 보조 파일 작성을 노출합니다. 이는 강력한 기능이지만, 동시에 하나의 과도한 “모든 것을 하는” 에이전트가 절차적 쓰레기통(junk drawer)으로 변하기 쉽다는 것을 의미합니다.

이해의 열쇠는 프로필입니다. 허메스 프로필은 완전히 격리된 환경으로, 각각 고유한 config.yaml, .env, SOUL.md, 메모리, 세션, 기술, 크론 작업 및 상태 데이터베이스를 가지고 있습니다. CLI는 프로필을 자체 명령어 별칭으로 변환하므로, coder라는 이름의 프로필은 coder chat, coder setup, coder gateway start 등으로 호출됩니다. 실제로 이는 개별 기술이 아닌 프로필이 프로덕션 소유의 진정한 단위가 됨을 의미합니다.

프로덕션 베이스라인

베이스라인 구조는 놀라울 정도로 깔끔합니다. 허메스는 비비밀 행위(non-secret behavior)를 ~/.hermes/config.yaml에, 비밀 정보를 ~/.hermes/.env에, 정체성을 SOUL.md에, 지속적 사실을 memories/에, 절차적 지식을 skills/에, 예약된 작업을 cron/에, 세션을 sessions/에, 로그를 logs/에 저장합니다. hermes config set 명령어는 API 키를 .env로, 나머지 모든 설정을 config.yaml으로 라우팅하며, 문서화된 우선순위 순서는 CLI 플래그가 가장 우선하고, 그 다음이 config.yaml, .env, 내장 기본값 순입니다. 이는 비밀 정보와 구성을 어떻게 분리해야 하는지에 대한 프로덕션 FAQ에 대한 가장 깔끔한 답변이기도 합니다.

실용적인 다중 프로필 레이아웃은 일반적으로 사람별 프로필이 아닌 책임별 프로필을 구성하는 다음과 같은 형태가 됩니다.

~/.hermes/profiles/
  eng/
  research/
  ops/
  execops/
  ml/

이 패턴은 허메스 프로필이 문서화된 방식과 일치합니다: 각 프로필은 자체 격리된 환경이며, 공통 기본값이 유용할 때 기본 구성에서 프로필을 복제할 수 있습니다. 문서에는 프로필이 메모리나 세션을 공유하지 않으며, 주요 설치가 업데이트될 때 기술이 프로필 간에 동기화될 수 있다는 점도 명시되어 있습니다.

다음 프로덕션 경계는 실행(execution)입니다. 허메스는 로컬, Docker, SSH, Modal, Daytona, Singularity 등 6가지 터미널 백엔드를 지원하며, 보안 문서에는 위험 명령 승인, 컨테이너 격리, MCP 자격 증명 필터링, 컨텍스트 파일 스캔, 크로스 세션 격리 및 입력 정화 등을 포함하는 심층 방어(defense-in-depth) 모델을 설명하고 있습니다. 즉, “프로필 우선” 결정은 상태의 소유자가 누구인지에 대한 답이 되고, 백엔드 결정은 위험한 작업이 어디서 허용될 것인지에 대한 답이 됩니다.

자동화는 이 베이스라인 위에 구축됩니다. 허메스 크론 작업은 0개, 1개 또는 여러 개의 기술을 연결할 수 있으며, 현재 채팅을 상속받지 않고 새로운 에이전트 세션에서 실행됩니다. 메시징 게이트웨이도 세션을 관리하고, 크론 작업을 실행하며, 결과를 Telegram, Discord, Slack, WhatsApp, Email, Matrix 등 다양한 플랫폼으로 라우팅하는 백그라운드 프로세스입니다. 공식 MCP 가이드는 다음과 같이 쉽게 간과될 수 있는 프로덕션 규칙을 하나 더 추가합니다: 가장 좋은 패턴은 모든 것을 연결하는 것이 아니라, 가장 작고 유용한 표면을 노출하는 것입니다.

소프트웨어 엔지니어링 프로필

가장 눈에 띄는 허메스 페르소나는 소프트웨어 엔지니어입니다. 이들은 에이전트를 채팅 창보다는 반복 가능한 레포지토리 운영자처럼 행동하도록 원합니다. 이 프로필은 일반적으로 레포지토리 인증, 이슈 분류, PR 생성, 코드 리뷰, 디버깅 및 계획 기반 실행에 관심을 가집니다. 허메스 카탈로그에서, 이 작업을 위한 핵심 내장 기술 팩은 unusually coherent(비범울 정도로 일관성)합니다: github-auth, github-issues, github-pr-workflow, github-code-review, code-review, plan, writing-plans, systematic-debugging, 그리고 test-driven-development가 포함됩니다. 위임(delegation)이 중요하다면, 허메스는 codex, claude-code, opencode, hermes-agent-spawning과 같은 내장 자율 에이전트 기술도 제공합니다.

이 팩을 유용하게 만드는 것은 단일 기술이 아닙니다. 이는 기술들이 개발 절차를 인코딩하는 방식입니다. github-pr-workflow는 전체 PR 라이프사이클을 다루고, github-issues는 이슈 작업을 형식화하며, github-code-reviewcode-review는 리뷰를 사후적인 고려 사항이 아닌 명확한 단계로 만듭니다. systematic-debugging은 에이전트가 조기에 수정에 뛰어드는 것을 방지합니다. 이는 또한 코딩 워크플로우에 가장 중요한 AI 어시스턴트 기술이 무엇인지라는 실용적인 질문에 답합니다. 가장 가치가 높은 기술은 일반적으로 더 많은 원시 코드 생성을 약속하는 것이 아니라, 레포지토리 위생과 리뷰 규율을 확립하는 기술들입니다.

허메스 위임은 이 프로필을 한층 강화합니다. 플랫폼은 자체 대화, 터미널 세션 및 도구를 갖춘 격리된 하위 에이전트를 생성할 수 있으며, 최종 요약만 상위 에이전트로 반환됩니다. 코드베이스에 있어서는 모든 중간 diff, 스택 트레이스 및 리뷰 노트를 하나의 대화에 넣는 것보다 더 깔끔한 적합성을 제공합니다. 프로덕션 관점에서, 엔지니어링 프로필은 좁은 기술 세트, Docker 또는 SSH와 같은 샌드박스화된 백엔드, 그리고 컨텍스트 노이즈가 지배적이 될 때 위임을 적극적으로 활용하는 편을 들게 됩니다.

연구 및 지식 프로필

연구 프로필은 허메스가 일반 어시스턴트와 구별되기 시작하는 곳입니다. 내장 카탈로그에는 이미 arxiv, duckduckgo-search, blogwatcher, llm-wiki, ocr-and-documents, obsidian, domain-intel, ml-paper-writing이 포함되어 있으며, 공식 옵션 카탈로그는 qmd, parallel-cli, scrapling 및 전문 도메인을 위한 더 넓은 연구 계층을 추가합니다. 이 스택은 단일 RAG 패턴에 모든 것을 강제로 넣지 않고도 논문 검색, 소스 모니터링, OCR, 로컬 노트 시스템, 도메인 정찰, 작성 및 하이브리드 검색을 포괄합니다.

이 프로필은 또한 메모리와 기술의 구분에 대한 가장 명확한 답을 제시하는 곳입니다. 허메스 문서는 메모리를 사용자, 프로젝트 및 선호도에 대한 사실로 정의하고, 기술은 작업을 수행하는 절차로 저장합니다. 연구 작업에는 둘 다 필요합니다. 메모리는 도메인에 대해 어시스턴트가 이미 학습한 내용과 독자의 선호도를 유지하고, 기술은 “arXiv 스캔, 새 논문 요약, Obsidian에 노트 작성"과 같은 반복 가능한 절차를 인코딩합니다. 이 구분이 중요한 이유는 프로덕션 연구 시스템이 모든 것을 메모리로 처리하거나 모든 것을 워크플로우로 처리할 때 실패하기 때문입니다. 허메스는 이러한 관심사를 별도의 공간에 제공합니다. 메모리가 작동하는 방식(두 파일 아키텍처, 문자 제한, 접두사 캐싱 및 8가지 외부 제공자 옵션 등)에 대한 전체적인 기술적 이해를 위해 허메스 에이전트 메모리 시스템을 참조하십시오.

연구 프로필은 또한 크론(cron)에서 불균형적인 혜택을 받습니다. 허메스 크론 작업은 실행 전에 기술을 명시적으로 로드할 수 있으며, 자동화 가이드에서는 예약된 프롬프트가 새로운 세션에서 실행되므로 완전히 자체적(self-contained)이어야 한다고 강조합니다. 따라서 blogwatcher, arxiv, obsidian 또는 llm-wiki를 결합한 반복 파이프라인은 모호한 “오늘 변경된 내용 확인” 작업보다 더 신뢰할 수 있습니다. 즉, 연구 프로필은 소스 발견, 노트 작성 및 장기 저장이 각각 명명된 기술로 표현되고 하나의 긴 자연어 프롬프트 내에 숨겨지지 않을 때 가장 잘 작동합니다.

자동화 및 운영 프로필

운영(ops) 프로필은 덜 화려하지만 종종 더 가치 있습니다. 이는 이벤트를 반응하고, 시스템을 점검하며, 스크립트된 검사를 실행하고, 출력을 채널로 라우팅하되 호스트를 취약점으로 만들지 않고 이를 모두 수행하고자 하는 사용자입니다. 허메스는 이러한 작업 스타일 위해 적절한 빌딩 블록을 가지고 있습니다: 이벤트 기반 활성화를 위한 내장 webhook-subscriptions, MCP 기반 도구를 위한 내장 native-mcpmcporter, 그리고 워크플로우가 컨테이너, 커스텀 MCP 서버 또는 비밀 주입으로 확장될 때 공식 옵션 기술인 docker-management, fastmcp, cli, 1password가 있습니다.

이 팩이 작동하는 이유는 각 기술이 하나의 경계를 소유하기 때문입니다. webhook-subscriptions는 외부 시스템에서의 수신(ingress)을 처리합니다. docker-management는 컨테이너 잡을 자유로운 형태의 셸 게임이 아닌 명명된 절차로 변환합니다. fastmcp는 허메스가 새로운 MCP 도구 주변의 오케스트레이터가 되어야 할 때 유용하며, 1password는 비밀 처리가 셸 히스토리나 마크다운 파일에 숨겨지지 않고 명시적이도록 유지합니다. 공식 MCP 가이드는 동일한 프로덕션 직관을 강화합니다: 가장 작은 유용한 표면으로 올바른 것을 연결하십시오.

이 프로필은 또한 예약된 AI 워크플로우가 어떻게 신뢰할 수 있게 유지되는지에 대해 가장 깔끔하게 답하는 곳입니다. 허메스 크론 문서는 작업이 새로운 세션에서 실행되며, 하나 이상의 기술을 연결할 수 있고, 자체적 프롬프트를 사용해야 한다고 명시합니다. 크론 문제 해결 가이드는 자동 발화가 일반 CLI 채팅 세션이 아닌 게이트웨이 틱커(ticker)에 의존한다고 추가합니다. 따라서 신뢰할 수 있는 패턴은 구현이 그렇지 않더라도 직관적입니다: 명시적 기술, 명시적 전달 대상, 자체적 프롬프트, 격리된 백엔드, 그리고 실제로 실행 중인 게이트웨이.

실행 운영(Executive Operations) 프로필

조용하지만 매우 실제적인 허메스 페르소나는 스태프 수장, 운영 리드, 또는 업무가 과부하인 창립자와 유사합니다. 관련 기술은 덜 화려하고 더 사무실 형식적입니다: google-workspace, notion, linear, nano-pdf, powerpoint, 그리고 내장 himalaya 이메일 기술, 그리고 공식 옵션 기술인 agentmail, telephony, one-three-one-rule이 있습니다. 이 조합은 허메스에게 인박스, 캘린더, 문서, 작업, 데크, PDF 정리, 구조화된 커뮤니케이션 프레임워크, 그리고 실제로 중요한 경우 전화 및 SMS 워크플로우에 대한 접근을 제공합니다.

여기서는 카탈로그보다 흐름(flow)이 더 중요합니다. google-workspace는 일상적인 실행을 고정시킵니다. NotionLinear는 어시스턴트가 작업 시스템의 기록(task system of record)이 되는 것을 방지합니다. one-three-one-rule은 의사결정 지원이 종종 표준화하기 가장 어려운 부분이기 때문에 놀라울 정도로 유용하며, 이 기술은 허메스에게 일반적인 “요약해줘” 행동 대신 제안에 대한 명명된 절차를 제공합니다. nano-pdfpowerpoint는 팀이 매일 데크와 PDF를 다룰 때까지는 작아 보이는 운영적 승수들입니다.

허메스 메시징 및 음성 기능은 이 프로필을 처음 생각했던 것보다 더 실용적으로 만듭니다. 게이트웨이는 에이전트를 Slack, Telegram, Discord, WhatsApp, Email, Matrix 및 기타 여러 채널을 통해 노출할 수 있으며, 음성 스택은 마이크 입력, 메시징에서의 음성 응답, 실시간 Discord 음성 대화를 지원합니다. 문서에는 하나의 허메스 인스턴스가 allowlist 및 DM 페어링을 통해 여러 사용자를 서비스할 수 있지만, 봇 토큰은 단일 프로필에 독점적으로 사용된다는 점도 명시되어 있습니다. 따라서 커뮤니케이션이 많은 배포 환경은 엔지니어링이나 운영과 동일한 봇 아이덴티티를 공유하는 대신 최소한 하나의 전용 프로필을 갖는 것이 유리합니다.

ML 및 데이터 플랫폼 프로필

허메스는 연구소(Lab)에 의해 구축되었으며, 그 계보가 드러납니다. 카탈로그에는 상태가 있는 노트북 스타일 작업을 위한 jupyter-live-kernel, 모델 및 데이터셋 작업을 위한 huggingface-hub, 평가 및 실험 추적을 위한 evaluating-llms-harnessweights-and-biases, 프로덕션 RAG 저장을 위한 qdrant-vector-search, 그리고 axolotl, fine-tuning-with-trl, modal-serverless-gpu, lambda-labs-gpu-cloud, flash-attention, tensorrt-llm, pinecone, qdrant, nemo-curator과 같은 방대한 내장 및 옵션 MLOps 계층 기술이 포함되어 있습니다.

여기서 주목할 만한 점은 단순히 다양성만이 아닙니다. 이는 기술들이 노트북 반복부터 데이터 큐레이션, 평가, 벡터 검색, 파인튜닝 및 추론 최적화에 이르기까지 전체 스택을 아우르며라는 점입니다. ML 플랫폼 사용자에게 허메스는 단순한 어시스턴트에서 벗어나 라이프사이클 전반에 걸쳐 절차를 전달할 수 있는 제어 평면(control plane)처럼 느껴집니다. jupyter-live-kernel은 반복 탐색을 처리하고, evaluating-llms-harnessweights-and-biases는 측정을 형식화하며, 옵션 컴퓨팅 및 최적화 기술은 허메스가 실험과 배포 모두에 대해 일관되게 이야기할 수 있게 합니다.

이 또한 절제가 가장 중요한 프로필입니다. 옵션 MLOps 카탈로그가 매우 방대하기 때문에, ML 작업을 위한 프로덕션 허메스 설정은 일반적으로 범위에 대해 의견이 분분한(opinionated) 편을 들게 됩니다. 평가와 배포를 소유하는 플랫폼 엔지니어링 프로필에는 모든 훈련 프레임워크가 설치되어 있을 필요가 없습니다. 논문과 노트 시스템을 소유하는 연구 프로필에는 모든 벡터 데이터베이스 기술이 필요하지 않습니다. 허메스는 방대한 기술 인벤토리를 지닐 수 있지만, 프로덕션 유용성은 여전히 활성 표면을 좁히는 것에서 옵니다.

기술이 부채가 되는 곳

허메스 기술 시스템의 가장 강력한 부분도 프로덕션 설정이 잘못되는 곳입니다. 허메스는 내장 카탈로그, 공식 옵션 카탈로그, Vercel의 skills.sh, 잘 알려진 기술 엔드포인트, 직접 GitHub 저장소 및 마켓플레이스 스타일 커뮤니티 소스에서 기술을 탐색하고 설치할 수 있습니다. 보안 모델은 builtin, official, trusted, community 소스를 구별하고, 허브에서 설치된 기술에 보안 스캔을 실행하며, 비위험 정책 블록에만 --force를 허용합니다. 위험한 스캔 결과는 차단된 상태로 유지됩니다. 허메스는 또한 검사 중에 저장소 URL, 주간 설치 수 및 감사 신호와 같은 업스트림 메타데이터를 노출합니다. 이는 견고한 신뢰 모델이지만, 취향(taste)을 대체할 수는 없습니다.

기술에 요구할 수 있는 작업에도 한계가 있습니다. 허메스 문서는 작업이 지시사항, 셸 명령어 및 기존 도구로 표현될 수 있을 때 기술이 선호되는 선택이며, 커스텀 도구, 후크 및 라이프사이클 행위에 대해서는 플러그인이 더 정직한 추상화임을 명시합니다. 플러그인 가이드는 플러그인이 자체 기술을 번들링하는 방법까지 보여줍니다. 프로덕션에서 이는 기술이 적절한 도구나 플러그인 디자인을 강제로 대체하는 것이 아니라 재사용 가능한 절차로 취급될 때 가장 좋다는 것을 의미합니다.

커뮤니티와 지원은 건강해 보이지만, 이는 변경 속도를抹消하지 않습니다. 허메스 문서는 사용자를 Discord, GitHub Discussions, Issues 및 Skills Hub로 안내하며, 공개 저장소는 빈번한 릴리스와 큰 기여 발자국을 보여줍니다. 운영적 교훈은 단순합니다: 업데이트는 시스템의 일부이며, 시스템 외부의 이벤트가 아닙니다. 실제 프로덕션 설정은 프로필, 기술 및 워크플로우 가정이 진화할 것이라고 가정하고, 변경이 필연적으로 발생할 때 격리와 좁은 기술 팩을 사용하여 변경이 로컬에 머무르도록 합니다.

허메스는 기술이 명확히 분리된 프로필 주변의 절차적 계약으로 취급될 때 가장 잘 작동합니다. 하나의 프로필이 엔지니어링 에이전트, 연구 어시스턴트, 운영 작업자, 인박스 봇, ML 플랫폼을 모두 동시에 수행하는 순간, 시스템은 복리로 증가하는 대신 책임을 누출하기 시작합니다. 깔끔한 프로덕션 패턴은 더 많은 기술을 갖는 것보다 각 프로필에게 실제로 유지할 수 있는 직무 설명을 제공하는 것에 더 가깝습니다.

이 기사는 셀프 호스팅 어시스턴트, 검색 아키텍처, 로컬 LLM 인프라 및 관찰 가능성(observability)을 다루는 AI 시스템 클러스터의 일부입니다.

구독하기

시스템, 인프라, AI 엔지니어링에 관한 새 글을 받아보세요.