LLM

Hermes Agent Skill Authoring — Struktur und Best Practices für SKILL.md

Hermes Agent Skill Authoring — Struktur und Best Practices für SKILL.md

Autor Hermes Fähigkeiten, die schnell laden und zuverlässig funktionieren

Hermes Agent behandelt Skills (Fertigkeiten) als die Standardmethode zur Vermittlung wiederholbarer Workflows. Die offizielle Dokumentation beschreibt sie als bedarfsgerechte Wissensdokumente, die mit der offenen agentskills.io-Struktur übereinstimmen. Sie werden durch progressive Offenlegung (Progressive Disclosure) geladen, sodass das Modell zunächst einen kleinen Index sieht und nur dann die vollständigen Anweisungen lädt, wenn eine Aufgabe dies tatsächlich erfordert.

KI-Systeme-Speicher – Persistente Wissensspeicherung und Agentenspeicher

KI-Systeme-Speicher – Persistente Wissensspeicherung und Agentenspeicher

Persistente Wissensspeicherung über einzelne Chat-Threads hinaus.

Dieser Abschnitt sammelt Anleitungen zu persistentem Wissen und Gedächtnis für KI-Systeme — wie Assistenten Fakten, Präferenzen und kondensierten Kontext über Sitzungen hinweg beibehalten, ohne jeden Token in einen einzigen Prompt zu stopfen. Hier bedeutet Gedächtnis die bewusste Speicherung (Nutzerfakten, Zusammenfassungen, durch Plugins gestützte Speicher), nicht GPU-RAM oder Modellgewichte.

Vergleich von Agent Memory Providern — Honcho, Mem0, Hindsight und fünf weitere

Vergleich von Agent Memory Providern — Honcho, Mem0, Hindsight und fünf weitere

Acht anpassbare Backends für ein persistentes Agentengedächtnis.

Moderne Assistenten vergessen nach dem Schließen des Tabs immer noch alles, es sei denn, etwas bleibt über das Kontextfenster hinaus bestehen. Agent Memory Provider (Speicheranbieter für Agenten) sind Dienste oder Bibliotheken, die Fakten und Zusammenfassungen über Sitzungen hinweg halten – oft als Plugins integriert, damit das Framework schlank bleibt, während der Speicher skaliert.

Hermes-Agent-Speichersystem: So funktioniert persistentes KI-Speicher

Hermes-Agent-Speichersystem: So funktioniert persistentes KI-Speicher

Der Unterschied zwischen einem Werkzeug und einem Partner liegt in der „Erinnerung“.

Sie kennen das Prinzip. Sie öffnen einen Chat mit einem KI-Agenten, erläutern Ihr Projekt, teilen Ihre Präferenzen, lassen Aufgaben erledigen und schließen den Tab. Wenn Sie in der folgenden Woche zurückkehren, ist es, als würden Sie mit einem Fremden sprechen – der gesamte Kontext ist verloren, jede Präferenz vergessen, das Projekt muss von Grund auf neu erklärt werden.

Vane (Perplexica 2.0) Schnellstart mit Ollama und llama.cpp

Vane (Perplexica 2.0) Schnellstart mit Ollama und llama.cpp

Selbst gehostete KI-Suche mit lokalen LLMs

Vane ist einer der pragmatischeren Einträge im Bereich „KI-Suche mit Quellenangaben": eine selbst gehostete Antwortmaschine, die live abrufbare Websuche mit lokalen oder Cloud-LLMs kombiniert, während der gesamte Stack unter Ihrer Kontrolle bleibt.