Du erklärst deinem KI-Agenten beim ersten Gespräch, wer du bist, was dein Unternehmen macht, welche Kunden gerade aktiv sind. Der Agent antwortet gut. Zwei Tage später, neue Sitzung: alles weg. Von vorne.

Das ist nicht dein Fehler. Das ist die Standardeinstellung.

Agenten, die auf Claude Managed Agents laufen, haben ohne Zusatzkonfiguration kein KI-Agent-Gedächtnis. Jede Sitzung ist eine leere Seite. Das ist bewusst so gebaut, weil viele Anwendungsfälle keinen dauerhaften Kontext brauchen. Aber wenn dein Agent wissen soll, was letzte Woche besprochen wurde, wer deine Kunden sind und welche Projekte laufen, reicht das nicht.

Die Lösung heißt Gedächtnisspeicher (englisch "Memory Store"). Und es gibt noch eine zweite Sache, die das System erst langlebig macht: ein Hintergrundprozess namens Dreaming. Dieser Artikel zeigt dir, wie beides funktioniert und wann du welche Ebene brauchst.

Warum dein KI-Agent sich nicht erinnert

Abstrakte Illustration in Blau und Gelb: ein leerer weißer Raum mit einer schwebenden leeren Seite, die Sitzungs-Isolation symbolisiert, editorialer Flat-Style

Jeder Aufruf eines KI-Agenten ist eine eigene, abgeschlossene Instanz, Fachbegriff: Sitzung oder "Session". Die Sitzung startet, du chattest, sie endet. Was danach übrig bleibt: nichts. Der Arbeitsspeicher der Sitzung wird geleert.

Für einmalige Aufgaben ist das sinnvoll. Ein Agent, der dir einmalig eine Zusammenfassung schreibt, braucht keinen Langzeitkontext. Aber ein Agent, der wiederholt für dich arbeitet und sich über Wochen an deine Kunden, deine Sprache und deine Entscheidungen erinnern soll, braucht mehr.

Das lässt sich nicht durch clevere Prompts lösen. Selbst der beste Prompt wird beim nächsten Start vergessen. Es ist eine Infrastrukturfrage, keine Formulierungsfrage.

Wenn du noch nicht weißt, was ein KI-Agent grundsätzlich ist, schau dir zuerst meinen Artikel zu KI-Agenten an. Hier geht es direkt darum, wie du einem bestehenden Agenten Gedächtnis gibst.

newsletter.sh

# Neuer Artikel? Du erfährst es als Erstes.

# Kein Spam. Ein kurzes Mail, wenn etwas erscheint.

>

Claude Managed Agents Gedächtnis: wie ein persistenter Speicher funktioniert

Die Lösung von Anthropic heißt Memory Store, auf Deutsch: dauerhafter Gedächtnisspeicher.

Ein Memory Store ist ein Dateisystem, das dauerhaft an eine Sitzung angehängt wird. Stell dir einen Ordner vor, auf den der Agent beim Start zugreifen kann. Er liest dort Dateien, erstellt neue und aktualisiert bestehende. Beim nächsten Start ist der Ordner noch da, mit allem, was der Agent zuvor geschrieben hat.

Der Agent nutzt dafür dieselben Befehle, die er für normale Dateioperationen kennt: Bash-Befehle (also normale Computerbefehle), Dateilesen und Volltextsuche. Das klingt technisch, bedeutet aber praktisch: der Agent kann im Gedächtnisspeicher genauso nach Stichworten suchen, wie du es in einer normalen Dateisuche tust.

Abstrakte Illustration eines vernetzten Dateisystems mit schwebenden Ordnern in Blau und Gelb, dauerhafte Datenspeicherung symbolisierend, editorialer Flat-Style

Du kannst mehrere Memory Stores anlegen und sie unterschiedlich abgrenzen. Einen Speicher pro Kundenorganisation. Einen pro Mitarbeiter. Oder einen gemeinsamen für dein Team. Du entscheidest, wo die Grenzen liegen.

Zusätzlich gibt es einen Zugriffsparameter: Standard ist Lesen und Schreiben. Du kannst ihn auf "nur lesen" setzen, wenn der Agent den Speicher nicht verändern soll, zum Beispiel für eine Wissensdatenbank, die du manuell pflegst.

Was beim ersten Gespräch passiert

Wenn du eine Sitzung mit angehängtem Gedächtnisspeicher startest, liest der Agent zuerst im Speicher nach. Gibt es etwas Relevantes? Er sucht nach Kontext, bevor er antwortet.

Beim ersten Gespräch ist der Speicher leer. Der Agent nimmt die neuen Informationen und schreibt sie strukturiert in Dateien. Er entscheidet selbst, wie er sie benennt und organisiert. Das lässt sich durch einen zusätzlichen Prompt steuern: "Speichere Kundengespräche immer unter /kunden/DATUM-KUNDENNAME.md."

Ab der zweiten Sitzung findet der Agent diese Dateien und baut darauf auf. Er erinnert sich, weil er nachgelesen hat, nicht weil das Modell irgendein biologisches Gedächtnis entwickelt. Das ist wichtig zu verstehen, weil es auch die Grenzen erklärt.

So richtest du einen Gedächtnisspeicher ein

Abstrakte Illustration einer schrittweisen Einrichtung mit Checkboxen und Verbindungspfeilen in Blau und Gelb, editorialer Flat-Style

Das Einrichten läuft über die Claude Managed Agents API oder direkt über die Console, die grafische Verwaltungsoberfläche von Anthropic. Du brauchst einen Anthropic-Account mit API-Zugang.

Die vier Schritte:

  1. Einen neuen Memory Store anlegen. Du gibst ihm einen Namen und optional eine Beschreibung, wofür er gedacht ist.
  2. Den Memory Store beim Erstellen einer neuen Sitzung anhängen. Dazu übergibst du die Speicher-ID im Anfrage-Objekt (dem Datensatz, den du an die API schickst).
  3. Optional: einen Prompt mitgeben, der dem Agenten sagt, worauf er sich konzentrieren soll. Zum Beispiel: "Merke dir Kundennamen, Projektstatus und offene Folgefragen."
  4. Optional: Zugriffsrechte auf "nur lesen" setzen, wenn der Agent den Speicher nicht überschreiben soll.

Über die Console gibt es eine Dateisystem-Ansicht, die live zeigt, was der Agent in den Speicher geschrieben hat. Du kannst Dateien bearbeiten, neue manuell hinzufügen oder fehlerhafte Einträge direkt korrigieren. Das ist auch der schnellste Weg für einen ersten Test, ohne eine einzige Zeile Code zu schreiben.

Dreaming: das, was deinen Gedächtnisspeicher aufräumt

Hier kommt das Problem, das man erst nach ein paar Wochen bemerkt.

Ein Agent, der dauerhaft in einen Gedächtnisspeicher schreibt, schreibt auch viel Unnötiges. Nach drei Monaten steht dort: derselbe Kundenname siebenmal mit leichten Abweichungen, ein Projekt, das längst abgeschlossen ist, Daten, die beim Hinschreiben stimmten und jetzt falsch sind.

Ein voller, unorganisierter Speicher macht den Agenten ungenauer. Er durchsucht mehr Dateien, findet mehr Widersprüche und gibt schlechtere Antworten.

Anthropic hat dafür eine Funktion gebaut, die sie Dreaming nennen. Während dein Agent nicht aktiv ist, läuft ein eigener Hintergrundprozess, der den Speicher systematisch durchgeht.

Was Dreaming konkret tut

Dreaming ist ein asynchroner Job, also ein Prozess, der im Hintergrund läuft, ohne dass du dabei sein musst. Du startest ihn über die API oder Console. Er läuft dann selbstständig.

Als Eingabe bekommt er:

  • Den Gedächtnisspeicher, den er bearbeiten soll
  • Eine Liste vergangener Sitzungsprotokolle, damit er weiß, was in diesen Gesprächen wichtig war

Was dann passiert:

  1. Faktencheck: Hat der Agent etwas Falsches gespeichert?
  2. Anreicherung: Fehlen Details aus den Sitzungsprotokollen, die noch nicht im Speicher gelandet sind?
  3. Deduplizierung: Welche Einträge sind Varianten desselben Inhalts?
  4. Indexierung: Dreaming legt eine Indexdatei an, damit zukünftige Agenten schneller finden, was sie suchen.

Das Entscheidende: Dreaming berührt den Original-Speicher nicht. Es klont ihn zuerst und schreibt alle Änderungen in einen neuen Ausgabe-Speicher. Du siehst in der Console den genauen Unterschied zwischen vorher und nachher. Wenn dir etwas nicht gefällt, hast du den alten Stand noch.

Kevin, Entwickler bei Anthropic, hat in einem öffentlichen Workshop erklärt, dass Dreaming bei typischen Anwendungsfällen eine Cache-Trefferrate von rund 95 Prozent erreicht. Das bedeutet: der größte Teil der Rechenarbeit nutzt bereits berechnete Zwischenergebnisse. Dreaming ist trotz seiner Tiefe vergleichsweise günstig.

Abstrakte Illustration eines Hintergrundprozesses mit Uhr und aufgeräumten Ordnern in Blau und Gelb, editorialer Flat-Style

Wann du Dreaming laufen lässt

Anthropics Empfehlung: fahre Dreaming über eine Gruppe von 10 bis 20 Sitzungen, also etwa einmal pro Woche bei täglicher Nutzung. Du kannst Dreaming auch mit zusätzlichen Anweisungen steuern. Zum Beispiel: "Achte besonders darauf, dass alle Projektdeadlines mit korrektem Datum gespeichert sind." Für präzisionskritische Bereiche lohnt sich das.

Du kannst außerdem zwischen zwei Modellen wählen: Claude Opus 4.7 für höhere Qualität oder Claude Sonnet 4.6 für niedrigere Kosten. Das hängt davon ab, wie sensibel dein Gedächtnisspeicher ist und wie viel Durchlässigkeit du bei der Bereinigung akzeptierst.

Die drei Ebenen: Sitzung, Gedächtnis, Dreaming

Das Trio ist aufeinander aufgebaut, aber jede Ebene ist unabhängig nutzbar.

Abstrakte Illustration einer dreistufigen Treppe in Blau und Gelb mit Symbolen für Sitzung, Speicher und Hintergrundprozess, editorialer Flat-Style

  • Sitzung: eine einzelne Agenten-Instanz. Alles darin ist flüchtig. Für einmalige Aufgaben die richtige Wahl.
  • Gedächtnisspeicher: ein persistentes Dateisystem, das an Sitzungen angehängt wird. Informationen bleiben über Sitzungen hinweg erhalten. Der Agent liest und schreibt dort wie in einem normalen Ordner.
  • Dreaming: ein Hintergrundprozess, der den Gedächtnisspeicher regelmäßig aufräumt, überprüft und verbessert. Nicht nötig für kurze Tests, wichtig für produktive Nutzung über Wochen.

Du brauchst nicht alle drei. Wer einen Agenten ein paar Stunden testet, kommt mit einer einfachen Sitzung aus. Wer eine Firmenerinnerung aufbaut, die über Monate wächst, braucht alle drei Ebenen.

Wofür das in der Praxis taugt

Abstrakte Illustration von vier schwebenden Symbolen in Blau und Gelb: Gespräch, Kalender, E-Mail, Ordner, editorialer Flat-Style

Die Fälle, in denen dauerhaftes KI-Gedächtnis wirklich etwas ändert:

Kundenhistorie für Agenturen und Berater. Jedes Kundengespräch landet im Speicher. Vor dem nächsten Call fragt der Agent: "Was haben wir zuletzt mit Müller besprochen?" Er antwortet aus dem Speicher, nicht aus einer Vermutung.

Meeting-Dokumentation. Du diktierst nach jedem Meeting eine kurze Zusammenfassung. Der Agent speichert sie strukturiert. Nach sechs Monaten hast du ein vollständiges, durchsuchbares Gedächtnis aller wichtigen Entscheidungen, ohne einen einzigen Ordner manuell zu pflegen.

Personalisierte Kommunikation. Ein Agent, der hundert Angebote und Kundenprofile kennt, schreibt Kaltakquise-Mails, die nach dir klingen. Nicht nach generischer KI-Vorlage. Dieser Fall braucht Pflege: die Kundendaten müssen strukturiert im Speicher liegen, bevor das gut funktioniert.

Internes Firmenwissen. Neue Mitarbeiter fragen den Agenten, warum Entscheidung X damals so getroffen wurde. Wenn der Hintergrund im Speicher steht, antwortet der Agent, ohne dass ein erfahrener Kollege gefragt werden muss.

Wenn du solche Workflows noch ohne eigene Infrastruktur aufbauen willst, lohnt ein Blick auf KI-Assistent erstellen, wo ich die verschiedenen Wege von No-Code bis Custom API vergleiche.

Was es nicht kann

Dauerhaftes KI-Gedächtnis ist kein Selbstläufer.

Wenn du dem Agenten in einer Sitzung falsche Informationen gibst, schreibt er sie auch so. Dreaming kann Fehler korrigieren, aber nur, wenn es aus anderen Sitzungsprotokollen ableiten kann, was korrekt wäre. Garbage in, garbage out.

Und: je mehr in den Speicher geschrieben wird, ohne Dreaming zu nutzen, desto ungenauer wird der Abruf. Dreaming ist kein optionales Upgrade. Bei dauerhafter Nutzung ist es der Unterschied zwischen einem System das nach drei Monaten besser wird und einem das schlechter wird.

Was das kostet und wann du die kostenlose Alternative nimmst

Abstrakte Illustration eines Vergleichs zwischen einem lokalen Ordner auf einem Laptop und einem Cloud-Server mit Münzen, editorialer Flat-Style in Blau und Gelb

Ehrliche Antwort zuerst: Claude Managed Agents ist kein Produkt für Max-Plan-Nutzer.

Der Max Plan (100 $ pro Monat) gibt dir Zugang zu claude.ai und Claude Code. Das ist alles. Claude Managed Agents läuft über die Anthropic API, die separat nach verbrauchten Token abgerechnet wird. Du brauchst also einen API-Schlüssel und ein API-Guthaben, bevor du auch nur einen Memory Store anlegen kannst. Wenn du gerade nur einen Max Plan hast, kommen API-Kosten obendrauf.

Wie teuer ist es? Das hängt stark vom Nutzungsvolumen ab. Die Token-Kosten für das Modell (Claude Sonnet oder Opus) bei jeder Sitzung, der Speicherplatz für den Memory Store und die Dreaming-Jobs zusammen können schnell 30 bis 100 € pro Monat erreichen, wenn du täglich damit arbeitest. Für ein produktives Team oder ein Kundenprodukt kann es mehr sein.

Die kostenlose Alternative: Claude Code + Dateisystem

Wenn du als Solopreneur oder im kleinen Team arbeitest, brauchst du Claude Managed Agents wahrscheinlich gar nicht.

Claude Code hat dasselbe Konzept eingebaut, ohne zusätzliche Kosten. Du legst eine Ordnerstruktur auf deinem Rechner an, schreibst eine CLAUDE.md-Datei als Agenten-Briefing und startest Claude Code in diesem Ordner. Der Agent liest beim Start automatisch alle relevanten Dateien und hat damit einen dauerhaften Kontext.

Das ist kein schlechter Ersatz. Es ist für viele Anwendungsfälle die bessere Wahl, weil:

  • Du volle Kontrolle über alle gespeicherten Daten hast
  • Keine API-Kosten anfallen, solange du Claude Code im Max Plan nutzt
  • Du die Dateien jederzeit direkt lesen, bearbeiten oder exportieren kannst
  • Es kein Vendor-Lock-in gibt

Wie das konkret aussieht, zeigt der Artikel KI-Agenten erstellen mit einem vollständigen Schritt-für-Schritt-Beispiel für ein Firmengedächtnis.

Open Source Alternativen für Entwickler

Wenn du einen Agenten baust, der nicht auf deinem eigenen Rechner läuft, also zum Beispiel ein Produkt für Kunden oder ein Team-Tool mit eigenem Server, gibt es gute open source Optionen:

  • mem0: Der populärste open source Memory Layer für KI-Agenten. Funktioniert mit Claude, OpenAI und anderen Modellen. Kann lokal betrieben oder über ihre Cloud genutzt werden.
  • Zep: Dauerhafter Gedächtnisspeicher speziell für KI-Agenten. Open source mit einer kostenlosen Cloud-Option.
  • Letta (früher MemGPT): Vollständiges Agent-Framework mit persistenter Erinnerung, komplett self-hosted betreibbar.

Wann CMA Memory Stores Sinn ergeben

Claude Managed Agents lohnt sich wenn:

  • Du ein Produkt baust, das Agenten für mehrere Kunden gleichzeitig betreibt
  • Du Anthropic-seitig verwaltete Infrastruktur willst, ohne eigenen Server
  • Dreaming als verwalteter Batch-Job ein echtes Zeitersparnis für dich ist
  • Du ohnehin schon API-Zugang hast und die Kosten im Verhältnis zum Nutzen stehen

Für den persönlichen Einsatz als Freelancer oder kleines Team ist Claude Code + Dateisystem fast immer der smartere Start.