Anthropic lässt KI träumen

Anthropic lässt KI träumen

KI-Logbuch
3,000 subscribers
Subscribed
Anthropic lässt KI träumen
Arno Selhorst
AI-powered Innovation for Sales & Service

–>> Du bist unterwegs und kannst das KI-Logbuch gerade nicht lesen? Dann hör Dir die KI-generierte Podcast-Version dieser Ausgabe an – einfach auf Play drücken. <<–

Liebe Neugierige, Kreative, Entdecker*innen,

San Francisco, Mittwoch, 6. Mai 2026, irgendwann nachmittags zwischen den Keynotes. Simon Willison sitzt im Saal, live-bloggt mit, und tippt einen unscheinbaren Satz: „Dreaming looks really interesting.“ Vier Worte. Auf der Bühne ist gerade ein Feature gefallen, das nicht „GPT-irgendwas“ heißt, nicht zehn Milliarden Parameter mehr bringt, keine neue Benchmark-Bestmarke knackt. Es heißt schlicht Dreaming – und genau das hat mich genauer hinhören und -schauen lassen.

„All men dream: but not equally. Those who dream by night in the dusty recesses of their minds wake in the day to find that it was vanity: but the dreamers of the day are dangerous men, for they may act their dreams with open eyes, to make it possible.“ — T. E. Lawrence, Seven Pillars of Wisdom (1922)

Worum geht es? Um KI-Agenten, die zwischen den Sessions schlafen gehen, ihre eigenen Protokolle durchwühlen, Muster heben, Fehler erkennen – und am nächsten Morgen schlauer aufwachen. Klingt nach Science-Fiction. Ist seit ein paar Wochen aber eine API.

Dreaming: Wenn KI-Agenten zwischen den Schichten an sich selbst arbeiten

Was Anthropic am 6. Mai im Rahmen seiner Entwicklerkonferenz Code with Claude als Research Preview vorgestellt hat, klingt erst einmal harmlos: ein neues Feature für die sogenannten Managed Agents. Liest man den Blog-Eintrag aber mal ganz genau und langsam, ändert sich etwas. Dreaming ist ein geplanter, asynchroner Prozess. Du wirfst Deinem Agenten einen bestehenden Memory Store zu, optional bis zu 100 vergangene Sessions – und er rekonstruiert daraus einen neuen, aufgeräumten Speicher. Duplikate verschmolzen, widersprüchliche Einträge aktualisiert, neue Erkenntnisse herausgeschält. Das Ganze läuft, während Du Kaffee trinkst (oder schläfst – passenderweise).

Klingt unspektakulär? Bisher kämpfen alle großen Sprachmodelle mit demselben strukturellen Problem: Sie haben kein Langzeitgedächtnis. Was im Kontextfenster nicht mehr reinpasst, ist weg. „Compaction“ – also das Zusammenpressen von Konversationen – funktioniert nur innerhalb einer Session. Dreaming geht den Schritt weiter und arbeitet zwischen den Sessions, sogar zwischen mehreren Agenten desselben Teams. Wichtig dabei (und für mich der eigentliche Charme): Es werden keine Modellgewichte verändert. Der Agent schreibt seine Lehren als Klartext-Notizen und strukturierte „Playbooks“ – einsehbar, auditierbar, korrigierbar. Wer skeptisch ist, kann den Output prüfen, bevor er überschrieben wird; die technische Doku beschreibt das fein säuberlich.

Frühe Zahlen sind interessant. Die Legal-AI-Firma Harvey berichtet im Anthropic-Post von einer rund sechsfach höheren Completion-Rate bei langen Dokumenten-Workflows, seit ihre Agenten zwischen den Sessions „träumen“. Netflix nutzt das Schwesterfeature Multiagent Orchestration, um Hunderte Build-Logs parallel zu durchforsten. Wisedocs verkürzt Dokumentenprüfungen um die Hälfte. Klingt nach den üblichen Hersteller-Anekdoten – und doch zeigt es eine Richtung an, die Du Dir merken solltest:

Agenten lernen zwischen den Einsätzen. Nicht durch teures Re-Training, sondern durch reflektierte Notizen.

Eine kleine Verschiebung. Aber eine, die das Verhältnis von Modell und Memory dauerhaft verändern könnte.

Wie kann man sich das in der Praxis vorstellen? Wer kennt das nicht: man nutzt gerade ein neues KI-Tool, erklärst ihm zum zwölften Mal denselben Sonderfall in Deinem Excel-Export, und seufzt. Stell Dir vor, der Agent merkt sich diesen Sonderfall – nicht für die nächste Antwort, sondern für die nächste Woche, das nächste Quartal, den nächsten Kollegen. Genau dieser Schritt ist es, der mich diese Woche beschäftigt. Wir haben darüber schon einmal nachgedacht – im KI-Logbuch „Alleingang? Wie sich KI durch selbstverbessernde Algorithmen selber optimiert“ (das hatte ich bereits vor mehr als einem Jahr, am 5. März 2025, veröffentlicht). Damals ging es um Modelle, die sich selbst trainieren. Heute geht es um etwas Bescheideneres – und vielleicht Praktischeres: Agenten, die sich selbst Notizen machen.

Outcomes, Multi-Agent-Orchestrierung – und der biologische Cousin

Dreaming kam nicht allein. Anthropic hat im selben Atemzug zwei weitere Features in die öffentliche Beta gehievt: Outcomes und Multi-Agent-Orchestrierung. Outcomes ist im Kern eine Rubrik. Du beschreibst, was „gut“ aussieht – eine Struktur, ein Markenwortlaut, eine Liste zu erfüllender Anforderungen –, und ein separater Grader-Agent prüft im eigenen Kontextfenster, ob das Ergebnis hält, was es verspricht. Wenn nicht, geht’s zurück an den Hauptagenten. In Anthropics Tests, dokumentiert bei VentureBeat, legt das die Task-Erfolgsrate um bis zu zehn Prozentpunkte zu, mit den größten Gewinnen bei docx- und pptx-Generierung. Multi-Agent-Orchestrierung wiederum lässt einen Lead-Agent komplexe Jobs in Häppchen zerlegen und an Sub-Agenten verteilen – jeder mit eigenem Modell, eigenem Prompt, eigenen Werkzeugen. Wer das in Echtzeit beobachten will, findet bei „2222 eine schöne Übersicht der drei Bausteine. Drei Hebel, ein Ziel: Agenten, die in komplexen Aufgaben weniger händisches Steuern brauchen.

Was die Neurowissenschaft seit Jahrzehnten weiß

Die Metapher „Träumen“ ist hier kein PR-Spaß. Sie verweist auf eine seit den 1980er Jahren gut belegte Erkenntnis der Neurowissenschaft: Im Schlaf, vor allem im Tiefschlaf, „spielt“ der Hippocampus tagsüber gemachte Erfahrungen verkürzt noch einmal ab – sogenanntes Memory Replay in Verbindung mit Sharp Wave Ripples – und „lehrt“ damit den Neokortex. So wandern Erinnerungen vom Kurzzeit- ins Langzeitgedächtnis. Eine Übersichtsarbeit im Journal Neuron beschreibt diesen Prozess als „koordiniertes Zusammenspiel aus thalamischen Spindeln, kortikalen langsamen Wellen und noradrenerger Aktivität“. Anthropics „Dreaming“ ist keine Eins-zu-eins-Übertragung dieser Mechanik, aber die funktionale Analogie ist verblüffend genau: Erfahrungen sichten, verdichten, konsolidieren, das Wichtige behalten, den Rest verwerfen. Und nebenbei: Schon 2023 hat Danijar Hafner mit DreamerV3 gezeigt, dass „Träumen“ – im Sinne imaginierter Rollouts in einem Weltmodell – bestehende Reinforcement-Learning-Methoden über 150 Aufgaben hinweg schlagen kann. Die Metapher kreist also lange schon. Sie kommt jetzt eigentlich nur im „Enterprise-Stack“ an.

Schon gewusst?

Der Begriff Dreaming taucht in der KI-Forschung nicht erst seit letzter Woche auf. Schon Anfang 2023 veröffentlichte Danijar Hafner mit seinem Team „DreamerV3″ – einen Reinforcement-Learning-Algorithmus, der sich seine nächsten Schritte erst in einem inneren Weltmodell vorträumt und dann handelt. Das System war übrigens das erste, das in Minecraft autonom und ohne menschliche Beispiele Diamanten finden konnte. Dreaming als Begriff ist also weniger ein Marketing-Trick als ein Querverweis auf eine ganze Forschungslinie – ein Wink mit dem Zaunpfahl, dass man hier Schultern von Riesen berührt, auf denen man steht.

Tips und Tricks – Wenn Du selbst mit Agenten-Memory experimentieren willst

Nutze Obsidian zusammen mit einem starken KI Modell. Hier kannst Du im Kleinen schon viel ausprobieren und KI mit Deinen Notizen arbeiten (oder auch träumen?) lassen.
Klein anfangen. Wirf nicht hundert Sessions auf einmal in einen Dream-Job. Drei bis fünf reichen, um zu sehen, was Dein Agent als „Muster“ erkennt – und was Unsinn ist.
Review-Modus zuerst. Lass Dir die neu kuratierten Memories zeigen, bevor der Agent sie automatisch übernimmt. Wer der KI hier blind vertraut, baut sich Bias in die Pipeline.
Saubere Playbook-Namen. Wenn Dein Agent „decent-playbook.md“ oder „pptx-quirks.md“ schreibt, hilft eine klare Namenskonvention – sonst hast Du in drei Wochen einen Memory-Speicher voller kryptischer Schnipsel.
Vorher messen, dann träumen lassen. Definier‘ eine kleine Baseline (z. B. zehn Standard-Aufgaben), bevor Du Dreaming aktivierst. Sonst kannst Du später nicht sagen, ob die „Sechsfach-Verbesserung“ auch bei Dir gilt oder ob Du Dich gerade selber überzeugst.
Verzicht ist auch ein Move. Nicht jeder Workflow braucht Erinnerung. Für Einmal-Tasks reicht ein guter Prompt. Memory ist Pflege – und Pflege kostet Zeit.

Top Links

Tool: Anthropic Claude Managed Agents – „Dreams“-Dokumentation – API-Referenz inkl. Beta-Header dreaming-2026-04-21.
Studie: Klinzing, Niethard & Born, „Mechanisms of systems memory consolidation during sleep“, Nature Neuroscience 2019 – Übersichtsarbeit zur biologischen Vorlage, die Anthropic implizit zitiert.
Best Practice: Harvey – AI-Plattform für Legal-Workflows – jenes Team, dessen Agenten laut Anthropic ihre Erfolgsquote durch Dreaming versechsfacht haben.

Was bleibt?

Was bleibt? Für mich vor allem dies: Die Tech-Welt redet seit Monaten von „immer größeren Modellen“, „immer mehr Rechenzentren“, „immer mehr GPUs“. Anthropic hat letzte Woche etwas anderes getan – ein kleines, fast langweiliges, fast meditatives Feature gezeigt. Eines, das nicht auf mehr Parameter setzt, sondern auf mehr Reflexion. Das ist – Hand aufs Herz – ungewöhnlich für diese Branche. Und vielleicht genau das, was wir gerade brauchen. KI, die nicht laut wird, sondern leise lernt. Die nicht reden will, sondern aufräumen. Die nicht Glanz produziert, sondern Klarheit. Ob es bleibt? Keine Ahnung. Research Preview heißt: kann gut werden, kann auch versanden. Aber die Richtung gefällt mir. Ich werde es ausprobieren, wie immer alles was kleiner, vielleicht ja in Verbindung mit meiner Obsidian Instanz. Ich werde Euch berichten und natürlich auch gern wissen: Taugt sowas was? Und wenn „Ja“, wo würdet Ihr Eure Agenten träumen lassen? In welchem Workflow wäre Erinnerung mehr wert als zehn weitere Prompts?

„Wer nach außen schaut, träumt; wer nach innen schaut, erwacht.“ — Carl Gustav Jung, Aion (1951)

Danke, dass Du diese Woche wieder mit mir mitgedacht hast. Ich freu mich auf Deine Kommentare, Deine Beispiele, Deine Skepsis – und auf Deine Erfahrungen mit träumenden Algorithmen.

Bis nächste Woche,

Euer Arno

Anthropic Lets AI Dream

–> Click here to listen to an AI-generated Podcast version of this newsletter. <<–

Dear curious, creative, explorers,

San Francisco, Wednesday, 6 May 2026, somewhere between the keynotes. Simon Willison sits in the room, live-blogging, and types one unassuming sentence: „Dreaming looks really interesting.“ Three words. On stage, a feature has just dropped that isn’t called „GPT-something“, doesn’t add ten billion parameters, doesn’t smash a new benchmark. It is simply called Dreaming – and that’s exactly my AI Gem of the week.

„All men dream: but not equally. Those who dream by night in the dusty recesses of their minds wake in the day to find that it was vanity: but the dreamers of the day are dangerous men, for they may act their dreams with open eyes, to make it possible.“ — T. E. Lawrence, Seven Pillars of Wisdom (1922)

What’s it about? AI agents that go to sleep between sessions, comb through their own transcripts, lift patterns, identify mistakes – and wake up the next morning a little smarter. Sounds like science fiction. As of last week, it’s an API.

Dreaming: When AI agents work on themselves between shifts

What Anthropic unveiled on 6 May at its developer conference Code with Claude as a Research Preview sounds harmless at first: a new feature for so-called Managed Agents. Read the blog post slowly and the impression shifts. Dreaming is a scheduled, asynchronous process. You hand your agent an existing memory store, optionally up to 100 past sessions – and it reconstructs a new, cleaned-up store from them. Duplicates merged, contradictory entries updated, new insights surfaced. The whole thing runs while you sip your coffee (or sleep – fittingly).

Sounds unspectacular? It isn’t. So far, every large language model wrestles with the same structural problem: it has no long-term memory. Whatever doesn’t fit into the context window is gone. „Compaction“ – squeezing conversations together – works only within a session. Dreaming takes the next step and works between sessions, even across multiple agents on the same team. Crucially (and for me the real charm here): no model weights are touched. The agent writes its lessons as plain-text notes and structured „playbooks“ – inspectable, auditable, correctable. If you’re skeptical, you can review the output before it overwrites anything; the technical docs spell that out clearly.

The early numbers are interesting. Legal AI company Harvey reports a roughly sixfold increase in completion rate for long document workflows since their agents started „dreaming“ between sessions. Netflix uses the sibling feature Multiagent Orchestration to comb through hundreds of build logs in parallel. Wisedocs cuts document review in half. Sounds like the usual vendor anecdotes – yet it points in a direction worth remembering. The real thing happening here: agents learn between deployments. Not through expensive re-training, but through reflective notes. A small shift. But one that could permanently change the relationship between model and memory.

I’ve thought this all the way through. We all know it: you’re sitting with a new tool, explaining for the twelfth time the same edge case in your Excel export, and sighing. Imagine the agent remembering this edge case – not for the next reply, but for the next week, the next quarter, the next colleague. That’s the step that’s been on my mind this week. We’ve thought about this once before – in the KI-Logbuch issue „Alleingang? Wie sich KI durch selbstverbessernde Algorithmen selber optimiert“ (published 5 March 2025). Back then it was about models training themselves. Today it’s about something more humble – and perhaps more practical: agents taking notes for themselves.

Outcomes, multi-agent orchestration – and the biological cousin

Dreaming didn’t come alone. Anthropic moved two other features into public beta in the same breath: Outcomes and multi-agent orchestration. Outcomes is, at heart, a rubric. You describe what „good“ looks like – a structure, a brand voice, a list of must-haves – and a separate grader agent checks in its own context window whether the result delivers. If not, it bounces back to the main agent. In Anthropic’s tests, as documented by VentureBeat, that lifts task success by up to ten points, with the biggest gains in docx and pptx generation. Multi-agent orchestration in turn lets a lead agent break complex jobs into pieces and delegate them to sub-agents – each with its own model, prompt, tools. If you want to watch this in real time, The New Stack has a fine overview of the three building blocks. Three levers, one goal: agents that need less hand-holding on complex tasks.

What neuroscience has known for decades

The „dreaming“ metaphor isn’t a PR trick. It points to a well-documented insight in neuroscience since the 1980s: during sleep, especially deep sleep, the hippocampus „replays“ experiences from the day in compressed form – so-called memory replay in coordination with sharp wave ripples – and „teaches“ them to the neocortex. That’s how memories migrate from short- to long-term storage. A review in Neuron describes this as a coordinated interplay of thalamic spindles, cortical slow oscillations, and noradrenergic activity. Anthropic’s „dreaming“ is not a one-to-one transfer of that mechanism – but the functional analogy is uncannily precise: sift experience, compress it, consolidate, keep what matters, discard the rest. And by the way: as early as 2023, Danijar Hafner showed with DreamerV3 that „dreaming“ – in the sense of imagined rollouts in a world model – can beat existing reinforcement learning methods across 150-plus tasks. The metaphor has been circling for years. It’s now arriving in the enterprise stack.

Did you know?

The term Dreaming didn’t appear in AI research only last week. As early as 2023, Danijar Hafner and his team published DreamerV3 – a reinforcement learning algorithm that dreams its next steps inside an internal world model before acting. The system, by the way, was the first to find diamonds in Minecraft autonomously, without human examples. Dreaming as a term is therefore less a marketing trick than a nod to an entire line of research – a hint that the giants here are standing on shoulders.

Tips and tricks – if you want to experiment with agent memory yourself

Start small. Don’t throw a hundred sessions into a dream job at once. Three to five are enough to see what your agent recognizes as a „pattern“ – and what’s noise.
Review mode first. Have the newly curated memories shown to you before the agent adopts them automatically. Anyone who blindly trusts the AI here builds bias into the pipeline.
Clean playbook names. When your agent writes „decent-playbook.md“ or „pptx-quirks.md“, a clear naming convention helps – or in three weeks you’ll have a memory store full of cryptic fragments.
Measure first, dream later. Define a small baseline (e.g. ten standard tasks) before you enable dreaming. Otherwise you can’t tell later whether the „sixfold improvement“ also applies to you – or whether you’re just convincing yourself.
Abstinence is a move, too. Not every workflow needs memory. One-off tasks do fine with a good prompt. Memory is care – and care costs time.

Top Links

Tool: Anthropic Claude Managed Agents – „Dreams“ documentation. API reference incl. beta header dreaming-2026-04-21.
Study: Klinzing, Niethard & Born, „Mechanisms of systems memory consolidation during sleep“, Nature Neuroscience 2019 – review of the biological template Anthropic implicitly cites.
Best Practice: Harvey – the AI platform for legal workflows whose agents reportedly increased their completion rate sixfold through dreaming.

What remains?

What remains? For me, above all this: the tech world has been talking for months about „bigger models“, „more data centres“, „more GPUs“. Last week Anthropic did something different – it showed a small, almost boring, almost meditative feature. One that does not bet on more parameters but on more reflection. That is – hand on heart – unusual for this industry. And perhaps exactly what we need right now. AI that doesn’t get loud, but learns quietly. That doesn’t want to talk, but to tidy up. That doesn’t produce gloss, but clarity. Will it last? No idea. Research Preview means: could become good, could fizzle out. But I like the direction. I’ll try it, I’ll report back – and I’d love to know: where would you let your agents dream? In which workflow would memory be worth more than ten more prompts?

„Who looks outside, dreams; who looks inside, awakes.“ — Carl Gustav Jung, Aion (1951)

Thanks for thinking along this week. I look forward to your comments, your examples, your skepticism – and to your dreams in the pipeline.

Until next week,

Yours, Arno

Alle Links dieser Ausgabe / Link list

Simon Willison – Live-Blog Code w/ Claude 2026: https://simonwillison.net/2026/May/6/code-w-claude-2026/
T. E. Lawrence – „All men dream“ (Goodreads, Quote-Eintrag Seven Pillars of Wisdom): https://www.goodreads.com/quotes/11340-all-men-dream-but-not-equally-those-who-dream-by
Anthropic – Code with Claude (Event-Seite): https://claude.com/code-with-claude
Anthropic Blog – „New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration“ (6. Mai 2026): https://claude.com/blog/new-in-claude-managed-agents
Anthropic Docs – „Dreams“ (Managed Agents, Build persistent memory): https://platform.claude.com/docs/en/managed-agents/dreams
VentureBeat – „Anthropic introduces ‚dreaming‘, a system that lets AI agents learn from their own mistakes“: https://venturebeat.com/technology/anthropic-introduces-dreaming-a-system-that-lets-ai-agents-learn-from-their-own-mistakes
The New Stack – „Anthropic will let its managed agents dream“: https://thenewstack.io/anthropic-managed-agents-dreaming-outcomes/
Klinzing, Niethard & Born – „Mechanisms of systems memory consolidation during sleep“, Nature Neuroscience (2019): https://www.nature.com/articles/s41593-019-0467-3
Brodt, Inostroza, Niethard & Born – „Sleep – A brain-state serving systems memory consolidation“, Neuron (2023): https://www.cell.com/neuron/fulltext/S0896-6273(23)00201-5
Hafner et al. – „Mastering Diverse Domains through World Models“ (DreamerV3), arXiv: https://arxiv.org/abs/2301.04104
Harvey – AI-Plattform für Legal-Workflows: https://www.harvey.ai/
Carl Gustav Jung – „Wer nach außen schaut, träumt …“ (BuboQuote, Aion 1951): https://www.buboquote.com/en/quote/841-jung-who-looks-outside-dreams-who-looks-inside-awakes

Zusätzliche Recherche-Links

SiliconANGLE – „Anthropic is letting Claude agents ‚dream‘ so they don’t sleep on the job“: https://siliconangle.com/2026/05/06/anthropic-letting-claude-agents-dream-dont-sleep-job/
Anthropic Blog – „Built-in memory for Claude Managed Agents“ (29. September 2025): https://claude.com/blog/claude-managed-agents-memory
Anthropic Docs – „Memory stores“ (Managed Agents): https://platform.claude.com/docs/en/managed-agents/memory
Wisedocs – „Building Managed Agents for Document Verification“: https://www.wisedocs.ai/blogs/building-managed-agents-for-document-verification
9to5Mac – „Anthropic updates Claude Managed Agents with three new features“ (7. Mai 2026): https://9to5mac.com/2026/05/07/anthropic-updates-claude-managed-agents-with-three-new-features/
Crypto Briefing – „Anthropic brings dreaming, outcomes, and multiagent orchestration to Claude agents“: https://cryptobriefing.com/anthropic-claude-agents-dreaming/

Like
Comment
Share
0 Comments

Add a comment…

KI-Logbuch

Inspiration, Entdeckungen, Anwendungen

3,000 subscribers

Subscribed
Unsubscribe from {:entityName}

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert