2026 verlassen KI-Agenten serienweise die Pilot-Phase. In aktuellen Projekten zeichnet sich ein klares Muster ab: Wer den Sprung in den produktiven Betrieb schafft, hat sein Team früh anders aufgestellt. Schon lange nicht mehr rund um die beste Prompt-Formulierung, sondern um echte Engineering-Disziplin.
Vor zwei Jahren reichte vielleicht ein versierter Prompt Engineer im Team. Heute braucht es ein breiteres Profil. IBM hat dieses Berufsbild - den Agent Engineer - in sieben Kernkompetenzen gefasst, die sich in der Praxis bestätigen:
- System Design. Ein Agent ist kein einzelner LLM-Aufruf, sondern ein Orchester aus Modellen, Tools, APIs, Datenbanken und Sub-Agenten. Architektur entscheidet über Stabilität.
- Tool- und Vertragsdesign. Strikte Schemata verhindern halluzinierte Lücken. „Authentication-Rot" und „Schema-Drift" sind die häufigsten stillen Tool-Fehler.
- Retrieval Engineering. Chunking, Embeddings, Re-Ranking. Die Qualität der abgerufenen Dokumente ist die Obergrenze des Agenten.
- Reliability Engineering. Retries, Timeouts, Fallbacks, Circuit Breaker. Backend-Tugenden, übertragen auf nicht-deterministische Komponenten.
- Security & Safety. Prompt Injection ist real. Klare Action-Boundaries sind die Grundlage jeder produktiven Freigabe.
- Evaluation & Observability. Wer nicht erklären kann, warum der Agent gescheitert ist, kann ihn nicht weiterentwickeln. Tracing schlägt Bauchgefühl.
- Product Thinking. Erwartungs-Management, Vertrauensaufbau, eleganter Umgang mit Fehlern, klare Übergabe an den Menschen. Ohne UX bleibt der beste Agent ungenutzt.
Eine aktuelle Auswertung zeigt, warum dieser Rollenwechsel keine Modeerscheinung ist: Rund 79 Prozent der Produktionsfehler stammen aus schwachen Spezifikationen, Koordinationsbrüchen oder unzureichender Verifikation (FutureAGI 2026). Engineering-Themen, keine Prompt-Themen.
Parallel entsteht eine zweite Rolle: die fachliche Betriebsführung. Sie definiert, was der Agent darf, welche Daten er nutzt, wann eskaliert wird. Engineering trifft hier auf Governance und Prozess.
Was sich daraus konkret ableiten lässt:
- Die sieben Kompetenzen als Reifegradraster nutzen. Eine ehrliche Selbsteinschätzung zeigt, wo die größten Lücken sitzen.
- Eine Pilotumgebung mit voller Observability bauen, bevor Fachverfahren angebunden werden. Das spart später Nacharbeit.
- Failures früh in Test-Cases überführen. Produktive Agenten erodieren leise, wenn aus Fehlern keine Regressionsabdeckung wird.
- Die fachliche Betriebsführung früh besetzen. Sie entscheidet später über Freigabefähigkeit und Skalierung.
Prompt Engineering hat die KI dahin gebracht, wo sie heute steht. Agent Engineering bringt sie in den produktiven Betrieb. Der Unterschied wird spätestens dort sichtbar, wo der Agent nicht in der Demo brilliert, sondern um drei Uhr morgens stabil läuft.
