Agentische Systeme

Tool-nutzende KI-Agenten, die mehrstufige Workflows mit Guardrails, Evaluation und Observability im Produktivbetrieb ausführen.

Agentisches Workflow-Design: Dekomposition, Planung und Übergaben

Ein effektiver Agent ist nicht nur ein einzelner Prompt mit angehängten Tools. Er ist ein System, das komplexe Aufgaben in Schritte zerlegt, die Ausführungsreihenfolge plant, Fehler robust behandelt und weiß, wann an einen anderen Agenten oder an einen Menschen übergeben werden muss. Wir entwerfen Agent-Workflows mit expliziter Aufgabenzerlegung, Retry-Logik und Übergabeprotokollen, die eine zuverlässige und beobachtbare Ausführung über mehrere Schritte hinweg ermöglichen.

Jeder Workflow wird als gerichteter Graph mit definierten Einstiegspunkten, Entscheidungsknoten und Austrittsbedingungen modelliert. Diese Struktur macht das Verhalten des Agenten vorhersehbar, testbar und für Stakeholder nachvollziehbar, die verstehen müssen, was das System tut, bevor sie es für den Produktivbetrieb freigeben.

Fry Express entwickelt Workflows inkrementell. Wir beginnen mit einer engen, klar definierten Aufgabe, validieren sie Ende-zu-Ende und erweitern den Umfang erst, wenn das Fundament nachweislich trägt.

Tool-Integration über APIs, Datenbanken und interne Systeme hinweg

Agenten ziehen ihren Wert aus den Tools, die sie nutzen können. Wir integrieren Agenten mit APIs, Ticketing-Systemen, Dokumentenspeichern, Datenbanken, CI/CD-Pipelines und internen Plattformen, damit sie echte Arbeit ausführen, statt nur Text zu generieren.

Jede Tool-Integration umfasst Eingabevalidierung, Fehlerbehandlung und Ausgabe-Normalisierung. Der Agent erhält strukturierte, vorhersehbare Antworten – unabhängig von den Eigenheiten des zugrunde liegenden Systems. Diese Isolationsschicht bedeutet, dass ein Wechsel eines Backend-Systems nicht erfordert, die Logik des Agenten neu zu schreiben.

Der Tool-Zugriff wird durch dasselbe Berechtigungsmodell geregelt, das auch für menschliche Benutzer gilt. Ein Agent kann keine Datenbank abfragen oder ein Deployment auslösen, sofern ihm diese Fähigkeit nicht ausdrücklich gewährt wurde.

Human-in-the-Loop-Checkpoints für risikoreiche Aktionen

Nicht jede Aktion sollte ohne Aufsicht automatisiert werden. Wir bauen Human-in-the-Loop-Checkpoints an definierten Punkten im Workflow ein, an denen die Kosten eines Fehlers hoch sind: Finanztransaktionen, Datenänderungen, externe Kommunikation oder Infrastrukturänderungen, die den Produktivbetrieb betreffen.

Checkpoints zeigen die vorgeschlagene Aktion des Agenten, die Begründung dafür und das erwartete Ergebnis. Der menschliche Approver kann die Aktion akzeptieren, ablehnen oder anpassen, bevor die Ausführung fortgesetzt wird. Abgelehnte Aktionen werden zusammen mit dem Grund protokolliert – ein Feedback-Signal, das das zukünftige Verhalten des Agenten verbessert.

Der Checkpoint-Mechanismus ist bewusst leichtgewichtig gestaltet. Freigaben erfolgen in den Tools, die Ihr Team ohnehin nutzt – ob Slack, Teams oder eine dedizierte Review-Oberfläche. Ziel ist informierte Aufsicht, nicht bürokratische Reibung.

Security, Audit-Controls und Governance für Datenzugriff

Ein Agent, der Tools aufrufen und auf Daten zugreifen kann, muss mit derselben Stringenz gesteuert werden wie jedes privilegierte Service-Konto. Wir implementieren Berechtigungsgrenzen, die exakt definieren, auf welche Tools, Datenquellen und Aktionen jeder Agent zugreifen darf. Jede Aktion wird mit vollständigem Kontext protokolliert: was angefordert wurde, was ausgeführt wurde und welche Daten gelesen oder geschrieben wurden.

Data-Access-Governance stellt sicher, dass Agenten in Umgebungen mit sensiblen Informationen Klassifizierungsregeln, Zugriffskontrollen und Aufbewahrungsrichtlinien einhalten. Ein Agent, der Kundendaten in einer Produktionsumgebung verarbeitet, unterliegt anderen Einschränkungen als ein Agent, der in einer Entwicklungs-Sandbox läuft.

Fry Express behandelt Agenten-Sicherheit als First-Class-Concern, nicht als Schicht, die nach dem Bau des Workflows hinzugefügt wird. Berechtigungen werden während des Designs definiert und zur Laufzeit durchgesetzt.

Kosten-Telemetrie pro Workflow mit Budget-Caps und sauberer Degradierung

Agent-Workflows können erhebliche Ressourcen verbrauchen, insbesondere wenn sie mehrere LLM-Aufrufe, Tool-Invocations und Retry-Loops beinhalten. Wir instrumentieren Kosten-Telemetrie pro Workflow, die Token-Verbrauch, Kosten für Tool-Aufrufe und Rechenzeit für jede Ausführung erfasst.

Budget-Caps verhindern, dass ausufernde Workflows definierte Ausgabenlimits überschreiten. Wenn ein Limit näher rückt, kann der Agent auf günstigere Modelle wechseln, die Anzahl der Reasoning-Schritte reduzieren oder sauber mit einem Teilergebnis und einer klaren Erklärung terminieren, warum er gestoppt hat.

Damit werden Kosten zu einer Designvorgabe – nicht zu einem Befund im Nachgang. Teams können Budgets pro Workflow-Typ festlegen und diese anpassen, sobald sie lernen, wie angemessene Ausführungskosten typischerweise aussehen.

Reliability Engineering mit Evaluation sowie Regressionstests

Agenten, die in Produktion laufen, müssen denselben Zuverlässigkeitsstandards genügen wie jeder andere Service. Wir setzen Idempotenz-Garantien, Fallback-Strategien und Rate Limiting ein, damit Retries keine doppelten Side Effects verursachen, Provider-Ausfälle Workflows nicht stoppen und Lastspitzen nachgelagerte Systeme nicht überfordern.

Jeder Agent-Workflow wird durch Evaluations- und Regressionstests abgedeckt, die das Verhalten gegen erwartete Ergebnisse validieren. Wenn sich eine Tool-Integration ändert, ein Modell aktualisiert wird oder ein Workflow modifiziert wird, erkennt die Test-Suite Regressionen, bevor sie in Produktion gelangen.

Fry Express baut Zuverlässigkeit von Anfang an in den Agenten ein. Das Ergebnis ist ein System, das Betriebsteams mit Vertrauen betreiben können – nicht ein Prototyp, der in Demos funktioniert, aber unter realen Bedingungen scheitert.

Diese Deliverables liefern Agentensysteme, die von Haus aus produktionsreif sind: gesteuert, beobachtbar, kostenkontrolliert und getestet. Die Agenten erledigen echte Arbeit innerhalb klar definierter Grenzen, und die verantwortlichen Teams verfügen über die Werkzeuge und die Sicherheit, sie im großen Maßstab zu betreiben.

Termin vereinbaren