KI im Arbeitsalltag fühlt sich oft noch an wie besseres Googeln: Man stellt eine Frage, die KI antwortet. KI-Agenten gehen einen entscheidenden Schritt weiter. Sie antworten nicht nur, sie handeln. Sie bedienen Software, starten Workflows und erledigen konkrete Aufgaben.
In dieser Anleitung zeigen wir dir, wie du den Sprung vom reinen Chatbot zum handlungsfähigen Agenten machst, effiziente Workflows planst und notwendige Sicherheitsmechanismen einbaust.
Kurz erklärt: Chatbot vs. KI-Agent
Chatbots sind auf den Dialog optimiert. Sie reagieren auf Eingaben, liefern Texte oder fassen Dokumente zusammen. Dabei verlassen sie ihre Chat-Umgebung in der Regel nicht.
KI-Agenten sind auf Handlung optimiert. Sie nutzen externe Programme, führen definierte Schritte selbstständig aus und erstellen beispielsweise Tabellen, Support-Tickets oder Einträge in der Buchhaltung.
Kurz gesagt: Dem Chatbot sagst du, was du brauchst. Der KI-Agent erledigt es für dich – innerhalb klar definierter Grenzen. Damit das zuverlässig funktioniert, braucht jeder Agent einen präzisen Bauplan.
Der Bauplan: Workflows in 4 Schritte zerlegen
Bevor du einen Agenten konfigurierst, muss der Ablauf feststehen. Was soll er genau tun und in welcher Reihenfolge? Ein robuster Workflow besteht immer aus vier Elementen:
1. Auslöser (Trigger)
Was startet den Agenten? Das kann eine neue E-Mail im Postfach sein, ein Formulareintrag oder ein fester Zeitpunkt (z.B. täglich um 18 Uhr).
2. Eingabe (Input)
Welche Daten erhält der Agent für seine Arbeit? Dazu gehören Texte aus E-Mails, PDF-Rechnungen oder strukturierte Daten aus einem CRM-System.
3. Verarbeitung (Processing)
Was macht der Agent mit diesen Daten? Er extrahiert beispielsweise Rechnungsbeträge, klassifiziert Support-Anfragen nach Priorität und bereitet Entscheidungen vor. Hier greift die eigentliche KI-Logik: Das Sprachmodell interpretiert die Inhalte und entscheidet über das weitere Vorgehen.
4. Ergebnis (Output)
Wie sieht das Resultat aus und wo landet es? Das Ergebnis ist oft ein neuer Datenbankeintrag, eine vorbereitete Antwort-Mail, ein Ticket im Projektmanagement oder ein Freigabevorschlag für einen menschlichen Kollegen.
Wer diese vier Schritte klar benennen kann, hat den Kern seines KI-Agenten bereits entworfen. Die technische Umsetzung ist dann vor allem strukturiertes Handwerk.
Werkzeuge und Anweisungen: So wird die KI handlungsfähig
Der System-Prompt als Jobbeschreibung
Ein System-Prompt ist die grundlegende Arbeitsanweisung für deinen Agenten. Er unterscheidet sich von gewöhnlichen Chat-Prompts: Er stellt keine Frage, sondern gibt Rollen, Ziele und Leitplanken vor.
Ein professioneller System-Prompt enthält:
- Rolle und Ziel: „Du bist ein KI-Agent für das Rechnungsmanagement. Dein Ziel ist es, aus eingehenden Rechnungen strukturierte Daten für die Buchhaltung zu extrahieren.“
- Konkrete Aufgaben: Welche Felder sollen zwingend erfasst werden? Was passiert bei fehlenden Angaben?
- Vorgehensweise: Eine strikte, schrittweise Anleitung, wie die KI den Input verarbeiten soll.
- Fehlerkultur: „Wenn du ein Feld nicht sicher bestimmen kannst, markiere es als ‚unsicher‘. Erfinde niemals Daten.“
- Werkzeugnutzung: Klare Regeln, welche angebundenen Tools die KI für welche Aufgabe nutzen darf.
Mit diesem Prompt verschiebst du grundlegende Entscheidungen aus dem laufenden Betrieb in die Vorab-Planung. Der Agent agiert nicht frei, sondern in einem abgesteckten Rahmen.
Integrationsplattformen als Brücke
Sprachmodelle können dein E-Mail-Programm oder deine Buchhaltungssoftware nicht von sich aus bedienen. Sie benötigen Integrationsplattformen wie Make oder n8n. Diese Werkzeuge fungieren als Brücke zwischen der KI und deiner restlichen Software-Infrastruktur.
Ein typischer Ablauf auf einer solchen Plattform sieht so aus:
- Die Plattform erkennt eine neue Nachricht im Postfach.
- Sie übergibt den E-Mail-Text samt System-Prompt an das KI-Modell.
- Die KI analysiert den Text und liefert die geforderten Daten strukturiert zurück.
- Die Plattform nimmt diese Daten und schreibt sie automatisch in eine Tabelle oder ein Drittsystem.
Der KI-Agent ist also kein einzelnes magisches Programm, sondern das clevere Zusammenspiel aus Workflow-Logik, Sprachmodell und Integrationsplattform.
Sicherheitsnetz: „Human in the Loop“
Sobald eine KI eigenständig handeln darf, wird Fehlertoleranz zum zentralen Thema. Ein falsch konfigurierter Agent schreibt fehlerhafte Beträge in die Buchhaltung, legt Hunderte Tickets an oder verschickt unkontrolliert E-Mails. Sicherheitsmechanismen sind daher kein Bonus, sondern das Fundament jedes Workflows.
Die wichtigsten Prinzipien für sichere Agenten:
- Menschliche Freigabe (Human-in-the-Loop): Aktionen, die Geld bewegen, Daten löschen oder nach außen kommunizieren, erfordern immer eine Freigabe (z.B.: per Klick oder Bestätigungs-Mail).
- Harte Limits: Begrenze die maximale Anzahl von Aktionen pro Durchlauf, setze Summenlimits und definiere feste Empfängerkreise.
- Transparenz: Der Agent muss in einem Logbuch oder einer Tabelle nachvollziehbar dokumentieren, was er wann und warum getan hat.
- Testphase mit Leserechten: Lass den Agenten anfangs nur Vorschläge generieren. Erst wenn er fehlerfrei arbeitet, darf er schreibend oder buchend eingreifen.
Der Mensch bleibt immer die letzte Instanz. Der Agent bereitet vor und unterstützt, aber er übernimmt nicht die Verantwortung.
Umsetzung: So baut man einen Agenten
Wir bauen einen Agenten, der eingehende Rechnungen vorsortiert.
Schritt 1: Workflow definieren
Das Ziel ist es, eingehende Rechnungen aus einem Postfach automatisch in eine Tabelle zu übertragen, damit die Buchhaltung sie prüfen kann.
- Auslöser: Neue E-Mail im Postfach „rechnungen@…”
- Eingabe: E-Mail-Text und PDF-Anhang
- Verarbeitung: Prüfen, ob es eine Rechnung ist, Daten extrahieren und Plausibilität checken
- Ergebnis: Neue Zeile in einer Tabelle, inklusive Hinweis bei Unklarheiten
Schritt 2: Workflow in Make oder n8n anlegen
Auf der Integrationsplattform baust du die nötige Kette auf:
- E-Mail-Modul überwacht das Postfach.
- Anhang-Modul sichert das PDF.
- KI-Modul analysiert E-Mail und Dokument.
- Tabellen-Modul schreibt die extrahierten Daten in die Übersicht.
- Benachrichtigungs-Modul informiert die Buchhaltung.
Die technische Plattform steuert den Ablauf, die KI übernimmt ausschließlich die inhaltliche Auswertung.
Schritt 3: System-Prompt formulieren
Der Kern der KI-Arbeit ist der System-Prompt. Eine funktionale Vorlage sieht beispielsweise so aus:
Du bist ein KI-Agent für das Rechnungsmanagement.
AUFGABE
- Du erhältst E-Mails mit optionalen PDF-Anhängen.
- Prüfe, ob es sich um eine echte Rechnung handelt.
- Wenn ja, extrahiere folgende Felder:
- rechnungstyp (Rechnung, Gutschrift, keine_rechnung)
- lieferant_name
- rechnungsnummer
- rechnungsdatum
- faelligkeitsdatum
- gesamtbetrag
- waehrung
- kostenstelle (falls vorhanden)
- bemerkung (für Unklarheiten)
VORGEHEN
1. Lies zuerst die E-Mail, dann ggf. das PDF.
2. Entscheide, ob es sich um eine Rechnung handelt.
3. Extrahiere die Felder präzise.
4. Prüfe auf Plausibilität (z. B. Datum, Betrag).
5. Erfinde keine Daten. Wenn ein Feld unklar ist, lasse es leer und erkläre den Grund unter "bemerkung".
AUSGABEFORMAT
- Gib die Ergebnisse als klar strukturierte Felder zurück, damit sie automatisiert weiterverarbeitet werden können.
FEHLERUMGANG
- Wenn du unsicher bist, dokumentiere dies unter "bemerkung".
- Wenn es keine Rechnung ist, setze den rechnungstyp auf "keine_rechnung" und lasse die restlichen Felder leer.Schritt 4: Sicherheitsmechanismen einbauen
Die Tabelle fungiert in diesem Setup als reine Vorschlagsliste. Die Buchhaltung prüft die Einträge manuell und gibt sie frei, bevor das System echte Buchungen auslöst. Zusätzlich lässt sich eine Regel einrichten: Beträge über 1.000 Euro erhalten automatisch eine rote Markierung für eine zwingende Zweitprüfung.
Schritt 5: Testen und skalieren
Bevor der Agent den Live-Betrieb übernimmt, wird er mit historischen Rechnungen getestet. Zeigen sich wiederkehrende Probleme bei Fremdwährungen oder Gutschriften, wird der System-Prompt gezielt nachgeschärft. Läuft der Workflow stabil, lässt sich das exakt selbe Prinzip auf Angebote, Verträge oder Support-Mails übertragen.
Fazit
Der Weg vom Chatbot zum KI-Agenten ist keine Magie, sondern das Resultat klarer Strukturen. Wer Auslöser, Werkzeuge, Prompts und Freigaben sauber definiert, macht aus einem reinen Textgenerator einen spezialisierten Assistenten. Dieser formuliert nicht mehr nur Antworten, sondern nimmt verlässlich echte Arbeit ab: sicher, strukturiert und immer unter menschlicher Kontrolle.







