In 5 Schritten zum ersten KI-Agenten

Der Aufbau eines KI-Agenten erfordert einen klaren Bauplan statt bloßem „Prompting“. Wir zeigen dir in 5 Schritten, wie du die KI-Logik strukturierst, Werkzeuge anbindest und einen verlässlichen Assistenten erschaffst, der nahtlos in deinen Arbeitsalltag greift.

Beiträge von Roman Gaisböck
4. Juni 2026
In 5 Schritten zum ersten KI-Agenten

KI im Arbeitsalltag fühlt sich oft noch an wie besseres Googeln: Man stellt eine Frage, die KI antwortet. KI-Agenten gehen einen entscheidenden Schritt weiter. Sie antworten nicht nur, sie handeln. Sie bedienen Software, starten Workflows und erledigen konkrete Aufgaben.

In dieser Anleitung zeigen wir dir, wie du den Sprung vom reinen Chatbot zum handlungsfähigen Agenten machst, effiziente Workflows planst und notwendige Sicherheitsmechanismen einbaust.

Kurz erklärt: Chatbot vs. KI-Agent

Chatbots sind auf den Dialog optimiert. Sie reagieren auf Eingaben, liefern Texte oder fassen Dokumente zusammen. Dabei verlassen sie ihre Chat-Umgebung in der Regel nicht.

KI-Agenten sind auf Handlung optimiert. Sie nutzen externe Programme, führen definierte Schritte selbstständig aus und erstellen beispielsweise Tabellen, Support-Tickets oder Einträge in der Buchhaltung.

Kurz gesagt: Dem Chatbot sagst du, was du brauchst. Der KI-Agent erledigt es für dich – innerhalb klar definierter Grenzen. Damit das zuverlässig funktioniert, braucht jeder Agent einen präzisen Bauplan.

Der Bauplan: Workflows in 4 Schritte zerlegen

Bevor du einen Agenten konfigurierst, muss der Ablauf feststehen. Was soll er genau tun und in welcher Reihenfolge? Ein robuster Workflow besteht immer aus vier Elementen:

1. Auslöser (Trigger)
Was startet den Agenten? Das kann eine neue E-Mail im Postfach sein, ein Formulareintrag oder ein fester Zeitpunkt (z.B. täglich um 18 Uhr).

2. Eingabe (Input)
Welche Daten erhält der Agent für seine Arbeit? Dazu gehören Texte aus E-Mails, PDF-Rechnungen oder strukturierte Daten aus einem CRM-System.

3. Verarbeitung (Processing)
Was macht der Agent mit diesen Daten? Er extrahiert beispielsweise Rechnungsbeträge, klassifiziert Support-Anfragen nach Priorität und bereitet Entscheidungen vor. Hier greift die eigentliche KI-Logik: Das Sprachmodell interpretiert die Inhalte und entscheidet über das weitere Vorgehen.

4. Ergebnis (Output)
Wie sieht das Resultat aus und wo landet es? Das Ergebnis ist oft ein neuer Datenbankeintrag, eine vorbereitete Antwort-Mail, ein Ticket im Projektmanagement oder ein Freigabevorschlag für einen menschlichen Kollegen.

Wer diese vier Schritte klar benennen kann, hat den Kern seines KI-Agenten bereits entworfen. Die technische Umsetzung ist dann vor allem strukturiertes Handwerk.

Werkzeuge und Anweisungen: So wird die KI handlungsfähig

Der System-Prompt als Jobbeschreibung

Ein System-Prompt ist die grundlegende Arbeitsanweisung für deinen Agenten. Er unterscheidet sich von gewöhnlichen Chat-Prompts: Er stellt keine Frage, sondern gibt Rollen, Ziele und Leitplanken vor.

Ein professioneller System-Prompt enthält:

  • Rolle und Ziel: „Du bist ein KI-Agent für das Rechnungsmanagement. Dein Ziel ist es, aus eingehenden Rechnungen strukturierte Daten für die Buchhaltung zu extrahieren.“
  • Konkrete Aufgaben: Welche Felder sollen zwingend erfasst werden? Was passiert bei fehlenden Angaben?
  • Vorgehensweise: Eine strikte, schrittweise Anleitung, wie die KI den Input verarbeiten soll.
  • Fehlerkultur: „Wenn du ein Feld nicht sicher bestimmen kannst, markiere es als ‚unsicher‘. Erfinde niemals Daten.“
  • Werkzeugnutzung: Klare Regeln, welche angebundenen Tools die KI für welche Aufgabe nutzen darf.

Mit diesem Prompt verschiebst du grundlegende Entscheidungen aus dem laufenden Betrieb in die Vorab-Planung. Der Agent agiert nicht frei, sondern in einem abgesteckten Rahmen.

Integrationsplattformen als Brücke

Sprachmodelle können dein E-Mail-Programm oder deine Buchhaltungssoftware nicht von sich aus bedienen. Sie benötigen Integrationsplattformen wie Make oder n8n. Diese Werkzeuge fungieren als Brücke zwischen der KI und deiner restlichen Software-Infrastruktur.

Ein typischer Ablauf auf einer solchen Plattform sieht so aus:

  1. Die Plattform erkennt eine neue Nachricht im Postfach.
  2. Sie übergibt den E-Mail-Text samt System-Prompt an das KI-Modell.
  3. Die KI analysiert den Text und liefert die geforderten Daten strukturiert zurück.
  4. Die Plattform nimmt diese Daten und schreibt sie automatisch in eine Tabelle oder ein Drittsystem.

Der KI-Agent ist also kein einzelnes magisches Programm, sondern das clevere Zusammenspiel aus Workflow-Logik, Sprachmodell und Integrationsplattform.

Sicherheitsnetz: „Human in the Loop“

Sobald eine KI eigenständig handeln darf, wird Fehlertoleranz zum zentralen Thema. Ein falsch konfigurierter Agent schreibt fehlerhafte Beträge in die Buchhaltung, legt Hunderte Tickets an oder verschickt unkontrolliert E-Mails. Sicherheitsmechanismen sind daher kein Bonus, sondern das Fundament jedes Workflows.

Die wichtigsten Prinzipien für sichere Agenten:

  • Menschliche Freigabe (Human-in-the-Loop): Aktionen, die Geld bewegen, Daten löschen oder nach außen kommunizieren, erfordern immer eine Freigabe (z.B.: per Klick oder Bestätigungs-Mail).
  • Harte Limits: Begrenze die maximale Anzahl von Aktionen pro Durchlauf, setze Summenlimits und definiere feste Empfängerkreise.
  • Transparenz: Der Agent muss in einem Logbuch oder einer Tabelle nachvollziehbar dokumentieren, was er wann und warum getan hat.
  • Testphase mit Leserechten: Lass den Agenten anfangs nur Vorschläge generieren. Erst wenn er fehlerfrei arbeitet, darf er schreibend oder buchend eingreifen.

Der Mensch bleibt immer die letzte Instanz. Der Agent bereitet vor und unterstützt, aber er übernimmt nicht die Verantwortung.

Umsetzung: So baut man einen Agenten

Wir bauen einen Agenten, der eingehende Rechnungen vorsortiert.

Schritt 1: Workflow definieren

Das Ziel ist es, eingehende Rechnungen aus einem Postfach automatisch in eine Tabelle zu übertragen, damit die Buchhaltung sie prüfen kann.

  • Auslöser: Neue E-Mail im Postfach „rechnungen@…”
  • Eingabe: E-Mail-Text und PDF-Anhang
  • Verarbeitung: Prüfen, ob es eine Rechnung ist, Daten extrahieren und Plausibilität checken
  • Ergebnis: Neue Zeile in einer Tabelle, inklusive Hinweis bei Unklarheiten

Schritt 2: Workflow in Make oder n8n anlegen

Auf der Integrationsplattform baust du die nötige Kette auf:

  1. E-Mail-Modul überwacht das Postfach.
  2. Anhang-Modul sichert das PDF.
  3. KI-Modul analysiert E-Mail und Dokument.
  4. Tabellen-Modul schreibt die extrahierten Daten in die Übersicht.
  5. Benachrichtigungs-Modul informiert die Buchhaltung.

Die technische Plattform steuert den Ablauf, die KI übernimmt ausschließlich die inhaltliche Auswertung.

Schritt 3: System-Prompt formulieren

Der Kern der KI-Arbeit ist der System-Prompt. Eine funktionale Vorlage sieht beispielsweise so aus:

Du bist ein KI-Agent für das Rechnungsmanagement.

AUFGABE
- Du erhältst E-Mails mit optionalen PDF-Anhängen.
- Prüfe, ob es sich um eine echte Rechnung handelt.
- Wenn ja, extrahiere folgende Felder:
  - rechnungstyp (Rechnung, Gutschrift, keine_rechnung)
  - lieferant_name
  - rechnungsnummer
  - rechnungsdatum
  - faelligkeitsdatum
  - gesamtbetrag
  - waehrung
  - kostenstelle (falls vorhanden)
  - bemerkung (für Unklarheiten)

VORGEHEN
1. Lies zuerst die E-Mail, dann ggf. das PDF.
2. Entscheide, ob es sich um eine Rechnung handelt.
3. Extrahiere die Felder präzise.
4. Prüfe auf Plausibilität (z. B. Datum, Betrag).
5. Erfinde keine Daten. Wenn ein Feld unklar ist, lasse es leer und erkläre den Grund unter "bemerkung".

AUSGABEFORMAT
- Gib die Ergebnisse als klar strukturierte Felder zurück, damit sie automatisiert weiterverarbeitet werden können.

FEHLERUMGANG
- Wenn du unsicher bist, dokumentiere dies unter "bemerkung".
- Wenn es keine Rechnung ist, setze den rechnungstyp auf "keine_rechnung" und lasse die restlichen Felder leer.

Schritt 4: Sicherheitsmechanismen einbauen

Die Tabelle fungiert in diesem Setup als reine Vorschlagsliste. Die Buchhaltung prüft die Einträge manuell und gibt sie frei, bevor das System echte Buchungen auslöst. Zusätzlich lässt sich eine Regel einrichten: Beträge über 1.000 Euro erhalten automatisch eine rote Markierung für eine zwingende Zweitprüfung.

Schritt 5: Testen und skalieren

Bevor der Agent den Live-Betrieb übernimmt, wird er mit historischen Rechnungen getestet. Zeigen sich wiederkehrende Probleme bei Fremdwährungen oder Gutschriften, wird der System-Prompt gezielt nachgeschärft. Läuft der Workflow stabil, lässt sich das exakt selbe Prinzip auf Angebote, Verträge oder Support-Mails übertragen.

Fazit

Der Weg vom Chatbot zum KI-Agenten ist keine Magie, sondern das Resultat klarer Strukturen. Wer Auslöser, Werkzeuge, Prompts und Freigaben sauber definiert, macht aus einem reinen Textgenerator einen spezialisierten Assistenten. Dieser formuliert nicht mehr nur Antworten, sondern nimmt verlässlich echte Arbeit ab: sicher, strukturiert und immer unter menschlicher Kontrolle.

Über den Autor

Beitrag von Roman Gaisböck

Roman Gaisböck

Roman Gaisböck arbeitet seit über 20 Jahren an der Schnittstelle von Digitalisierung, Medien und Unternehmenspraxis. Als Chefredakteur des KI Kompass übersetzt er Entwicklungen rund um Künstliche Intelligenz in verständliche, praxisnahe Entscheidungsgrundlagen für Unternehmen. Sein Fokus liegt auf Künstlicher Intelligenz, Automatisierung und digitalen Geschäftsmodellen.