Ein KI-Agent ist ein auf künstlicher Intelligenz basierendes Computerprogramm, das im Auftrag menschlicher Nutzender autonom komplexe Aufgaben ausführen kann.
Nach Lektüre dieses Artikels können Sie Folgendes:
Link zum Artikel kopieren
Ein KI-Agent ist ein auf künstlicher Intelligenz (KI) basierendes Computerprogramm, das autonom Aufgaben ausführen kann, um menschlichen Nutzenden auch ohne konkrete Anweisungen zu helfen. Im Gegensatz zu anderer KI-gestützter Software, wie z. B. Chatbots, können KI-Agenten auch außerhalb eines bestimmten, auf Prompts basierenden Kontexts arbeiten. Sie können ihre Trainingsdaten verlassen und sich sozusagen in der Welt umsehen, um Informationen zu finden. Dann können sie auf der Grundlage dieser Informationen selbstständig Maßnahmen ergreifen, um ein übergeordnetes Ziel zu verfolgen.
KI-Agenten können Entscheidungen treffen, aus früheren Erfahrungen lernen und ihre Handlungen entsprechend anpassen. Sie können sogar mit anderen KI-Agenten Rücksprache halten, um relevante Informationen zu erhalten. Menschen geben den KI-Agenten Ziele vor, aber es liegt an den Agenten, herauszufinden, wie sie diese Ziele erreichen können. Sie können unabhängig oder mit sehr wenig menschlichem Zutun arbeiten.
KI-Agenten können entweder Hardware steuern (wie in der Robotik) oder ausschließlich softwarebasiert agieren.
KI-Agenten sind die oben beschriebenen Softwareprogramme: Sie treffen selbstständig Entscheidungen und erledigen Aufgaben. Agentic AI (agentenbasierte KI) ist der Bereich der KI-Entwicklung, der die Konstruktion von KI-Agenten ermöglicht. (Denken Sie an den Unterschied zwischen generativer KI und einzelnen Large Language Models wie Microsoft Copilot oder an den Unterschied zwischen dem „Kochen“ und einem bestimmten Gericht.)
Generative KI (GenAI) bezieht sich auf eine Art von Deep-Learning-Modell, das als Reaktion auf Prompts Inhalt generieren kann. In diesem Bereich handelt es sich um die Kategorie der KI, zu der LLMs wie ChatGPT gehören. Agentenbasierte KI (Agentic AI) baut auf GenAI auf. Doch während ein LLM nur auf Prompts über eine bestimmte Benutzeroberfläche oder API reagieren kann, kann ein KI-Agent einen definierten Kontext verlassen und auch ohne Prompts Aktionen ausführen.
Eine Vertriebsleiterin in einem großen Unternehmen könnte ein LLM mit folgendem Prompt beauftragen: „Schreibe eine E-Mail, die ich an 10 unserer wichtigsten Kunden senden kann, um sie zu einem Abendessen einzuladen.“ Aber mit agentenbasierter KI könnte die Vertriebsleiterin stattdessen einem KI-Agenten den Auftrag geben: „Lade 10 unserer wichtigsten Kunden zum Abendessen ein.“ Mit anderen Worten: Das LLM kann den Text erstellen, aber der KI-Agent sollte sowohl den E-Mail-Text generieren als auch die 10 größten Kunden im CRM finden und personalisierte Einladungen versenden (sofern die erforderlichen Berechtigungen vorliegen).
KI-Agenten basieren auf LLMs. Ein LLM ist ein KI-Modelltyp, der auf großen Mengen von Beispieldaten trainiert wurde und dadurch in der Lage ist, von Menschen erstellte Inhalte zu verstehen und selbst Inhalte zu generieren. LLMs verstehen selbst ungenaue menschliche Prompts und Anfragen.
Da sie auf LLMs basieren, können KI-Agenten eine breite Palette von Daten und Inhalten verarbeiten und interpretieren, von Dialoganfragen von Nutzenden bis hin zu im Web gehosteten Videoinhalten. KI-Agenten können Inhalte aus verschiedenen Arten von Medien interpretieren: Code, Text, Audio, Video und so weiter. Sie können die Erkenntnisse aus diesen Inhalten dann nutzen, um ihre Aktionen zu verfeinern.
Darüber hinaus haben KI-Agenten Möglichkeiten, mit der Welt zu interagieren. In der Robotik können dazu physische Sensoren und Kameras gehören. Bei reinen Software-Agenten kann dies verschiedene Formen annehmen:
Diese Arten der Interaktion mit der Welt außerhalb des Kontexts der Umgebung des KI-Agenten ermöglichen es dem KI-Agenten, Maßnahmen zu ergreifen. Organisationen können Schutzmechanismen für KI-Agenten einrichten, um sicherzustellen, dass deren Handlungen korrekt sind – ähnlich wie menschliche Nutzende innerhalb einer IT-Umgebung nur eingeschränkte Berechtigungen haben. Zusätzlich zum Programmieren von Richtlinien in die KI-Agenten können Unternehmen auch einen „Human-in-the-Loop“-Ansatz verfolgen, bei dem Menschen die Richtigkeit der Antworten der KI-Agenten überprüfen oder deren Aktionen genehmigen.
Auch KI-Agenten können lernen, indem sie die Ergebnisse vergangener Aktionen und den Input von menschlichen Nutzenden verwenden, um ihre Aktionen in der Zukunft zu verfeinern. Sie haben „Gedächtnis“ – nicht nur im Sinne von RAM, sondern im Sinne einer Erinnerung an vergangene Interaktionen und Ergebnisse. Dieses Lernen erfolgt durch eine Feedbackschleife, die als Datenschwungrad („Data Flywheel“) bezeichnet wird: Aufzeichnungen der Interaktionen eines Agenten werden vom zugrunde liegenden Modell zur Verbesserung der zukünftigen Performance verwendet.
Es gibt zwei Haupttypen von KI-Agenten:
Es gibt auch Single-Agent- und Multi-Agent-Systeme. KI-Systeme mit einem einzelnen Agenten basieren auf nur einem Modell. Multi-Agenten-KI-Systeme kombinieren die Fähigkeiten mehrerer Agenten, die sich zur Lösung von Problemen gegenseitig absprechen.
Agentenbasierte KI-Chatbots sind wie herkömmliche Chatbots in der Lage, im Gespräch mit Menschen zu interagieren. Agentenbasierte KI-Chatbots können jedoch ihren Chatbot-Kontext verlassen – den Chat verlassen – um im Namen der Person, mit der sie interagieren, zu handeln. Ein herkömmlicher Chatbot kann Ihnen Anweisungen zum Einreichen eines Support-Tickets geben. Ein agentenbasierter KI-Chatbot wäre in der Lage, das Ticket selbst einzureichen.
Nicht-agentenbasierte KI-Chatbots sind reaktiv und reagieren auf Prompts von Nutzenden in Übereinstimmung mit ihren Trainingsdaten. Sie können zwar immer noch von einem LLM unterstützt werden, sind aber besser darin, den Nutzenden hilfreiche Inhalte oder Anweisungen zu liefern, als Aktionen im Namen der Nutzenden auszuführen. Agentenbasierte KI-Chatbots sind in der Lage, außerhalb des Kontexts ihrer Interaktion mit einem Nutzenden zu handeln. Agentenbasierte KI-Chatbots können über ihre Trainingsdaten hinaus auch aus einer Reihe von Quellen lernen.
Die Cloudflare-Entwicklerplattform bietet alle Tools, die für die Erstellung und den Einsatz von KI-gestützten Agenten erforderlich sind. Diese können:
Darüber hinaus erlaubt das globale Netzwerk von Cloudflare Entwicklerinnen und Entwicklern die Erstellung von KI-Agenten mit Code, der überall auf der Welt ausgeführt werden kann – so nah wie möglich am Endnutzenden. Erfahren Sie, wie Sie mit der Erstellung von KI-Agenten auf Cloudflare beginnen können.