Mar 9 / Nicolas Fritsch

Was ist Agentic RAG?

Agentic RAG steht für „Agentic Retrieval-Augmented Generation“ und beschreibt eine Implementierung von RAG, bei der KI-Agenten in die Pipeline integriert werden. Während herkömmliche RAG-Methoden auf einem einfachen Abruf und der Generierung von Text basieren, erlaubt der Einsatz von Agenten, dass zusätzliche Aktionen durchgeführt werden – etwa das dynamische Abrufen von Informationen aus mehreren Quellen, das Vorverarbeiten von Abfragen oder das Validieren von Ergebnissen.

Mit dem Aufkommen leistungsfähiger LLMs haben sich neue Paradigmen im Bereich der KI-Agenten etabliert. Ein KI-Agent ist ein LLM, das eine spezifische Rolle und Aufgabe übernimmt und zusätzlich über folgende Kernkomponenten verfügt:

LLM als „Gehirn“: Es führt die wesentlichen Berechnungen und Entscheidungen aus.
Speicher: Kurz- und langfristiger Speicher erlaubt es dem Agenten, den Kontext und vergangene Interaktionen zu berücksichtigen.
Planung und Reflexion: Durch interne Mechanismen (wie z. B. ReAct) kann der Agent den nächsten Schritt planen, Aktionen evaluieren und gegebenenfalls wiederholen.
Externe Werkzeuge: Der Agent kann über definierte Schnittstellen (APIs) beispielsweise Websuchen, Rechner oder spezialisierte Datenabrufe durchführen.

Obwohl beide Systeme dieselbe Grundidee verfolgen – eine Abfrage, einen Informationsabruf und die Generierung einer Antwort – hebt sich Agentic RAG durch zusätzliche Funktionen hervor:

Externe Werkzeuge: Agentic RAG nutzt aktiv APIs, Websuchen und andere Tools.
Vorverarbeitung der Abfrage: Die Agenten können die ursprüngliche Abfrage verbessern oder spezifizieren.
Mehrstufiger Abruf: Es besteht die Möglichkeit, den Abrufprozess zu wiederholen oder anzupassen.
Qualitätsvalidierung: Der Agent bewertet den abgerufenen Kontext, bevor er an das LLM weitergereicht wird.

Man kann sich das so vorstellen: Klassisches RAG entspricht einem Bibliotheksbesuch, bei dem man auf ein Buch angewiesen ist, während Agentic RAG wie das Arbeiten mit einem intelligenten Assistenten ist – vergleichbar mit einem Smartphone, das nicht nur nach Informationen sucht, sondern auch diverse Tools (wie Kalkulation, E-Mail oder sogar Immobilien-Suchfilter) integriert.

Um eine agentische RAG-Pipeline zu bauen, gibt es zwei primäre Ansätze:

1. Sprachmodelle mit Function Calling

Sprachmodelle wie GPT-4.5 können durch „Function Calling“ direkt mit externen Werkzeugen interagieren. Dabei wird dem Modell ein Toolschema übergeben, das es ihm ermöglicht, Funktionen (z. B. einen Datenbankabruf) aufzurufen. Dies ermöglicht:

Direkte Anbindung an spezialisierte Systeme (z. B. Immobilienbewertungstools)
Dynamische Anpassung der Abfrage, basierend auf den Ergebnissen des ersten Abrufs

Ein Beispiel in Python könnte so aussehen:

Anschließend wird diese Funktion im Toolschema an das Sprachmodell übergeben, sodass das Modell bei Bedarf den Abruf durchführen kann.

2. Agent Frameworks

Es gibt mehrere Frameworks, die speziell für den Aufbau agentischer Systeme entwickelt wurden. Links zu den Anbietern finden Sie am Ende dieses Artikels:

Pydantic AI: Erlaubt das einfache programmieren von Agenten in Python
DSPy: Unterstützt ReAct-Agenten und automatisierte Optimierung der Toolbeschreibungen.
LangChain: Bietet umfangreiche Services für den Umgang mit Werkzeugen, einschließlich LCEL und LangGraph.
LlamaIndex: Erweitert die Möglichkeiten mit QueryEngineTool-Vorlagen.
N8N: Workflows und Agenten mit einer Vielzahl an Tools und Services kombinieren.
CrewAI: Konzentriert sich auf Multi-Agent-Systeme, bei denen Agenten Werkzeuge teilen können.
Swarm und Letta: Bieten weitere Ansätze zur Multi-Agent-Orchestrierung.

Diese Frameworks vereinfachen die Entwicklung, indem sie vorgefertigte Templates bereitstellen, die es erlauben, verschiedene Agenten einfach zu kombinieren und deren Zusammenarbeit zu koordinieren.

Unternehmen wechseln zunehmend von klassischen RAG-Systemen zu agentischen RAG-Anwendungen, da diese:

Genauere Ergebnisse liefern: Durch die Validierung und erneute Abfrage wird die Qualität der abgerufenen Informationen verbessert.
Autonom Aufgaben erledigen: Agenten können selbstständig zusätzliche Schritte durchführen, um beispielsweise Marktanalysen im Immobiliensektor zu verfeinern.
Effizienter skalieren: Mit einem Netzwerk spezialisierter Agenten können verschiedene Datenquellen gleichzeitig genutzt werden.
Multimodale Daten verarbeiten: Neuere Modelle können neben Text auch Bilder und andere Datentypen integrieren – etwa bei der Bewertung von Immobilienfotos.

Beispiel Immobilien: Ein Maklerunternehmen könnte ein agentisches RAG-System einsetzen, um automatisch aktuelle Marktpreise, Immobilienbewertungen und vergleichbare Objekte aus verschiedenen Datenquellen zu aggregieren und dem Kunden eine fundierte Kauf- oder Mietempfehlung zu geben.

Vorteile

Verbesserte Informationsqualität: Durch den Einsatz von Agenten, die den Kontext validieren, werden genauere und relevantere Antworten erzielt.
Erweiterte Flexibilität: Mehrere externe Datenquellen und Werkzeuge können dynamisch einbezogen werden.
Effizienzsteigerung: Komplexe Aufgaben, wie beispielsweise die Immobilienbewertung, können automatisiert und beschleunigt werden.

Grenzen

Erhöhte Latenz: Da mehrere Agenten und Tools involviert sind, können zusätzliche Verzögerungen entstehen.
Kostensteigerung: Mehrere Agenten und zusätzliche API-Aufrufe können zu höheren Betriebskosten führen.
Unzuverlässigkeit einzelner Agenten: Je nach Komplexität können manche Agenten auch mal scheitern – hier sind robuste Fehlerbehandlungsmechanismen nötig.

Agentic RAG erweitert das Konzept der Retrieval-Augmented Generation, indem es intelligente KI-Agenten in die Pipeline integriert. Diese Agenten übernehmen Aufgaben wie das Abrufen von Daten aus mehreren Quellen, das Vorverarbeiten und Validieren von Abfragen sowie die Nutzung externer Werkzeuge. Dadurch wird die klassische, einmalige Datenabfrage durch einen iterativen, adaptiven Prozess ersetzt – vergleichbar mit einem intelligenten Assistenten, der beispielsweise im Immobilienbereich vielfältige Datenquellen kombiniert, um präzise Marktanalysen zu liefern.

Was ist Agentic RAG?

Grundlagen von Agentic RAG

Was ist Retrieval-Augmented Generation (RAG)?

Was sind KI-Agenten?