Was ist Agentic RAG?

Grundlagen von Agentic RAG
Was ist Retrieval-Augmented Generation (RAG)?
Retrieval-Augmented Generation (RAG) ist eine Technik, mit der LLM-gestützte Anwendungen durch Einbindung externer Wissensquellen verbessert werden.
- Bei einer einfachen RAG-Pipeline wird zuerst eine Abfrage genutzt, um mithilfe eines Embedding-Modells und einer Vektordatenbank relevante Dokumente zu finden.
- Die gefundenen Informationen werden dann dem Sprachmodell als Kontext bereitgestellt, um Halluzinationen zu minimieren und fachlich korrekte Antworten zu generieren.

Typische Einschränkungen herkömmlicher RAG-Systeme sind:
- Begrenzung auf eine externe Wissensquelle: Manche Anwendungen – etwa im Immobilienbereich – benötigen Informationen aus mehreren Quellen, wie beispielsweise Immobilienportale, interne Datenbanken und sogar Web-Suchen.
- Einmaliger Abruf: Es findet keine iterative Überprüfung oder Validierung der abgerufenen Kontexte statt.
Was sind KI-Agenten?
Mit dem Aufkommen leistungsfähiger LLMs haben sich neue Paradigmen im Bereich der KI-Agenten etabliert. Ein KI-Agent ist ein LLM, das eine spezifische Rolle und Aufgabe übernimmt und zusätzlich über folgende Kernkomponenten verfügt:
- LLM als „Gehirn“: Es führt die wesentlichen Berechnungen und Entscheidungen aus.
- Speicher: Kurz- und langfristiger Speicher erlaubt es dem Agenten, den Kontext und vergangene Interaktionen zu berücksichtigen.
- Planung und Reflexion: Durch interne Mechanismen (wie z. B. ReAct) kann der Agent den nächsten Schritt planen, Aktionen evaluieren und gegebenenfalls wiederholen.
- Externe Werkzeuge: Der Agent kann über definierte Schnittstellen (APIs) beispielsweise Websuchen, Rechner oder spezialisierte Datenabrufe durchführen.

Was ist Agentic RAG?
Agentic RAG erweitert die klassische RAG-Pipeline, indem Agenten in den Abrufprozess integriert werden. Diese Agenten können beispielsweise:
- Entscheiden, ob überhaupt zusätzliche Informationen abgerufen werden müssen.
- Bestimmen, welcher Abrufmechanismus – etwa ein Vektorsuch-Engine, Websuche oder eine API – genutzt werden soll.
- Die eigentliche Abfrage formulieren und die Qualität des zurückgegebenen Kontexts evaluieren, um bei Bedarf einen erneuten Abruf zu initiieren.
Agentic RAG Architektur
Es gibt grundsätzlich zwei Architekturvarianten:
1. Single-Agent RAG (Router)
Hier fungiert ein einzelner Agent als Router, der zwischen mindestens zwei externen Wissensquellen wählt.
Beispiel Immobilien: Ein einzelner Agent könnte entscheiden, ob für die Beantwortung einer Immobilienanfrage Daten aus einem internen Portfolio oder von öffentlichen Immobilienportalen abgerufen werden.

2. Multi-Agent RAG Systeme
Hier wird ein Master-Agent eingesetzt, der mehrere spezialisierte Agenten koordiniert.
Beispiel Immobilien: Ein Master-Agent könnte verschiedene Agenten anweisen – einen, der sich auf kommerzielle Immobilien konzentriert, einen weiteren, der Wohnimmobilien analysiert, und einen zusätzlichen, der externe Marktdaten abruft – um eine umfassende, validierte Antwort zu liefern.

Darüber hinaus können Agenten in einer RAG-Pipeline auch für andere Aufgaben eingesetzt werden, wie etwa die Korrektur von Abfragen oder das Aggregieren von Informationen aus unterschiedlichen Quellen.
Agentic RAG vs. Klassisches (Vanilla) RAG
Obwohl beide Systeme dieselbe Grundidee verfolgen – eine Abfrage, einen Informationsabruf und die Generierung einer Antwort – hebt sich Agentic RAG durch zusätzliche Funktionen hervor:
- Externe Werkzeuge: Agentic RAG nutzt aktiv APIs, Websuchen und andere Tools.
- Vorverarbeitung der Abfrage: Die Agenten können die ursprüngliche Abfrage verbessern oder spezifizieren.
- Mehrstufiger Abruf: Es besteht die Möglichkeit, den Abrufprozess zu wiederholen oder anzupassen.
- Qualitätsvalidierung: Der Agent bewertet den abgerufenen Kontext, bevor er an das LLM weitergereicht wird.
Man kann sich das so vorstellen: Klassisches RAG entspricht einem Bibliotheksbesuch, bei dem man auf ein Buch angewiesen ist, während Agentic RAG wie das Arbeiten mit einem intelligenten Assistenten ist – vergleichbar mit einem Smartphone, das nicht nur nach Informationen sucht, sondern auch diverse Tools (wie Kalkulation, E-Mail oder sogar Immobilien-Suchfilter) integriert.
Implementierung von Agentic RAG
Um eine agentische RAG-Pipeline zu bauen, gibt es zwei primäre Ansätze:
1. Sprachmodelle mit Function Calling
Sprachmodelle wie GPT-4.5 können durch „Function Calling“ direkt mit externen Werkzeugen interagieren. Dabei wird dem Modell ein Toolschema übergeben, das es ihm ermöglicht, Funktionen (z. B. einen Datenbankabruf) aufzurufen. Dies ermöglicht:
- Direkte Anbindung an spezialisierte Systeme (z. B. Immobilienbewertungstools)
- Dynamische Anpassung der Abfrage, basierend auf den Ergebnissen des ersten Abrufs
Ein Beispiel in Python könnte so aussehen:
2. Agent Frameworks
Es gibt mehrere Frameworks, die speziell für den Aufbau agentischer Systeme entwickelt wurden. Links zu den Anbietern finden Sie am Ende dieses Artikels:
- Pydantic AI: Erlaubt das einfache programmieren von Agenten in Python
- DSPy: Unterstützt ReAct-Agenten und automatisierte Optimierung der Toolbeschreibungen.
- LangChain: Bietet umfangreiche Services für den Umgang mit Werkzeugen, einschließlich LCEL und LangGraph.
- LlamaIndex: Erweitert die Möglichkeiten mit QueryEngineTool-Vorlagen.
- N8N: Workflows und Agenten mit einer Vielzahl an Tools und Services kombinieren.
- CrewAI: Konzentriert sich auf Multi-Agent-Systeme, bei denen Agenten Werkzeuge teilen können.
- Swarm und Letta: Bieten weitere Ansätze zur Multi-Agent-Orchestrierung.
Diese Frameworks vereinfachen die Entwicklung, indem sie vorgefertigte Templates bereitstellen, die es erlauben, verschiedene Agenten einfach zu kombinieren und deren Zusammenarbeit zu koordinieren.
Warum setzen Unternehmen auf Agentic RAG?
Unternehmen wechseln zunehmend von klassischen RAG-Systemen zu agentischen RAG-Anwendungen, da diese:
- Genauere Ergebnisse liefern: Durch die Validierung und erneute Abfrage wird die Qualität der abgerufenen Informationen verbessert.
- Autonom Aufgaben erledigen: Agenten können selbstständig zusätzliche Schritte durchführen, um beispielsweise Marktanalysen im Immobiliensektor zu verfeinern.
- Effizienter skalieren: Mit einem Netzwerk spezialisierter Agenten können verschiedene Datenquellen gleichzeitig genutzt werden.
- Multimodale Daten verarbeiten: Neuere Modelle können neben Text auch Bilder und andere Datentypen integrieren – etwa bei der Bewertung von Immobilienfotos.
Beispiel Immobilien: Ein Maklerunternehmen könnte ein agentisches RAG-System einsetzen, um automatisch aktuelle Marktpreise, Immobilienbewertungen und vergleichbare Objekte aus verschiedenen Datenquellen zu aggregieren und dem Kunden eine fundierte Kauf- oder Mietempfehlung zu geben.
Vorteile und Grenzen von Agentic RAG
Vorteile
- Verbesserte Informationsqualität: Durch den Einsatz von Agenten, die den Kontext validieren, werden genauere und relevantere Antworten erzielt.
- Erweiterte Flexibilität: Mehrere externe Datenquellen und Werkzeuge können dynamisch einbezogen werden.
- Effizienzsteigerung: Komplexe Aufgaben, wie beispielsweise die Immobilienbewertung, können automatisiert und beschleunigt werden.
Grenzen
- Erhöhte Latenz: Da mehrere Agenten und Tools involviert sind, können zusätzliche Verzögerungen entstehen.
- Kostensteigerung: Mehrere Agenten und zusätzliche API-Aufrufe können zu höheren Betriebskosten führen.
- Unzuverlässigkeit einzelner Agenten: Je nach Komplexität können manche Agenten auch mal scheitern – hier sind robuste Fehlerbehandlungsmechanismen nötig.
Zusammenfassung
Weiterführende Links
- Quelle der Bilder und Grundlage für diesen Blog-Post: https://weaviate.io/blog/what-is-agentic-rag
- Pydantic AI – https://pydantic.ai
- DSPy – https://dspy-docs.vercel.app
- LangChain – https://www.langchain.com
- LlamaIndex – https://www.llamaindex.ai
- N8N - https://n8n.io/
- CrewAI – https://www.crewai.com
- Swarm – https://github.com/openai/swarm
- Letta – https://docs.letta.com