Portal:Künstliche Intelligenz/RAG: Unterschied zwischen den Versionen

Wiki
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 12: Zeile 12:
'''Retrieval Augmented Generation''' (RAG) ist eine Technik zur Verarbeitung natürlicher Sprache, die die Stärken von abfragebasierten und generativen Modellen der künstlichen Intelligenz kombiniert. Mit einem RAG "befragen" Sie über einen Chat definierte Ordnerinhalte oder Datenbanken, die Sie selbst gefüllt haben. Stellen Sie sich einen geschützten Ordner vor, in dem alle Ihre Vorlesungsskripte, zusätzliche Materialien, eine Liste der Ansprechpartner und ein Timetable Ihrer Veranstaltungen abgelegt und indexiert sind. Ein Chat beantwortet dann Fragen zu Ihrer Veranstaltung und greift dabei '''auf die Inhalte Ihres Ordners''' zurück. In Verbindung mit einem passenden Systemprompt entsteht so ein '''Chatbot''' für Ihre Veranstaltung. Die Güte der Antworten hängt allerdings nicht allein vom Umfang Ihrer Dateien ab, sondern - und hier liegt eine Schwierigkeit - auch von der Güte der transformierten und vorbereiteten Daten für die KI.  
'''Retrieval Augmented Generation''' (RAG) ist eine Technik zur Verarbeitung natürlicher Sprache, die die Stärken von abfragebasierten und generativen Modellen der künstlichen Intelligenz kombiniert. Mit einem RAG "befragen" Sie über einen Chat definierte Ordnerinhalte oder Datenbanken, die Sie selbst gefüllt haben. Stellen Sie sich einen geschützten Ordner vor, in dem alle Ihre Vorlesungsskripte, zusätzliche Materialien, eine Liste der Ansprechpartner und ein Timetable Ihrer Veranstaltungen abgelegt und indexiert sind. Ein Chat beantwortet dann Fragen zu Ihrer Veranstaltung und greift dabei '''auf die Inhalte Ihres Ordners''' zurück. In Verbindung mit einem passenden Systemprompt entsteht so ein '''Chatbot''' für Ihre Veranstaltung. Die Güte der Antworten hängt allerdings nicht allein vom Umfang Ihrer Dateien ab, sondern - und hier liegt eine Schwierigkeit - auch von der Güte der transformierten und vorbereiteten Daten für die KI.  


[[Datei:RAG Übersicht.png|alternativtext=Prinzip eines RAG|links|mini|308x308px|Prinzip eine RAG]]Die MLU verfügt derzeit noch nicht über ein solches System. Der IT-Dienstleister GWDG für die Hochschulen in Niedersachsen, der auch '''CHAT-AI''' der Academic Cloud betreibt, bietet allerdings kostenfrei das Werkzeug '''Arcana''' an, mit deren Hilfe alle Lehrenden der MLU solche RAG-Modelle erstellen können. Für eine Umsetzung benötigen Sie einen Account für die Academic Cloud, der über Ihren Uni-Login realisiert wird.  
[[Datei:RAG Übersicht.png|alternativtext=Prinzip eines RAG|mini|628x628px|Prinzip eine RAG|zentriert]]Die MLU verfügt derzeit noch nicht über ein solches System. Der IT-Dienstleister GWDG für die Hochschulen in Niedersachsen, der auch '''CHAT-AI''' der Academic Cloud betreibt, bietet allerdings kostenfrei das Werkzeug '''Arcana''' an, mit deren Hilfe alle Lehrenden der MLU solche RAG-Modelle erstellen können. Für eine Umsetzung benötigen Sie einen Account für die Academic Cloud, der über Ihren Uni-Login realisiert wird.  


</div>
</div>

Version vom 9. Juli 2025, 12:02 Uhr

RAG-Modelle selbst erstellen und nutzen

Retrieval Augmented Generation (RAG) ist eine Technik zur Verarbeitung natürlicher Sprache, die die Stärken von abfragebasierten und generativen Modellen der künstlichen Intelligenz kombiniert. Mit einem RAG "befragen" Sie über einen Chat definierte Ordnerinhalte oder Datenbanken, die Sie selbst gefüllt haben. Stellen Sie sich einen geschützten Ordner vor, in dem alle Ihre Vorlesungsskripte, zusätzliche Materialien, eine Liste der Ansprechpartner und ein Timetable Ihrer Veranstaltungen abgelegt und indexiert sind. Ein Chat beantwortet dann Fragen zu Ihrer Veranstaltung und greift dabei auf die Inhalte Ihres Ordners zurück. In Verbindung mit einem passenden Systemprompt entsteht so ein Chatbot für Ihre Veranstaltung. Die Güte der Antworten hängt allerdings nicht allein vom Umfang Ihrer Dateien ab, sondern - und hier liegt eine Schwierigkeit - auch von der Güte der transformierten und vorbereiteten Daten für die KI.

Prinzip eines RAG
Prinzip eine RAG
Die MLU verfügt derzeit noch nicht über ein solches System. Der IT-Dienstleister GWDG für die Hochschulen in Niedersachsen, der auch CHAT-AI der Academic Cloud betreibt, bietet allerdings kostenfrei das Werkzeug Arcana an, mit deren Hilfe alle Lehrenden der MLU solche RAG-Modelle erstellen können. Für eine Umsetzung benötigen Sie einen Account für die Academic Cloud, der über Ihren Uni-Login realisiert wird.

Anleitung RAG-Modell mit Arcana erstellen

Einesehr ausführliche Anleitung(und der erste Weg bei Softwareänderungen) findet sich bei der GWDG.

  1. Sie benötigen einen Account für Chat-AI der Academic Cloud. Nutzen Sie die "Föderierte Anmeldung", wählen dann die MLU und setzen Ihren 5-Steller mit Passwort.
  2. Danach erstellen Sie sich mit dem gleichen Verfahren und Angaben einen Account bei Arcana, dem RAG-Manager der GWDG.
  3. In Ihrem Dashboard von Arcana ("My Arcana") können Sie nun ein neues Projekt anlegen. Die Anleitung dort steht direkt darunter.
    Arcana Dashboard
  4. Nach Erstellung eines neuen Arcana werden Sie zum Upload der Dateien aufgefordert. Diese können verschiedene Formate umfassen. Mit dem Upload ist es allerdings nicht getan. Die Daten müssen intern transformiert und indexiert werden. Betätigen Sie daher die Schaltfläche "Index Generation". Größere PDF benötigen rund 30 Minuten, bis sie aufbereitet sind. Eine grüne Schaltfläche zeigt, dass die Indexierung erfolgreich war. Das PDF wird zunächst in ein JSON-Format umgewandelt, dann in ein MarkDown-Format, dann indexiert. Sie können auch Dokumente mit bereits vorhandenem MarkDown-Format hochladen, dann ist eine Konvertierung nicht notwendig. Dies wird spannend, wenn Sie Dokumente für eine bessere Indexierung nachträglich bearbeiten wollen.
    RAG Arcana Indexierung
    RAG Arcana Indexierung
  5. Nun können Sie mit der Schaltfläche Access Link ihren eigentliche Chat starten. Kopieren Sie auch Ihre Arcana-ID mit, die benötigen Sie unbedingt.



*** in Bearbeitung ***