|
|
| (2 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt) |
| Zeile 10: |
Zeile 10: |
| </div> | | </div> |
| <div class="text" aria-labelledby="RAG_Übersicht"> | | <div class="text" aria-labelledby="RAG_Übersicht"> |
| '''Retrieval Augmented Generation''' (RAG) ist eine Technik zur Verarbeitung natürlicher Sprache, die die Stärken von abfragebasierten und generativen Modellen der künstlichen Intelligenz kombiniert. Mit einem RAG "befragen" Sie über einen Chat definierte Ordnerinhalte oder Datenbanken, die Sie selbst gefüllt haben. Stellen Sie sich einen geschützten Ordner vor, in dem alle Ihre Vorlesungsskripte, zusätzliche Materialien, eine Liste der Ansprechpartner und ein Timetable Ihrer Veranstaltungen abgelegt und indexiert sind. Ein Chat beantwortet dann Fragen zu Ihrer Veranstaltung und greift dabei '''auf die Inhalte Ihres Ordners''' zurück. In Verbindung mit einem passenden Systemprompt entsteht so ein '''Chatbot''' für Ihre Veranstaltung. Die Güte der Antworten hängt allerdings nicht allein vom Umfang Ihrer Dateien ab, sondern - und hier liegt eine Schwierigkeit - auch von der Güte und Struktur der transformierten und vorbereiteten Daten für die KI. | | '''Retrieval Augmented Generation''' (RAG) ist eine Technik zur Verarbeitung natürlicher Sprache, die die Stärken von abfragebasierten und generativen Modellen der künstlichen Intelligenz kombiniert. Mit einem RAG "befragen" Sie über einen Chat definierte Ordnerinhalte oder Datenbanken, die Sie selbst gefüllt haben. Stellen Sie sich einen geschützten Ordner vor, in dem alle Ihre Vorlesungsskripte, zusätzliche Materialien, eine Liste der Ansprechpartner und ein Timetable Ihrer Veranstaltungen abgelegt und indexiert sind. Ein Chat beantwortet dann Fragen zu Ihrer Veranstaltung und greift dabei '''auf die Inhalte Ihres Ordners''' zurück. In Verbindung mit einem passenden Systemprompt entsteht so ein '''Chatbot''' für Ihre Veranstaltung. Die Güte der Antworten hängt allerdings nicht allein vom Umfang Ihrer Dateien ab, sondern - und hier liegt eine Schwierigkeit - auch von der [[Portal:Künstliche Intelligenz/Beispiel-RAG|Güte und Struktur der transformierten und vorbereiteten Daten]] für die KI. |
|
| |
|
| [[Datei:RAG Übersicht.png|alternativtext=Prinzip eines RAG|mini|628x628px|Prinzip eine RAG|zentriert]]Die MLU verfügt derzeit noch nicht über ein solches System. Der IT-Dienstleister GWDG für die Hochschulen in Niedersachsen, der auch '''CHAT-AI''' der Academic Cloud betreibt, bietet allerdings kostenfrei das Werkzeug '''Arcana''' an, mit deren Hilfe alle Lehrenden der MLU solche RAG-Modelle erstellen können. Für eine Umsetzung benötigen Sie einen Account für die Academic Cloud, der über Ihren Uni-Login realisiert wird. | | [[Datei:RAG Übersicht.png|alternativtext=Prinzip eines RAG|mini|628x628px|Prinzip eine RAG|zentriert]]Die MLU verfügt derzeit noch nicht über ein solches System. Der IT-Dienstleister GWDG für die Hochschulen in Niedersachsen, der auch '''CHAT-AI''' der Academic Cloud betreibt, bietet allerdings kostenfrei das Werkzeug '''Arcana''' an, mit deren Hilfe alle Lehrenden der MLU solche RAG-Modelle erstellen können. Für eine Umsetzung benötigen Sie einen Account für die Academic Cloud, der über Ihren Uni-Login realisiert wird. |
| Zeile 24: |
Zeile 24: |
| </div> | | </div> |
| <div class="text" aria-labelledby="RAG_Übersicht"> | | <div class="text" aria-labelledby="RAG_Übersicht"> |
| Eine[https://docs.hpc.gwdg.de/services/arcana/getting-started/index.html#first-login sehr ausführliche Anleitung](und der erste Weg bei Softwareänderungen) findet sich bei der GWDG. | | Eine[https://docs.hpc.gwdg.de/services/arcana/getting-started/index.html#first-login sehr ausführliche Anleitung](und der erste Weg bei Softwareänderungen) findet sich bei der GWDG. Hier die Kurzanleitung: |
|
| |
|
| # Sie benötigen einen Account für [[Chat AI|Chat-AI der Academic Cloud]]. Sofern Sie dort noch keinen haben nutzen Sie die "Föderierte Anmeldung", wählen dann die MLU und setzen Ihren 5-Steller mit Passwort. | | # Sie benötigen einen Account für [[Chat AI|Chat-AI der Academic Cloud]]. Sofern Sie dort noch keinen haben nutzen Sie die "Föderierte Anmeldung", wählen dann die MLU und setzen Ihren 5-Steller mit Passwort. |
| # Danach erstellen Sie sich mit dem gleichen Verfahren und Angaben einen [https://chat-ai.academiccloud.de/arcanas/ Account bei Arcana], dem RAG-Manager der GWDG. | | # Danach erstellen Sie sich mit dem gleichen Verfahren und Angaben einen [https://chat-ai.academiccloud.de/arcanas/ Account bei Arcana], dem RAG-Manager der GWDG. |
| # In Ihrem Dashboard von Arcana ("My Arcana") können Sie nun ein neues Projekt anlegen. Die Anleitung dort steht direkt darunter. [[Datei:RAG Arcana1.png|zentriert|rahmenlos|888x888px|Arcana Dashboard]] | | # In Ihrem Dashboard von Arcana ("My Arcana") können Sie nun ein neues Projekt anlegen. Die Anleitung dort steht direkt darunter. [[Datei:RAG Arcana1.png|zentriert|rahmenlos|888x888px|Arcana Dashboard]] |
| # Nach Erstellung eines neuen Arcana werden Sie zum Upload der Dateien aufgefordert. Diese können verschiedene Formate umfassen. Mit dem Upload ist es allerdings nicht getan. '''Die Daten müssen intern transformiert und indexiert werden'''. Betätigen Sie daher die Schaltfläche "Index Generation". Größere PDF benötigen rund 30 Minuten, bis sie aufbereitet sind. Eine grüne Schaltfläche zeigt, dass die Indexierung erfolgreich war. Das PDF wird zunächst in ein JSON-Format umgewandelt, dann in ein MarkDown-Format, dann indexiert. Sie können auch Dokumente mit bereits vorhandenem MarkDown-Format hochladen, dann ist eine Konvertierung nicht notwendig. Dies wird relevant, wenn Sie Dokumente für eine bessere Indexierung nachträglich bearbeiten wollen (Sie können das konvertierte MarkDown-Format im RAG-Manager auch direkt downloaden und nachbearbeiten). Sollte es zu '''Fehlern bei der Indexierung''' kommen müssen Sie den Upload neu starten. In der Regel liegt ein Dateifehler vor. Manchmal hilft es, ein sehr langes Dokument zu teilen und getrennt hochzuladen und erneut zu indexieren. Die '''Güte der Indexierung''' (und damit der Qualität der Antworten des Bots) hängen sehr stark davon ab, wie die Ursprungsdokumente aufgebaut sind. Schlechte Erfahrungen haben wir mit Wiki-Quelltexten oder HTML-Seiten gesammelt, da diese weitere Steuerelemente umfassen, die trotz Parsing und weiterer Maßnahmen nur schlecht indexiert werden. Am besten funktionieren klar strukturierte PDF-Dokumente mit definierten Überschriften und zugehörigen Textabschnitten. Es lohnt auch, besonders relevante Informationen (z.B. Kontaktadressen, Veranstaltungskalender o.ä.) separat in einer Tabelle zu erstellen und als einzelnes Dokument einzureichen. Hier muss etwas improvisiert werden, bis die korrekten Antworten kommen. [[Datei:RAG Arcana2.png|alternativtext=RAG Arcana Indexierung|zentriert|mini|857x857px|RAG Arcana Indexierung]] | | # Nach Erstellung eines neuen Arcana werden Sie zum Upload der Dateien aufgefordert. Diese können verschiedene Formate umfassen. Mit dem Upload ist es allerdings nicht getan. '''Die Daten müssen intern transformiert und indexiert werden'''. Betätigen Sie daher die Schaltfläche "Index Generation". Größere PDF benötigen rund 30 Minuten, bis sie aufbereitet sind. Eine grüne Schaltfläche zeigt, dass die Indexierung erfolgreich war. Das PDF wird zunächst in ein JSON-Format umgewandelt, dann in ein MarkDown-Format, dann indexiert. Sie können auch Dokumente mit bereits vorhandenem MarkDown-Format hochladen, dann ist eine Konvertierung nicht notwendig. Dies wird relevant, wenn Sie Dokumente für eine bessere Indexierung nachträglich bearbeiten wollen (Sie können das konvertierte MarkDown-Format im RAG-Manager auch direkt downloaden und nachbearbeiten). Sollte es zu '''Fehlern bei der Indexierung''' kommen müssen Sie den Upload neu starten. In der Regel liegt ein Dateifehler vor. Manchmal hilft es, ein sehr langes Dokument zu teilen und getrennt hochzuladen und erneut zu indexieren. Die '''Güte der Indexierung''' (und damit der Qualität der Antworten des Bots) hängen sehr stark davon ab, wie die Ursprungsdokumente aufgebaut sind. Schlechte Erfahrungen haben wir mit direkter Übernahme von Wiki-Quelltexten oder HTML-Seiten gesammelt, da diese weitere Steuerelemente umfassen, die trotz Parsing und weiterer Maßnahmen nur schlecht indexiert werden (es gibt aber auch dafür eine [[Portal:Künstliche Intelligenz/Beispiel-RAG|pragmatische Lösung]]). Am besten funktionieren klar strukturierte PDF-Dokumente mit definierten Überschriften und zugehörigen Textabschnitten. Es lohnt auch, besonders relevante Informationen (z.B. Kontaktadressen, Veranstaltungskalender o.ä.) separat in einem Dokument zu erstellen und als einzelnes Dokument einzureichen. Wir haben das in unserem [[Portal:Künstliche Intelligenz/Beispiel-RAG|Beispiel]] weiter unten erläutert. [[Datei:RAG Arcana2.png|alternativtext=RAG Arcana Indexierung|zentriert|mini|857x857px|RAG Arcana Indexierung]] |
| # Nun können Sie mit der Schaltfläche '''Access Link''' ihren eigentliche Chat starten. Kopieren Sie auch Ihre Arcana-ID mit, die benötigen Sie unbedingt. | | # Nun können Sie mit der Schaltfläche '''Access Link''' ihren eigentliche Chat starten. Kopieren Sie auch Ihre Arcana-ID mit, die benötigen Sie unbedingt. |
| # Den Chatbereich müssen Sie zunächst weiter vorbereiten. Vergleichen Sie Ihren Chat mit den Hinweisen im nachstehenden Bild. [[Datei:RAG Chat 2.png|zentriert|rahmenlos|853x853px|RAG: Chat-Einstellungen]] | | # Den Chatbereich müssen Sie zunächst weiter vorbereiten. Vergleichen Sie Ihren Chat mit den Hinweisen im nachstehenden Bild. [[Datei:RAG Chat 2.png|zentriert|rahmenlos|853x853px|RAG: Chat-Einstellungen]] |