Datenanalyse

Das Datenanalyse-Tool in Langdock ermöglicht Nutzern (unter anderem) CSV-Dateien, Excel oder Google Sheets zu lesen und zu verarbeiten. Weitere Details zur Tabellenvorschau in Dateien findest du unter Letzte Dateien. Diese Funktion kann verwendet werden, um:

Tabellarische Daten zu lesen (CSVs, Excel-Tabellen und Google Sheets)
Mathematische Operationen durchzuführen, z.B. Korrelationen zu finden, Verteilungen oder Abweichungen zu definieren usw.
Grafiken und Diagramme zu erstellen, die Daten darstellen
Neue Dateien zu generieren (Excel, CSV, PowerPoint, Word usw.)

Frage im Chat, was du erreichen möchtest. Versuche, so spezifisch wie möglich zu sein.

Wie es funktioniert

Der Datenanalyst ist ein Tool, das die Modelle auswählen können. Es wird ausgelöst, wenn du die Modelle aufforderst, es zu verwenden (“verwende den Datenanalysten”) oder wenn die entsprechende Datei hochgeladen wird (GSheets, CSVs, Excel-Dateien). Hier ist ein Beispiel für eine Datei, die wir in Langdock verwenden werden:

Um die besten Ergebnisse zu erzielen, stelle sicher, dass die Spaltentitel in der ersten Zeile stehen. Für die aktuell empfohlenen Modelle besuche langdock.com/models.

Das Modell generiert dann Python-Code. Python ist eine Programmiersprache, die verwendet werden kann, um Datensätze zu analysieren und Informationen zu extrahieren. Im dunklen Code-Block oben kannst du den generierten Python-Code zur Analyse unserer Beispieldatei sehen:
Nachdem der Code generiert wurde, führt eine separate Instanz den Python-Code aus und gibt das Ergebnis an das Modell zurück. Es wird unter dem Codeblock im Screenshot oben angezeigt.
Das Modell nutzt den Prompt und das Ergebnis, um die Frage des Nutzers zu beantworten. In unserem Beispiel sieht das so aus:
Wenn du eine Datei oder ein Diagramm anforderst, generiert das Modell erneut Code, um die Datei zu erstellen, und führt ihn anschließend aus. Die generierte Datei oder das Diagramm wird dann im Chat angezeigt und kann heruntergeladen werden.

Diagramme

Langdock bietet zwei Möglichkeiten zur Erstellung von Visualisierungen: integrierte Diagramme für einfache Daten und matplotlib für komplexe Visualisierungen.

Integrierte Diagramme

Für einfache Visualisierungen nutzt das Modell ein natives Diagramm-Tool, das direkt in der Chat-Oberfläche rendert. Diese Diagramme sind schnell, interaktiv und erfordern keine Code-Ausführung. Unterstützte Diagrammtypen:

Diagrammtyp	Geeignet für
Balken	Kategorien vergleichen, Verteilungen zeigen
Linie	Trends über Zeit, kontinuierliche Daten
Kreis	Anteile eines Ganzen darstellen

Das Modell wählt automatisch das integrierte Diagramm-Tool, wenn deine Anfrage einfach ist und einem dieser Diagrammtypen entspricht. Beispiel-Prompts für integrierte Diagramme:

“Zeig mir ein Balkendiagramm der Umsätze nach Region”
“Erstelle ein Kreisdiagramm der Budgetaufteilung”
“Stelle den monatlichen Umsatz als Liniendiagramm dar”

Wann matplotlib verwendet wird

Für komplexere Visualisierungen nutzt das Modell matplotlib über den Python-Code-Interpreter. Das passiert, wenn du Folgendes brauchst:

Mehrere Datenreihen oder Subplots
Individuelle Stile, Farben oder Annotationen
Statistische Visualisierungen (Histogramme, Streudiagramme, Heatmaps)
Erweiterte Formatierung oder Layouts

Wenn du speziell eine matplotlib-Visualisierung möchtest (zum Beispiel um Farben anzupassen oder Annotationen hinzuzufügen), erwähne es einfach in deinem Prompt: “Verwende matplotlib, um ein Streudiagramm mit Trendlinie zu erstellen.”

Beispiel-Prompts, die matplotlib auslösen:

“Erstelle ein Streudiagramm mit Regressionslinie”
“Zeig eine Heatmap der Korrelationsmatrix”
“Mach ein Histogramm der Altersverteilung mit 20 Bins”
“Stelle Umsatz und Kosten im selben Diagramm mit verschiedenen Y-Achsen dar”

Unterschiede zu anderen Dokumenten

Die normale Dokumentensuche und der Datenanalyst sind unterschiedliche Tools für verschiedene Aufgaben mit jeweiligen Vor- und Nachteilen. Die Dokumentensuche ist gut darin, den gesamten Dokumentinhalt zu verstehen. Sie ist jedoch nicht gut bei der Verarbeitung von Tabellendaten. Der Datenanalyst kann nicht die gesamte Datei verstehen, sondern nur den Teil, der mit Python extrahiert wird. Alles andere in der Datei wurde für die Antwort nicht berücksichtigt. Das macht ihn aber stark bei der Arbeit mit großen Datensätzen und Tabellendaten sowie bei mathematischen Operationen.

Best Practices und Fehlerbehebung

Damit die Datei korrekt verarbeitet wird, sollten alle Spaltentitel beschreibende Namen haben. Verwende beim Verweis auf Spaltennamen idealerweise den vollständigen Spaltentitel und nicht “Spalte K”. Das ist wichtig, da das KI-Modell Python-Code erstellt, der nur dann auf die richtige Spalte verweisen kann, wenn der Name übereinstimmt. Die Verwendung des gleichen Spaltennamens reduziert das Risiko, dass das Modell Code generiert, der auf eine falsche Spalte verweist.
Stelle sicher, dass du den Datenanalyst in deinen Einstellungen aktivierst und (falls du Arbeitsblätter in einem Agenten verwendest) auch im Bereich “Fähigkeiten” unten im Agenten-Editor.
Versuche so präzise wie möglich zu beschreiben, was du erwartest. Du kannst die Prompt-Elemente aus unserem Prompt Engineering Guide verwenden (besonders die Aufgabe, den Kontext, das Antwortformat)
Vermeide nach Möglichkeit leere Zellen in einem Arbeitsblatt.
Wenn du komplexe Aufgaben erwartest und kein Ergebnis oder falsche Ergebnisse erhältst, versuche die Anweisung in verschiedene Prompts aufzuteilen.

Documentation Index

​Wie es funktioniert

​Diagramme

​Integrierte Diagramme

​Wann matplotlib verwendet wird

​Unterschiede zu anderen Dokumenten

​Best Practices und Fehlerbehebung

Wie es funktioniert

Diagramme

Integrierte Diagramme

Wann matplotlib verwendet wird

Unterschiede zu anderen Dokumenten

Best Practices und Fehlerbehebung