Dokumentensuche

Je mehr Kontext und Details du hinzufügst, desto besser wird deine Antwort, weil das Modell genau versteht, was du erwartest. Verpasse nicht unseren Prompt Engineering Guide, um zu lernen, wie du großartige Prompts schreibst.

Die Dokumentensuche ermöglicht es dir, mit hochgeladenen Dateien direkt in deinen Konversationen zu arbeiten. Wenn du Dokumente anhängst, kann die KI Text extrahieren, nach bestimmten Informationen suchen und Fragen basierend auf dem tatsächlichen Inhalt beantworten.

Wie du Dokumente hinzufügst

Du kannst Dokumente auf verschiedene Arten zu einem Chat hinzufügen:

Direkt hochladen - Klicke auf den + Button und wähle Datei hochladen, oder ziehe Dateien per Drag & Drop in den Chat
Über Integrationen - Klicke auf den + Button, dann auf Datei auswählen, um aus verbundenen Diensten wie Google Drive, OneDrive oder SharePoint auszuwählen (erfahre, wie du Integrationen einrichtest)
Aus der Zwischenablage einfügen - Füge Dateien direkt in das Chat-Eingabefeld ein

Wie die Dokumentensuche funktioniert

Wenn du ein Dokument anhängst, verarbeitet Langdock es automatisch:

Textextraktion - Inhalte werden aus deinen Dateien extrahiert (PDFs, Word-Dokumente, Präsentationen usw.)
Chunking - Lange Dokumente werden in handhabbare Abschnitte aufgeteilt
Embedding - Textabschnitte werden in Vektor-Embeddings für semantische Suche umgewandelt
Kontext-Injektion - Relevante Inhalte werden zusammen mit deinem Prompt an die KI gesendet

Suchmodi

Die KI nutzt die Dokumentensuche auf drei verschiedene Arten:

Modus	Wann er verwendet wird	Beispiel
Vollständiger Abruf	Wenn die KI den kompletten Dokumentinhalt benötigt	”Fasse dieses gesamte Dokument zusammen”
Gezielte Suche	Bei der Suche nach bestimmten Infos in bekannten Dokumenten	”Finde den Preisabschnitt im Angebot”
Dokumentenübergreifende Suche	Bei der Suche über alle angehängten Dokumente	”Was sagen diese Verträge zur Kündigung?”

Bestimmte Seiten anzeigen

Für Dokumente, bei denen das Layout wichtig ist (PDFs, Word-Dokumente und PowerPoint-Dateien mit Abbildungen, Tabellen oder Diagrammen), kann das Modell Seiten als visuelle Screenshots anzeigen. Beim Hochladen:

Bei kürzeren Dokumenten: Alle Seiten werden automatisch als Screenshots erfasst
Bei längeren Dokumenten: Eine Auswahl von Seiten vom Anfang, aus der Mitte und vom Ende wird initial erfasst

Du kannst das Modell bitten, zusätzliche Seiten bei Bedarf mit dem Seiten-Viewer anzuzeigen. Das ist besonders nützlich, wenn:

Das Dokument Abbildungen oder Diagramme enthält
Du die Tabellenformatierung sehen musst
Du das Modell bittest, einen bestimmten Teil “anzuschauen” oder zu “prüfen”

Der Seiten-Viewer zeigt einen Seitenbereich pro Anfrage an. Für längere Abschnitte macht das Modell mehrere Anfragen.

Unterstützte Dateitypen

Langdock unterstützt PDFs, Word-Dokumente, PowerPoints, Tabellen, Bilder, Audiodateien und mehr. Die vollständige Liste mit Größenlimits findest du unter unterstützte Dateitypen.

Textbasierte Dateien haben ein 8-Millionen-Zeichen-Limit zusätzlich zu den Dateigrößenlimits. Ein großes PDF könnte das Zeichenlimit erreichen, bevor das Größenlimit erreicht wird.

Anwendungsfälle

Zusammenfassung

“Fasse die wichtigsten Punkte aus diesem Bericht zusammen”
“Gib mir eine Zusammenfassung in einem Absatz für jedes angehängte Dokument”

Fragen beantworten

“Was sind die Zahlungsbedingungen in diesem Vertrag?”
“Was waren laut dieser Forschungsarbeit die wichtigsten Erkenntnisse?”

Analyse und Vergleich

“Vergleiche die Preise in diesen drei Angeboten”
“Was sind die Unterschiede zwischen diesen beiden Richtlinien-Dokumenten?”

Extraktion

“Extrahiere alle Daten und Fristen, die in diesem Dokument erwähnt werden”
“Liste alle Personen auf, die in diesen Meeting-Notizen erwähnt werden”

Einschränkungen

Tabellenextraktion ist bei komplexen Tabellen nicht vollständig zuverlässig. Für bessere Ergebnisse mit tabellarischen Daten:

Nutze das Datenanalyse-Tool mit CSV- oder Excel-Dateien
Verbinde dich über Integrationen mit Google Sheets oder Excel
Mache einen Screenshot der Tabelle und lade ihn als Bild hoch

Aktuelle Einschränkungen:

Komplexe Tabellenstrukturen werden möglicherweise nicht korrekt extrahiert
Bilder und Grafiken, die in Dokumente eingebettet sind, werden bei der Textverarbeitung nicht extrahiert, aber du kannst das Modell bitten, sie über den Seiten-Viewer anzuzeigen, der Seiten-Screenshots anzeigt
Handschriftlicher Text oder gescannte Dokumente mit schlechter OCR-Qualität können Extraktionsfehler aufweisen
Passwortgeschützte Dateien können nicht verarbeitet werden

Best Practices

Für bessere Ergebnisse:

Sei spezifisch bei dem, wonach du suchst
Referenziere Dokumentnamen, wenn du mehrere Dateien hast
Bitte die KI, direkt aus der Quelle zu zitieren, wenn Genauigkeit wichtig ist
Beginne bei langen Dokumenten mit einer Zusammenfassungsanfrage, um die Struktur zu verstehen

Arbeiten mit mehreren Dokumenten:

Du kannst bis zu 20 Dokumente in einer einzelnen Konversation anhängen
Benenne deine Dateien aussagekräftig, damit die KI sie klar referenzieren kann
Wenn du Dokumente vergleichst, gib explizit an, welche Dokumente verglichen werden sollen

Für Integrations-Dateien:

Stelle sicher, dass du eine aktive Verbindung zum Dienst hast
Die KI wird dich auffordern, dich zu verbinden, wenn Zugriff benötigt wird
Dateiberechtigungen aus dem Quelldienst werden respektiert

Documentation Index

​Wie du Dokumente hinzufügst

​Wie die Dokumentensuche funktioniert

​Suchmodi

​Bestimmte Seiten anzeigen

​Unterstützte Dateitypen

​Anwendungsfälle

​Einschränkungen

​Best Practices

Wie du Dokumente hinzufügst

Wie die Dokumentensuche funktioniert

Suchmodi

Bestimmte Seiten anzeigen

Unterstützte Dateitypen

Anwendungsfälle

Einschränkungen

Best Practices