Zum Hauptinhalt springen
Je mehr Kontext und Details du hinzufügst, desto besser wird deine Antwort, weil das Modell genau versteht, was du erwartest. Verpasse nicht unseren Prompt Engineering Guide, um zu lernen, wie du großartige Prompts schreibst.
Die Dokumentensuche ermöglicht es dir, mit hochgeladenen Dateien direkt in deinen Konversationen zu arbeiten. Wenn du Dokumente anhängst, kann die KI Text extrahieren, nach bestimmten Informationen suchen und Fragen basierend auf dem tatsächlichen Inhalt beantworten.

Wie du Dokumente hinzufügst

Du kannst Dokumente auf verschiedene Arten zu einem Chat hinzufügen:
  1. Direkt hochladen - Klicke auf den + Button und wähle Datei hochladen, oder ziehe Dateien per Drag & Drop in den Chat
  2. Über Integrationen - Klicke auf den + Button, dann auf Datei auswählen, um aus verbundenen Diensten wie Google Drive, OneDrive oder SharePoint auszuwählen (erfahre, wie du Integrationen einrichtest)
  3. Aus der Zwischenablage einfügen - Füge Dateien direkt in das Chat-Eingabefeld ein

Wie die Dokumentensuche funktioniert

Wenn du ein Dokument anhängst, verarbeitet Langdock es automatisch:
  1. Textextraktion - Inhalte werden aus deinen Dateien extrahiert (PDFs, Word-Dokumente, Präsentationen usw.)
  2. Chunking - Lange Dokumente werden in handhabbare Abschnitte aufgeteilt
  3. Embedding - Textabschnitte werden in Vektor-Embeddings für semantische Suche umgewandelt
  4. Kontext-Injektion - Relevante Inhalte werden zusammen mit deinem Prompt an die KI gesendet

Suchmodi

Die KI nutzt die Dokumentensuche auf drei verschiedene Arten:
ModusWann er verwendet wirdBeispiel
Vollständiger AbrufWenn die KI den kompletten Dokumentinhalt benötigt”Fasse dieses gesamte Dokument zusammen”
Gezielte SucheBei der Suche nach bestimmten Infos in bekannten Dokumenten”Finde den Preisabschnitt im Angebot”
Dokumentenübergreifende SucheBei der Suche über alle angehängten Dokumente”Was sagen diese Verträge zur Kündigung?”

Bestimmte Seiten anzeigen

Für Dokumente, bei denen das Layout wichtig ist (PDFs mit Abbildungen, Tabellen oder Diagrammen), kann das Modell Seiten als visuelle Screenshots anzeigen. Beim Hochladen eines PDFs:
  • Bei kürzeren PDFs: Alle Seiten werden automatisch als Screenshots erfasst
  • Bei längeren PDFs: Eine Auswahl von Seiten vom Anfang, aus der Mitte und vom Ende wird initial erfasst
Du kannst das Modell bitten, zusätzliche Seiten bei Bedarf mit dem Seiten-Viewer anzuzeigen. Das ist besonders nützlich, wenn:
  • Das Dokument Abbildungen oder Diagramme enthält
  • Du die Tabellenformatierung sehen musst
  • Du das Modell bittest, einen bestimmten Teil “anzuschauen” oder zu “prüfen”
Der Seiten-Viewer zeigt einen Seitenbereich pro Anfrage an. Für längere Abschnitte macht das Modell mehrere Anfragen.

Unterstützte Dateitypen

Langdock unterstützt PDFs, Word-Dokumente, PowerPoints, Tabellen, Bilder, Audiodateien und mehr. Die vollständige Liste mit Größenlimits findest du unter unterstützte Dateitypen.
Textbasierte Dateien haben ein 8-Millionen-Zeichen-Limit zusätzlich zu den Dateigrößenlimits. Ein großes PDF könnte das Zeichenlimit erreichen, bevor das Größenlimit erreicht wird.

Anwendungsfälle

Zusammenfassung
  • “Fasse die wichtigsten Punkte aus diesem Bericht zusammen”
  • “Gib mir eine Zusammenfassung in einem Absatz für jedes angehängte Dokument”
Fragen beantworten
  • “Was sind die Zahlungsbedingungen in diesem Vertrag?”
  • “Was waren laut dieser Forschungsarbeit die wichtigsten Erkenntnisse?”
Analyse und Vergleich
  • “Vergleiche die Preise in diesen drei Angeboten”
  • “Was sind die Unterschiede zwischen diesen beiden Richtlinien-Dokumenten?”
Extraktion
  • “Extrahiere alle Daten und Fristen, die in diesem Dokument erwähnt werden”
  • “Liste alle Personen auf, die in diesen Meeting-Notizen erwähnt werden”

Einschränkungen

Tabellenextraktion ist bei komplexen Tabellen nicht vollständig zuverlässig. Für bessere Ergebnisse mit tabellarischen Daten:
  • Nutze das Datenanalyse-Tool mit CSV- oder Excel-Dateien
  • Verbinde dich über Integrationen mit Google Sheets oder Excel
  • Mache einen Screenshot der Tabelle und lade ihn als Bild hoch
Aktuelle Einschränkungen:
  • Komplexe Tabellenstrukturen werden möglicherweise nicht korrekt extrahiert
  • Bilder und Grafiken, die in Dokumente eingebettet sind, werden bei der Textverarbeitung nicht extrahiert, aber du kannst das Modell bitten, sie über den Seiten-Viewer anzuzeigen, der Seiten-Screenshots anzeigt
  • Handschriftlicher Text oder gescannte Dokumente mit schlechter OCR-Qualität können Extraktionsfehler aufweisen
  • Passwortgeschützte Dateien können nicht verarbeitet werden

Best Practices

Für bessere Ergebnisse:
  • Sei spezifisch bei dem, wonach du suchst
  • Referenziere Dokumentnamen, wenn du mehrere Dateien hast
  • Bitte die KI, direkt aus der Quelle zu zitieren, wenn Genauigkeit wichtig ist
  • Beginne bei langen Dokumenten mit einer Zusammenfassungsanfrage, um die Struktur zu verstehen
Arbeiten mit mehreren Dokumenten:
  • Du kannst bis zu 20 Dokumente in einer einzelnen Konversation anhängen
  • Benenne deine Dateien aussagekräftig, damit die KI sie klar referenzieren kann
  • Wenn du Dokumente vergleichst, gib explizit an, welche Dokumente verglichen werden sollen
Für Integrations-Dateien:
  • Stelle sicher, dass du eine aktive Verbindung zum Dienst hast
  • Die KI wird dich auffordern, dich zu verbinden, wenn Zugriff benötigt wird
  • Dateiberechtigungen aus dem Quelldienst werden respektiert