Zum Hauptinhalt springen

Vektordatenbanken

Vektordatenbanken sind die Datenbanken, mit denen Embeddingsuchen durchgeführt werden können. Sie ermöglichen das Speichern von vielen/langen Dokumenten und das spätere Abrufen mit einem LLM. Langdock unterstützt aktuell folgende Anbieter:

Verbindung einrichten

Beim Arbeiten mit Vektordatenbanken muss zunächst in den Einstellungen der jeweiligen Integration eine Verbindung aufgesetzt werden. Sobald die jeweilige Vektordatenbank angebunden ist, kann sie in Assistenten als Action oder im Chat mit @ genutzt werden. Mit der jeweiligen Anfrage schreibt das Modell einen Request an die Datenbank und eine Embeddingsuche wird durchgeführt.

Wissensordner

Ein Wissensordner ist eine Sammlung an mehreren hundert Dateien, die man als Wissen verwenden kann. Wissensordner sind Vektordatenbanken im Produkt, sodass für kleinere Anwendungsfälle nicht eine eigene Vektordatenbank aufgesetzt werden muss und weniger technische User mit vielen Dokumenten arbeiten können.

Kapazität

Es können bis zu 1.000 Dateien manuell oder via API hochgeladen werden.

Verwaltung

User können den Wissensordner vollständig über die Benutzeroberfläche verwalten (Integrationen → Wissensordner), einschließlich:
  • Hochladen von Dateien
  • Löschen von Dateien
  • Rechtevergabe
Eine automatische Synchronisierung aus Integrationen ist nicht möglich.
Teilen: Man kann Wissensordner mit einzelnen Nutzern, Gruppen oder dem gesamten Workspace teilen.

API-Zugang

Alternativ können User über die Knowledge Folder API programmatisch Dateien hochladen, updaten oder löschen. Hier kann ein Link eingefügt werden, um in der Antwort für User auf die Originalquelle zu verweisen.

Unterschiede: Wissensordner vs. eigene Vektordatenbank

Wissensordner eignen sich für weniger technische User und für kleinere Anwendungsfälle, die schnell umgesetzt werden sollen. Für sehr große, wertvolle Anwendungsfälle mit mehreren tausend Dokumenten hilft erfahrungsgemäß eine eigene Vektordatenbank, da hier die Einstellungen an den Anwendungsfall, Länge der Paragraphen, Themen etc. angepasst werden können.
FeatureWissensordner (Langdock)Eigene Vektordatenbank
VerwaltungKomplett von Langdock verwaltet, keine eigene Infrastruktur nötigVolle Kontrolle über Modelle, Dimensionen, Retrieval-Parameter, Aktualisierungen etc.
StandardeinstellungenOptimierte Standardeinstellungen (2.000-Zeichen-Chunks, 1536 Dimensionen, Top-50-Retrieval)Keine vorgegebenen Einstellungen
DatenmengeIdeal für bis zu 1.000 DateienUnbegrenzte Datenmengen und individuelle Datenstrukturen möglich
EinrichtungSchnelle Einrichtung über die Langdock-BenutzeroberflächeEigene Infrastruktur, Wartung und Anbindung über Langdock-Actions erforderlich
ZugriffssteuerungGranulare Zugriffssteuerung und UI-Verwaltung in LangdockDie Zugriffssteuerung muss selbst implementiert werden