Zum Hauptinhalt springen

Dokumentenverarbeitung

Wenn Sie ein Dokument in LOQI hochladen, durchläuft es eine mehrstufige Verarbeitungspipeline, um es für die KI durchsuchbar und zitierbar zu machen.

Verarbeitungsstufen

StufeWas passiert
LesenText wird aus der Datei extrahiert (PDF, Word, Excel usw.)
StrukturierenDer Text wird in sinnvolle Abschnitte aufgeteilt (Absätze, Kapitel)
IndexierenJeder Abschnitt wird in eine Vektoreinbettung für die semantische Suche umgewandelt
AbgeschlossenDas Dokument ist bereit für die KI-Nutzung

Ein Fortschrittsbalken zeigt die aktuelle Stufe und den Prozentsatz an.

Unterstützte Dateitypen

TypErweiterungenHinweise
PDF.pdfEinschließlich gescannter PDFs (verarbeitet über Bilderkennung)
Word.docxVollständiger Text und Formatierung bleiben erhalten
Excel.xlsxTabelleninhalte werden als Text extrahiert
CSV.csvTabellarische Daten werden extrahiert
Bilder.png, .jpgText wird mittels Bild-KI extrahiert
Text.txtDirekte Textübernahme

Verarbeitungszeit

Die Verarbeitungszeit hängt ab von:

  • Dateigröße — Größere Dateien benötigen mehr Zeit
  • Dateityp — Gescannte PDFs (bildbasiert) dauern länger als textbasierte PDFs
  • Seitenzahl — Ein 10-seitiges PDF wird in unter einer Minute verarbeitet; ein 200-seitiges Dokument kann mehrere Minuten dauern

Gescannte Dokumente

Für gescannte PDFs (bei denen Text nicht direkt extrahiert werden kann):

  1. LOQI verwendet Bild-KI, um jede Seite zu lesen
  2. Text wird aus den Bildern extrahiert
  3. Das Dokument durchläuft anschließend die reguläre Abschnitts- und Indexierungspipeline

Dies dauert länger, stellt aber sicher, dass auch gescannte Dokumente vollständig durchsuchbar sind.

Fehlerbehebung

Wenn ein Dokument den Status Fehlgeschlagen anzeigt:

  • Prüfen Sie, ob die Datei beschädigt oder passwortgeschützt ist
  • Versuchen Sie, die Datei erneut hochzuladen
  • Sehr große Dateien (über 150 MB) können eine Zeitüberschreitung verursachen — versuchen Sie, sie aufzuteilen
Dateigrößenbeschränkungen

Die maximale Upload-Größe beträgt 150 MB pro Datei. Für größere Dokumente teilen Sie diese vor dem Hochladen in kleinere Teile auf.