Dokumentenverarbeitung
Wenn Sie ein Dokument in LOQI hochladen, durchläuft es eine mehrstufige Verarbeitungspipeline, um es für die KI durchsuchbar und zitierbar zu machen.
Verarbeitungsstufen
| Stufe | Was passiert |
|---|---|
| Lesen | Text wird aus der Datei extrahiert (PDF, Word, Excel usw.) |
| Strukturieren | Der Text wird in sinnvolle Abschnitte aufgeteilt (Absätze, Kapitel) |
| Indexieren | Jeder Abschnitt wird in eine Vektoreinbettung für die semantische Suche umgewandelt |
| Abgeschlossen | Das Dokument ist bereit für die KI-Nutzung |
Ein Fortschrittsbalken zeigt die aktuelle Stufe und den Prozentsatz an.
Unterstützte Dateitypen
| Typ | Erweiterungen | Hinweise |
|---|---|---|
| Einschließlich gescannter PDFs (verarbeitet über Bilderkennung) | ||
| Word | .docx | Vollständiger Text und Formatierung bleiben erhalten |
| Excel | .xlsx | Tabelleninhalte werden als Text extrahiert |
| CSV | .csv | Tabellarische Daten werden extrahiert |
| Bilder | .png, .jpg | Text wird mittels Bild-KI extrahiert |
| Text | .txt | Direkte Textübernahme |
Verarbeitungszeit
Die Verarbeitungszeit hängt ab von:
- Dateigröße — Größere Dateien benötigen mehr Zeit
- Dateityp — Gescannte PDFs (bildbasiert) dauern länger als textbasierte PDFs
- Seitenzahl — Ein 10-seitiges PDF wird in unter einer Minute verarbeitet; ein 200-seitiges Dokument kann mehrere Minuten dauern
Gescannte Dokumente
Für gescannte PDFs (bei denen Text nicht direkt extrahiert werden kann):
- LOQI verwendet Bild-KI, um jede Seite zu lesen
- Text wird aus den Bildern extrahiert
- Das Dokument durchläuft anschließend die reguläre Abschnitts- und Indexierungspipeline
Dies dauert länger, stellt aber sicher, dass auch gescannte Dokumente vollständig durchsuchbar sind.
Fehlerbehebung
Wenn ein Dokument den Status Fehlgeschlagen anzeigt:
- Prüfen Sie, ob die Datei beschädigt oder passwortgeschützt ist
- Versuchen Sie, die Datei erneut hochzuladen
- Sehr große Dateien (über 150 MB) können eine Zeitüberschreitung verursachen — versuchen Sie, sie aufzuteilen
Dateigrößenbeschränkungen
Die maximale Upload-Größe beträgt 150 MB pro Datei. Für größere Dokumente teilen Sie diese vor dem Hochladen in kleinere Teile auf.