Indexation en cours

Finance Reports • 3,102 fichiers

Progression globale

67%

Temps estimé restant

~12 min

2,078 fichiers traités 1,024 restants

Pipeline d'indexation

Extraction des fichiers

Terminé

Téléchargement depuis SharePoint via Graph API

3,102 fichiers 2.4 GB 5m 23s

Parsing des documents

Terminé

Extraction du texte (PDF, DOCX, XLSX, PPTX)

3,089 parsés 13 erreurs 8m 45s

Chunking & Embedding

En cours...

Découpage en chunks et génération des embeddings

2,078 / 3,089 fichiers 67%
45,234 chunks OpenAI ada-002
4

Indexation vectorielle

En attente

Stockage dans Azure AI Search

5

Validation & Métadonnées

En attente

Vérification de la qualité et enrichissement

Fichier en cours

Q3_2024_Financial_Report_Final_v2.xlsx

Finance Reports / Quarterly Reports

2.4 MB 156 chunks

Statistiques temps réel

Vitesse

47 docs/min

Chunks créés

45,234

Tokens traités

12.4M

Coût estimé

$2.48

Erreurs (13)

Budget_2023_Protected.xlsx

Fichier protégé par mot de passe

Scan_Invoice_corrupted.pdf

Fichier corrompu

Image_only_doc.pdf

Document sans texte extractible