document-extractor
Extrakce dat z dokumentů
Tato komponenta slouží k extrakci dat z dokumentů v systému EspoCRM. Je součástí modulu AI Parsing, který umožňuje automatické zpracování obsahu dokumentů pomocí umělé inteligence.
Jak to funguje
DocumentExtractor je specializovaná třída, která zpracovává dokumenty uložené v systému. Hlavní funkcí je:
- Získání ID příloh dokumentu - každý dokument má přiřazený soubor (fileId)
- Kontrola, zda je typ entity dokumentu povolen pro AI zpracování
- V případě chyby vyvolá výjimku s popisem problému
Komponenta spolupracuje s:
- Konfigurací systému (
Config) - Základní třídou pro extraktory (
BaseExtractor) - Nástrojem pro AI zpracování (
AiParsingTool)
Technické informace
Třída DocumentExtractor
- Namespace:
Espo\Modules\AiParsing\Tools\Parsing\Extractors - Rozšiřuje:
BaseExtractor
Vlastnosti
protected string $entityType- Nastaveno naDocument::ENTITY_TYPE
Metody
__construct(Config $config)- Inicializuje extraktor s konfigurací systémuprotected getAttachmentsIds(Entity|Document $entity): ?array- Vrací ID příloh dokumentuprotected getEntityType(Entity $entity): ?string- Získá typ entity pro AI zpracování a validuje ho
Závislosti
Document- Entita dokumentuAiParsingRecord- Záznam o AI zpracováníErrorFactory- Továrna na chybové výjimky