Přeskočit na hlavní obsah

document-extractor

Extrakce dat z dokumentů

Tato komponenta slouží k extrakci dat z dokumentů v systému EspoCRM. Je součástí modulu AI Parsing, který umožňuje automatické zpracování obsahu dokumentů pomocí umělé inteligence.

Jak to funguje

DocumentExtractor je specializovaná třída, která zpracovává dokumenty uložené v systému. Hlavní funkcí je:

  • Získání ID příloh dokumentu - každý dokument má přiřazený soubor (fileId)
  • Kontrola, zda je typ entity dokumentu povolen pro AI zpracování
  • V případě chyby vyvolá výjimku s popisem problému

Komponenta spolupracuje s:

  • Konfigurací systému (Config)
  • Základní třídou pro extraktory (BaseExtractor)
  • Nástrojem pro AI zpracování (AiParsingTool)

Technické informace

Třída DocumentExtractor

  • Namespace: Espo\Modules\AiParsing\Tools\Parsing\Extractors
  • Rozšiřuje: BaseExtractor

Vlastnosti

  • protected string $entityType - Nastaveno na Document::ENTITY_TYPE

Metody

  • __construct(Config $config) - Inicializuje extraktor s konfigurací systému
  • protected getAttachmentsIds(Entity|Document $entity): ?array - Vrací ID příloh dokumentu
  • protected getEntityType(Entity $entity): ?string - Získá typ entity pro AI zpracování a validuje ho

Závislosti

  • Document - Entita dokumentu
  • AiParsingRecord - Záznam o AI zpracování
  • ErrorFactory - Továrna na chybové výjimky