Wat mag je verwachten van AI in geautomatiseerde documentverwerking


Cognitive Data Capture is de technologie die u in staat stelt om gegevens uit semi-gestructureerde documenten te halen. Denk hierbij aan facturen, laadbrieven, CMR's, orders en dergelijke, die de perfecte start voor u zijn om uw documenten te automatiseren. De toekomst ziet er rooskleurig uit, maar AI helpt nu al om ons te bevrijden van de repetitieve, handmatige taken. 

Wat semi-gestructureerde documenten gemeen hebben, is dat ze allemaal visuele aanwijzingen bevatten die wij mensen in één oogopslag begrijpen, ook al hebben we het specifieke document nog nooit eerder gezien. Het uiteindelijke doel van ADP (automatische document verwerking) is dit na te bootsen en een document te lezen zoals een mens dat zou doen. Het toevoegen van AI aan de mix brengt ons een stap dichter bij dit eindpunt. Maar reken vooralsnog op AI om u toegevoegde waarde te bieden in verschillende stadia van uw document automatisering.

network-nodes-arc-horizontal-small

Gegevens uitlezen? Check!

In de pre-processing fase helpt AI bij het 'scannen' van volledige pagina's of documenten, waardoor een stroom ontstaat waarin alle informatie netjes wordt geclassificeerd. De AI herkent een handtekening als een handtekening en verwart deze niet met een barcode, logo, stempel of eender wat er ook op staat. Of het nu gaat om afbeeldingen of tekst, de technologie interpreteert de documenten en vertrouwt op neurale netwerken die gemakkelijk kunnen worden gevoed en getraind met voorbeelddocumenten. Geschoold met deze informatie haalt AI de juiste kenmerken uit jouw documenten, voordat ze correct worden geclassificeerd en bewaard.

Er wordt hard gewerkt aan het nauwkeuriger maken van deze modellen, het herkennen van veel meer soorten documenten en het vergroten van de taal- en geografische dekking.

Bij gegevensextractie hoeft het wiel niet opnieuw uitgevonden te worden: dit kan al via bestaande, getrainde AI-modellen. Vooral voor facturen bestaan deze getrainde modellen als slimme online API's. Ja, er zijn nog enkele beperkingen. Sommige API's zijn beperkt tot kopvelden of gebonden aan bepaalde talen. Maar het evolueert snel. Er wordt hard gewerkt aan het nauwkeuriger maken van deze modellen, het herkennen van veel meer soorten documenten en het vergroten van de taal- en geografische dekking. De focus ligt veelal op facturen, wat betekent dat er nog geen oplossing voor 'eender welk document' beschikbaar is.

ai-brain-artificial-intelligence-610x610

Train uw AI en verwerk de gegevens

Technologie blijft ons verbazen. Als u een zeer specifiek type document wilt ontcijferen, is het mogelijk om de Azure Form Recognizer te trainen. Niet helemaal hetzelfde zoals de voorgetrainde modellen, maar komt wel heel dicht in de buurt. En er komt nog meer, want deze functionaliteit wordt binnenkort geïntegreerd in O365 als nieuwe Cortex service. Dit betekent dat u uw eigen AI-modellen kunt trainen en gebruiken als onderdeel van uw automatiseringsstrategie. Het ziet er naar uit dat de toekomst toch niet zo ver weg is.

De rol van AI is nog niet uitgespeeld als de gegevens eenmaal zijn geëxtraheerd. Als we eenmaal in de volgende fase van de verwerking van de gegevens zitten, kan AI zijn rol als een big data verwerker spelen. Het kan kwaadaardige datapatronen detecteren of u helpen met automatische suggesties voor het invoeren van gegevens op basis van uw eerdere activiteiten, en zo eindgebruikers helpen om het werk efficiënter te voltooien.

Verkort de feedback lus

Eindeloze mogelijkheden? Misschien, maar we zijn er nog niet helemaal. Hoewel AI duidelijk een toegevoegde waarde biedt, lost het niet alles op en heeft het ook nadelen. Stel dat een veld of tabelelement niet of verkeerd wordt herkend, dan zal AI niet in staat zijn om die fout direct te corrigeren voor een volgende document met dezelfde lay-out.

Het resultaat? Geoptimaliseerde automatische documentverwerking, oftewel nog minder administratief werk.

Waarom AI niet kan corrigeren? Dit vereist een hertraining en misschien is deze specifieke lay-out wel te afwijkend van het getrainde 'generieke' model, en kan het nooit getraind worden. Vertaling: de feedback lus vertrekkende bij de eindgebruiker naar het getraind model is lang, en hij of zij zal dezelfde fout vele, vele malen handmatig moeten overschrijven.

Wanhoop niet, want er is een workaround om de lange correctielus van AI op te lossen. Combineer het neurale netwerk met ons lay-out gebaseerd Point & Click leersysteem en u hebt de perfecte mix. In deze opzet extraheert u algemene gegevens bij ongekende lay-outs en bij gekende, terugkerende documenten. Het resultaat? Geoptimaliseerde geautomatiseerde documentverwerking, oftewel nog minder administratief werk.

Wat kunnen wij voor u doen?

Neem contact op.