Een introductie tot Data Capture


Een introductie tot Data Capture

Het capteren van gegevens uit documenten vormt de kern van de digitalisering van bedrijfsprocessen. Er zijn vele manieren om dit te doen én er zijn vele technologieën die dit mogelijk maken. Maar het is niet altijd direct duidelijk welke weg u moet bewandelen.
In deze blog overlopen we met u de fundamenten van document data capture.

Definitie van Document Data Capture

Het capteren (of vastleggen) van documentgegevens is het proces van het ‘lezen’ en distilleren van informatie uit verschillende documenten (zoals gescande documenten, elektronische bestanden, afbeeldingen, PDF’s, etc.) en het overbrengen van die informatie naar de juiste bedrijfssystemen, zoals spreadsheets, digitale analyserapporten, orderregistratie of Enterprise Resource Planning (ERP) systemen. Data is van cruciaal belang voor elk bedrijf en als de juiste informatie niet beschikbaar is, zal een bedrijf lijden onder slechte besluitvorming en daardoor zijn groei beperken.

Oplossingen voor data capture hebben twee doelen:

1.       Toegankelijkheid van informatie

Als de informatie beschikbaar is, maar niet kan worden geraadpleegd of begrepen, wordt deze nutteloos. De toegankelijkheid is dus het eerste doel van elke oplossing.

2.       Winnen van informatie

Het tweede doel van een data capture oplossing is om de gewonnen informatie (uit de verschillende contentbronnen) om te zetten in een gestructureerde vorm zodat deze geanalyseerd/gebruikt kan worden op de manier dat de onderneming dat wilt.

capture-scheme
Waarom is Document Data Capture belangrijk?

De meeste bedrijven besteden enorm veel geld en moeite aan het handmatig sorteren van gegevens die op verschillende locaties beschikbaar zijn. Dit maakt het zeer arbeidsintensief en kostelijk om de gegevens uit te lezen en te gebruiken. Met data capture oplossingen brengt u automatisering in de anders handmatige documentprocessen. Dat doet u door het creëren van geautomatiseerde workflows die de handmatige verwerking van documenten overbodig maken, wat uw bedrijf veel tijd en kosten bespaart.

De voordelen van Document Data Capture

De beste kandidaten zijn bedrijven of afdelingen die sterk afhankelijk zijn van de verwerking van formulieren en/of documenten. De meest populaire bedrijfsprocessen zijn die van de financiële afdelingen, de crediteurenafdeling, de afdeling kwaliteitsborging, de inkoop- of verkoopafdeling, de klantenservice, enz.

Door manuele processen te vervangen door een geautomatiseerde data capture oplossing ervaren bedrijven en organisaties de volgende voordelen:

  • Lagere kosten

  • Hogere nauwkeurigheid van de gegevens

  • Lagere verwerkingskosten per document

  • Snellere toegang tot cruciale gegevens

  • Snellere reactie op fouten van leveranciers

  • Snellere reactie op klanten

structured-vs-semi-structured
Gestructureerde versus semi-gestructureerde gegevens

Een belangrijk onderscheid dat in een datacapture proces moet gemaakt worden is het verschil tussen gestructureerde en semi-gestructureerde documenten.

Elk data capture systeem staat voor twee uitdagingen:

1.       Het lokaliseren van de gegevens - gestructureerde documenten

De grootste uitdaging voor een capture systeem is het vinden en herkennen van de benodigde gegevens in een specifiek document.

Dat is makkelijk als het om een vast formulier, een gestructureerd document gaat. Elk document bevat dezelfde soort informatie en ze staat ook steeds op dezelfde plaats op het formulier. We spreken dan van een gestructureerd document.

2.       Het lokaliseren van de gegevens - semi-gestructureerde documenten

We spreken van semi-gestructureerde documenten wanneer elk document dezelfde soort informatie bevat, maar wanneer we niet weten op welke locatie deze informatie zich bevindt. Typische voorbeelden zijn levernota’s, facturen, bestelbonnen enz.... Deze documenten zijn meestal niet zo gemakkelijk doorzoekbaar. Datzelfde geldt trouwens voor formaten zoals audio, video en social media postings.

Veel zakelijke documenten zijn dus semi-gestructureerd: ze hebben dezelfde basisstructuur maar kunnen verschillende lay-outs en inhoud hebben. Zo bevatten alle facturen bijvoorbeeld de factuurdatum, de naam van de leverancier en het totale verschuldigde bedrag. Maar ze bevatten ook bepaalde variabelen zoals regelartikelen, kortingen of boetes. De locatie van de verschillende gegevensvelden zal ook verschillen van factuur tot factuur.

Het vastleggen van die variabele gegevens is het moeilijkst. Maar gelukkig bevatten systemen voor het vastleggen van gegevens nu een grote verscheidenheid aan mogelijkheden om de nauwkeurigheid van de vastlegging op ongestructureerde documenten te verhogen.

De intelligente capture-oplossingen van vandaag de dag, zoals EasyForm van RecoMatics, verwerken zowel gestructureerde als semi-/non-gestructureerde gegevensdocumenten. Ze maken ook steeds gebruik van Machine Learning zodat ze steeds efficiënter worden in uw eigen omgeving.

En wat met ongestructureerde documenten? Daar komen we in een andere blog op terug!

Tot slot

Ondanks de toenemende digitalisering neemt de hoeveelheid informatie die ondernemingen jaarlijks moeten verwerken, steeds toe. Intelligente documenttechnologie is dus nodig om alle binnenkomende informatie (op papier, gedigitaliseerd of volledig digitaal) op een slimme manier te bundelen, segmenteren, automatiseren en optimaliseren.

Wat kunnen wij voor u doen?

Neem contact op.