Optical en intelligent character recognition — OCR en ICR voor de vrienden — herkennen respectievelijk geprinte tekst en handgeschreven, losstaande krabbels. Op zich niks nieuws onder de zon, want beide bestaan al decennia. Maar de evoluties binnen machine learning hertekenden de laatste jaren het volledige plaatje.
State of the art OCR- en ICR-systemen worden vandaag getraind vanuit neurale netwerken: ze krijgen grote hopen data binnen en leren bijvoorbeeld ‘lezen’ door duizenden exemplaren van de letters A, B tot Z te slikken en te leren wat zo’n letter specifiek maakt en welke varianten er allemaal van bestaan.
De grenzen van de mogelijkheden van OCR en ICR schuift voortdurend op. Waar een scan vroeger mooi recht moest zijn en in hoog contrast, worden de regels nu veel soepeler. Een gekreukt of schuin blad is allang geen probleem meer, net als bleke tekst op een donkere achtergrond of print in combinatie met handschrift
We volgen verschillende systemen in dit domein heel nauw op, zowel cloud-based als SDK installaties. Om nog betere resultaten te krijgen, combineren we graag meerdere OCR-systemen, zodat de kans op herkenning nog veel hoger ligt. Het resultaat zijn betrouwbare systemen die onafhankelijk werken van om het even welke softwareaanbieder, maar wel uw documenten in een handomdraai inlezen.