Migrato introduceert een nieuwe methode van documentanalyse en -classificatie waardoor minimaal 90 procent van de documenten automatisch worden geclassificeerd. Tot op heden kan met de huidige software en methodiek voor documentherkenning een 60 procent automatische documenttype bepaling worden bereikt. De nieuwe Migrato Documentclassificatie-software kan de productiviteit van een vaste groep classificatiemedewerkers tot 400 procent verhogen. Daarnaast werkt de software 24/7 waardoor het rendement van de organisatie sterk verbetert.
Bij het digitaliseren van ‘oud’ materiaal met een lange historie zoals personeel- en patiëntendossiers is er zelden sprake van vooraf bekende en goed gestructureerde documenten. Ook documenten en formulieren maken een ontwikkeling door. Een nieuw logo of opmaak, een andere indeling maar ook andere titels en begrippenkader. Externe documenten veranderen omdat nieuwe organisaties een bestaande regeling uitvoeren, door fusies van organisaties en door andere wet- en regelgeving.
De nieuwe methode van Migrato combineert meerdere analysemethodieken zoals documentlay-out analyse, documentzone indeling- en inhoudsanalyse, contextanalyse van de kop- en bodytekst aangevuld met specifieke bedrijfsproces gerelateerde regels met betrekking tot trefwoordcombinatie en syntaxregels. De gewogen combinatie van al deze technieken benadert in hoge mate de menselijke manier van documentclassificatie en keyword herkenning. Van eerst een algemene visuele analyse, via een meer gestructureerde tekstanalyse, een gedetailleerde analyse van zinnen en woordcombinaties tot en met de plaats van het document in het dossier. Door deze methodiek speciaal voor het HR-domein toe te passen kan nu al minimaal 90 procent van de documenten automatisch worden geclassificeerd.
Classificatie vraagt om nieuwe software
De huidige software maakt het noodzakelijk om eerst per documenttype en de varianten daarop een ‘documenttype voorbeeldset’ op te bouwen. Na uitgebreid testen wordt dan een 60 procent automatische documenttype bepaling bereikt. De resterende 40 procent moet dan nog steeds handmatig moeten worden verwerkt. Daarbij is gebleken dat een uniforme classificatie van de documenten door meerdere personen foutgevoelig is. Voor kleine projecten is de personele afhankelijkheid nog wel haalbaar, maar bij een project met honderdduizenden documenten vraagt dit om een grote groep aan getrainde medewerkers. Ook vereist het een grote inspanning en investering om voor alle historische documenten een typedefinitie te maken of de software met een representatieve referentieset te trainen. Vermindering van de handmatige classificatie is alleen mogelijk door de 60 procent automatische documentclassificatie te verhogen.