Informatie vinden door context

Veel zoeksystemen werken door middel van keyword search. Het zoeken van een woord in een brei van documenten. Dus naar content. Veel relevanter is wanneer je binnen de bronsystemen kunt zoeken naar de context. Maar wat is nou precies het verschil tussen content en context?

Eigenlijk is content alles wat je communiceert: tekst, maar ook video’s en beeld. Het is een belangrijk onderdeel van een context-gebaseerde strategie. Content houdt in dat aan de hand van de door jou ingetypte zoekwoorden een aantal relevante informatiebronnen naar boven komen die dezelfde zoekwoorden hebben. Bij context wordt gekeken naar de content, maar ook naar de omstandigheden. Dus naar de woorden die rondom het zoekwoord staan. Hierdoor zijn de zoekresultaten bruikbaarder. Een voorbeeld is bijvoorbeeld: ‘Ik ga mijn geld naar de bank brengen’. Hierbij heeft het woord bank een andere betekenis dan in de zin: ‘Ik zoek een bank waar ik lekker in weg kan zakken’. En heeft het woord nam in de zin ’Is de NAM betrokken bij aardbevingen in Groningen?’ een andere betekenis dan: ’Nam hij een hap van mijn boterham?’ Bij het gebruikmaken van context search krijg je werkelijk die documenten welke relevant zijn.

Groei van ongestructureerde data
Volgens experts zal de wereldwijde data groeien tot maar liefst 175 zettabytes in 2025. Deze voorspelde groei is duizelingwekkend.
Nog niet zo lang geleden vonden mensen vaak alleen maar gegevens zoals e-commerce, ERP, e-mail opgeslagen in organisatorische databases belangrijk. Hoewel ze nog steeds relevant zijn, worden ongestructureerde gegevens tegenwoordig steeds relevanter. Documenten, Powerpoint, IoT-gegevens, streaming-data, geografische gegevens, gebruikersgegevens etc. zijn de levensader van veel bedrijven. In deze overload van data is het dus van belang om direct de relevante informatie bovenwater te halen.

Het doorzoeken van bedrijfssystemen
Als je veel documenten ontvangt of wanneer je in een grotere organisatie werkt, dan is de kans groot dat je niet de juiste context kent. Bijvoorbeeld omdat die context op een andere afdeling bekend is, of omdat je zelf maar een deel van het proces bent. Die context is dus opgeslagen op een andere plaats in je organisatie. Met taaltechnologie (NLP) kun je de ongestructureerde informatie in een document automatisch in de juiste context plaatsen. Het systeem zoekt alle relevante informatie voor je op. Alle denkbare informatie die ergens in de organisatie is opgeslagen wordt hierbij gebruikt. Met Taaltechnologie maak je van statische gearchiveerde documenten digitale bruikbare data.

Novadoc is specialist in het vastleggen van informatie en veel overheids- en financiële instellingen maken gebruik van deze expertise. Naast Filenet en Business Proces Management oplossingen is Novadoc ook specialist in IBM Watson. Met behulp van de Watson Natural Language Processing (NLP) oplossingen wordt gezorgd voor het in context kunnen doorzoeken van ongestructureerde data.

Bron: Novadoc