Ediscovery Symposium 2016

woensdag 11 mei 2016 door Tina Shah

KLDiscovery heeft op 21 april 2016 aan het zevende E-Discovery symposium van de Hogeschool van Amsterdam deelgenomen. Het thema van dit symposium was “De robotisering van informatiemanagement”. Er werd aandacht besteed aan de meest recente ontwikkelingen omtrent de automatisering van ICT systemen waarmee cognitieve oplossingen gedefinieerd kunnen worden (oftewel kunstmatige intelligentie).

Dit symposium bracht experts, onderzoekers, ondernemers en studenten samen met als doel kennis en inzichten uit te wisselen.

Verschillende toepassingen van automatisering kwamen tijdens dit symposium aan bod. Een van de sprekers die IBM representeerde, deelde zijn kennis over de ontwikkeling van Watson. Watson is een supercomputer die gesproken tekst kan interpreteren en vervolgens een antwoord kan formuleren op complexe vragen. Watson kan een gesproken en geschreven tekst begrijpen middels semantische technieken. Voor het vinden van antwoorden doorzoekt Watson een verzameling van encyclopedieën, boeken, tijdschriften en wetenschappelijke artikelen. Verder leert Watson van zijn eigen ervaringen en fouten. IBM heeft plannen om Watson te voorzien van nieuwe technieken die het zelfstandig leren van een nieuwe taal mogelijk maken. Momenteel wordt Watson voor verschillende doeleinden gebruikt waarbij hij een ondersteunende rol heeft. Een aantal industrieën waar de toepassing van Watson gerealiseerd is, zijn de gezondheidszorg, financiële markten, de overheid, verzekeringsmaatschappijen en banken.

Een andere toepassing van automatisering was Machine Learning binnen E-Discovery. Dit kan het verloop van een onderzoek waarbij grote hoeveelheden documenten op relevantie beoordeeld moeten worden, versnellen. Technieken zoals Machine Learning, Predictive Coding en Computer Assisted Review, zorgen er voor dat de computer de meest relevante documenten als eerste ter beoordeling aanbiedt. Voorafgaand aan het onderzoek wordt er middels een relatief klein maar wel representatieve set van documenten (ook wel oefen data genoemd) aan de computer aangeleerd wat relevant is. De computer is dan in staat om met behulp van complexe algoritmen de relevantie in dat specifieke geval te begrijpen. Deze kennis kan het systeem vervolgens toepassen op de resterende set van data en een indicatie geven van wat de meest relevante documenten zijn. Door tijdens het onderzoek eerst op documenten te focussen die de hoogste relevantie score hebben, kan men snel inzicht krijgen in een zaak en wordt er veel tijd gewonnen.

Een derde toepassing van automatisering die behandeld werd, ging over het op een gestructureerde manier koppelen van ongestructureerde data aan gestructureerde data. Met gestructureerde data wordt (bijvoorbeeld) goed georganiseerd in rationele databases bedoeld. Ongestructureerde data is het tegenovergestelde hiervan. Met ongestructureerde data wordt gebruikersdata zoals email, PDF, Word en Excel bestanden bedoeld. In bijna alle informatiesystemen heeft men tegenwoordig zowel met gestructureerde als ongestructureerde data te maken. Vaak betekent een bepaald gegeven zonder context heel weinig. Pas als dit gegeven in context wordt geplaatst, kan er betekenis aan ontleend worden. Hetzelfde is van toepassing op gestructureerde en ongestructureerde data. Op het moment dat deze twee vormen van data samengebracht worden, kan een onderzoek effectiever en efficiënter uitgevoerd worden. Hierbij moet een systeem automatisch met verschillende vormen van data om kunnen gaan. Dit systeem dient een bepaald gegeven in beide vormen van data te kunnen doorzoeken en de bijbehorende componenten te retourneren. Denk hierbij aan een Bloomberg chat (ongestructureerd) tussen handelaars die bepaalde trades bespreken. Door het koppelen van de beschikbare informatie uit de trade database (zoals de handelaar en de desbetreffende trade) aan de Bloomberg chat zelf, kan men inzicht verkrijgen in de activiteiten van de handelaars. Dit gebeurt dan in één omgeving. Dit biedt de gebruikers van een zo’n systeem veel gemak omdat ze niet hoeven te wisselen tussen de Bloemberg chat en de database waar deze informatie in verwerkt is. Daarnaast kan met een zo’n systeem efficiënter en effectiever gewerkt worden.

Deze zevende editie van het E-Discovery symposium had een leerzaam en interessant programma waarbij er ook genoeg ruimte was voor de deelnemers om elkaar te spreken, hun zakelijk netwerk te onderhouden en uit te breiden. Kortom een geslaagd symposium.