Column

Big data, of weten hoe het zit


big dataHet zaaltje zit stampvol. Blijkbaar ben ik niet de enige op de Seed Meets Technology beurs die benieuwd is naar wat deze startup te melden heeft. De claims zijn dan ook niet mis. Op de website van het bedrijf wordt veelvuldig geschermd met termen als “disruptive” en “revolutionair”, en ook in dit zaaltje zijn de beloften niet van de lucht.

“Wij gebruiken artificial intelligence en deep learning om op basis van big data genetische eigenschappen te detecteren in zaden”, vertelt de CEO met in Engels met een sterk Israëlisch accent. “Onze algoritmen kunnen per zaadje specifieke eigenschappen zoals ziekteresistenties, vruchtkleur, en plantarchitectuur betrouwbaar voorspellen, op basis van niets anders dan hoge resolutie afbeeldingen van individuele zaden”.

Ik vind het maar moeilijk te geloven. Het doet mij denken aan de frenologie, de 19e eeuwse pseudowetenschap die beweerde dat het karakter van een persoon af te lezen was van de vorm van de schedel. In de presentatie zelf wordt weinig bewijs getoond die de grote claims rechtvaardigen. Wie meer wil weten, is welkom bij de stand.

Ik wil het bewijs wel eens zien en neem een kijkje bij de stand. Daar word ik te woord gestaan door de directeur science & innovation. Zij laat me cijfers laat zien van partijen zaad waarvan het algoritme – na een leerfase – nauwkeurig bepaalde eigenschappen kon voorspellen. “Dat is mooi, maar komt er ook nog een onafhankelijke publicatie in een wetenschappelijk tijdschrift?”, vraag ik. Tot mijn verrassing blijkt dat inderdaad het geval te zijn – het bedrijf werkt samen met een alom gerespecteerde plantenwetenschapper aan een wetenschappelijke publicatie. “Stuur me die publicatie zodra die uit is, ik wil hem graag lezen”, zeg ik, nog steeds niet overtuigd.

Twee weken later ben ik zelf onderwerp van een algoritme. In verband met een specifieke vraag die ik heb ben ik bezig een DISC-test in te vullen. DISC is een persoonlijkheidstest die uitgaat van vier verschillende basistemperamenten. In een online omgeving krijg ik 30 vragen voorgeschoteld. Aan de ‘achterkant’ wordt het systeem gevoed door big data van grote aantallen respondenten. De vragen, die duidelijk via machinevertaling uit het Engels tot stand zijn gekomen, zijn niet altijd even duidelijk – een enkele keer is de vraag zelfs betekenisloos. “Hoe kan hier nou iets zinnigs uitkomen?”, denk ik, terwijl ik terugdenk aan een artikel dat ik ooit gelezen heb en waarin DISC met de grond werd gelijkgemaakt.

Na het beantwoorden van de laatste vraag klik ik op ‘verzenden’. Op hetzelfde moment verschijnt in mijn mailbox een automatisch opgemaakt rapport waarin mijn persoonlijke stijl en karakter wordt beschreven. Enigszins gedesillusioneerd – hoe kan een automatisch gegeneerd rapport iets waardevols bevatten? – open ik het document. Tijdens het lezen ervan val ik bijna van m’n stoel van verbazing. Het rapport bevat een nauwkeurige omschrijving van hoe ik te werk ga, hoe ik denk, hoe ik mijzelf zie en mijn sterke en zwakke punten. In het rapport lees ik dat voor mij de ‘hoe’ vraag belangrijk is. In gedachten hoor mijn vorige manager, die mij ooit typeerde als “Clemens wil graag weten hoe het zit”. Ik ben gedwongen mijn mening bij te stellen en ontdek veel waardevolle inzichten in het rapport. Dit is kennelijk waar big data en slimme algoritmen toe in staat zijn.

In diezelfde week word ik gebeld door de Israëlische startup. Zij hebben een vraag waar ze ondersteuning bij nodig hebben. Ik besluit hen te helpen. Maar ik wil wel graag nog een keer weten hoe het zit.

Clemens Stolk