Stuxnet in LexisNexis
In deze analyse bekijk ik de aandacht voor het stuxnet incident, echter deze keer binnen de database van LexisNexis . Dit onderzoek doe ik binnen dezelfde onderzoeksperiode als mijn Metareporter onderzoek, te weten van 21 september tot en met 11 december. Ook maak ik gebruik van dezelfde relevante zoektermen (of een combinatie van), die ik gevonden had in mijn eerdere analyse. Als eerste zocht ik binnen LexisNexis op de term stuxnet, wat in totaal 135 artikelen opleverde. Hiervan waren er in totaal 15 die van (landelijke) tijdschriften en het persbureau ANP vandaan kwamen en dus in totaal 120 artikelen gevonden in werkelijke kranten. Dit is belangrijk omdat tijdschriften (zoals de Elsevier) niet aan dezelfde journalistieke normen hoeven te voldoen en zo ook niet met dezelfde maten moeten worden beoordeeld. Daarnaast zocht ik op de term stuxnet in combinatie met de overige tags die tijdens mijn onderzoek binnen Metareporter het meest voorkwamen, te weten: Iran, virus, worm, cyberwar, kerncentrale en Siemens (zie de resultaten in het figuur hieronder).

Net als bij de Metareporter database was het belangrijk om artikelen die dubbel voorkwamen te filteren, om zo het aantal ‘unieke’ (dus: eenmalig gepubliceerde) artikelen te vinden. Dit probleem was voor de LexisNexis database groter dan bij Metareporter, dit kwam door het feit dat verschillende regionale kranten exact hetzelfde artikel publiceerde (waardoor de tags in deze artikelen onevenredig vaak voorkwamen) en ook een online versie van het artikel publiceerde op de Stentor website. Door handmatig een lijst te vormen van artikelen en de artikelen die dubbel voorkwamen er uit te filteren, vond ik uiteindelijk het aantal unieke artikelen. Door ditzelfde ook te doen voor elke zoekopdracht waar stuxnet gecombineerd werd met een andere tag, zouden de onderzoeksparameters grofweg overeen moeten komen met mijn eerdere onderzoek, en door deze met elkaar te vergelijken zijn enkele opvallende zaken naar voren gekomen.
Ten eerste valt de hoeveelheid unieke artikelen ten opzichte van het totaal aantal artikelen op. Blijkbaar heeft het stuxnet incident vrij veel regionale aandacht gekregen door de provinciale kranten, aangezien het aantal unieke artikelen (78) slechts 65% van het totale, oorspronkelijke, aantal (120) is. Er is dus 42 keer sprake geweest van een dubbele publicatie door regionale kranten. Ruim een derde van de totale hoeveelheid artikelen wordt dus in regionale kranten in exact dezelfde vorm gepubliceerd, wat de grote reikwijdte van deze artikelen aanduidt. Daarnaast valt op dat de tags in de totale hoeveelheid en in de unieke hoeveelheid artikelen ongeveer dezelfde verhouding tot elkaar hebben: een afname van tussen de 33% en 37%. Met als enige uitzondering de combinatie stuxnet en virus, dat van 86 artikelen naar 52 artikelen ging, een (iets grotere) daling van 40%.

Deze bevindingen zijn ook te vinden in de bovenstaande grafiek, waar de verdeling van artikelen over de kranten te zien is (voor zowel de totale hoeveelheid artikelen als de unieke hoeveelheid artikelen). Hier is eens te meer duidelijk te zien dat de regionale kranten zowel bij de verdeling van alle artikelen als bij de verdeling van unieke artikelen een zeer groot deel van de verslaggeving voor haar rekening nemen.
Hieronder staat de figuur waarin de verdeling te zien is van alle artikelen die verschenen zijn in de nationale kranten. Deze figuur is goed te vergelijken met de grafiek uit mijn analyse naar de database van Metareporter, omdat de bevindingen erg overeenkomen. Hoewel er weinig verschil lijkt te zitten in de verdeling van artikelen over kranten, is er een subtiel verschil op te merken: de twee kranten die het meeste artikelen publiceerden (het NRC Handelsblad en het Reformatorisch Dagblad), hebben beiden een deel moeten inleveren van het totaal (het NRC van 38% naar 29%, een daling van 24%, het Reformatorisch Dagblad van 22% naar 18%, een daling van 18%). Deze aandacht is vervolgens gelijk verspreid bij de overige kranten bijgekomen. Toch behouden deze twee kranten hun dominante positie, en nemen het NRC Handelsblad samengenomen met het NRC.NEXT nog steeds rond de 40% van de hoeveelheid gepubliceerde artikelen in totaal in beslag.

Het subtiele verschil tussen de Metareporter database en de LexisNexis database laat de waarde zien van een database analyse: hoewel dezelfde kranten het meeste aandacht aan een onderwerp besteden, is de verdeling binnen de LexisNexis database net wat genuanceerder. Dit verschil komt met name doordat er over dezelfde periode, in dezelfde kranten, 13 artikelen meer gevonden zijn in de LexisNexis database ten opzichte van de Metareporter database. Dit verschil kan een aantal oorzaken hebben die zich vooral aan de kant van de Metareporter database te vinden zijn: onoplettende studenten die artikelen over het hoofd zien waardoor de database onvolledig wordt, studenten die onjuist of onvolledig taggen waardoor sommige artikelen niet gevonden kunnen worden, of (in mijn ogen de meest relevante oorzaak) artikelen worden niet geheel geplaatst in de context waarin ze bezien moeten worden. Dit laatste is een gevolg van de manier waarop de meeste studenten taggen: door er van uit te gaan dat de essentie van een artikel in haar titel, inleiding of conclusie te vinden is, worden artikelen niet in hun gehele context geplaatst en zullen indexatie robots in dit opzicht beter werk verrichten.


Leave a Reply