Big Data: More Disadvantages Than Advantages? (dutch)
Autor: Jannisthomas • December 5, 2017 • 1,999 Words (8 Pages) • 856 Views
...
namelijk niet neutraal. Zo is er van veel datasets, zoals bijvoorbeeld Twitter, maar een deel van de data zichtbaar. Twitter bepaald namelijk zelf welke data zij wel en welke niet openbaar willen maken. Ook kan Twitter er voor kiezen om tweets over een bepaald onderwerp te verwijderen, waardoor onderzoek naar dat onderwerp op basis van datasets verkregen via Twitter niet meer gebeurt aan de hand van een representatieve steekproef. Onderzoek met gebruik van big data geeft dus niet zo zeer informatie over de maatschappij, maar laat alleen patronen zien.
Een ander nadeel aan onderzoek met gebruik van big data is volgens boyd en Crawford (2012) dat door de enorme hoeveelheid data er patronen zichtbaar kunnen worden die eigenlijk niet bestaan. Dit omdat enorme hoeveelheden aan data de illusie kan creëren dat er allerlei connecties tussen de data bestaan.
Verder is een social media site zoals Twitter geen representatie van ‘alle mensen’. Gebruikers van Twitter zijn een specifieke groep. Ook bestaat het probleem dat
Twitteraccounts en gebruikers niet hetzelfde zijn. Sommige accounts zijn geen mensen, maar robots. Sommige gebruikers hebben meerdere accounts of een account wordt gebruikt door meerdere personen. Ook zijn er mensen die wel heel actief zijn op Twitter maar bijna nooit daadwerkelijke een tweet plaatsen (boyd & Crawford, 2012). Een andere beperking is dat mensen hun posts, tweets, foto’s en reacties vaak geen perfecte representatie van zichzelf zijn. Mensen denken goed na over wat zij op internet plaatsen en stellen dit zorgvuldig samen. Het zelf kan op het internet worden geconstrueerd zoals je dat zelf wil. Het is dan ook gemakkelijk om je anders voor te doen op internet (Manovich, 2011). Wanneer onderzoek gedaan wordt aan de hand van Twitterdata moet er dus rekening gehouden worden met al deze beperkingen. Wanneer dit niet gebeurt zal het resultaat dus geen goede representatie van de werkelijkheid zijn.
Bollier (2010) is echter van mening dat het vinden van bepaalde correlaties, in plaats van een causaal verband, al een groot voordeel is van big data. Volgens hem zijn er veel situaties waar enkel het vinden van correlaties met behulp van big data al nuttig kan zijn. Zo kan een bedrijf aan de hand van communicaties via mobiele telefoons en het taxi verkeer hun klanten adviseren welke uitgaansgelegenheden op dat moment populair zijn.
Ook ontstaat er door big data een nieuwe tweedeling in de maatschappij, namelijk zij die wel toegang hebben tot de data en zij die dat niet hebben. Ook heeft niet iedereen genoeg relevante kennis om informatie uit de data te kunnen halen. Over het algemeen zijn degene die deze vaardigheden bezitten mannen en kunnen vooral zij onderzoek aan de hand van big data uitvoeren. Het onderzoek wat gedaan wordt met gebruik van big data wordt dus bepaald door degene die de nodige vaardigheden hebben om de data te begrijpen en zij bepalen dus ook welke vragen onderzocht zullen worden. Vaak hebben alleen onderzoekers die voor het bedrijf zelf werken toegang tot alle data uit de datasets. Andere bedrijven verkopen hun data, wat er dus toe leidt dat alleen degene die dit kunnen betalen toegang tot deze data hebben. Dit leidt dus tot een tweedeling. Alleen de onderzoekers binnen bedrijven of degene met genoeg geld kunnen ander onderzoek uitvoeren dan degene voor wie dit niet geldt. Onderzoek dat uitgevoerd wordt door wetenschappers binnen het bedrijf kan dus ook niet gecontroleerd worden door wetenschappers buiten het bedrijf, omdat zij geen toegang tot de data hebben (boyd & Crawford, 2012).
Manovich (2011) vraagt zich ook af of big data er daadwerkelijk voor zorgt dat er niet meer gekozen hoeft te worden tussen de diepte en de grootte van de data. Hij is van mening dat onderzoek met diepe data of met een grote database allebei hun eigen kwaliteiten hebben. Het soort onderzoek bepaald daarom welke vragen er gesteld kunnen worden.
Doordat er verschillende vragen gesteld worden, kunnen er verschillende patronen ontstaan en dit kan leiden tot verschillende inzichten en resultaten. Volgens hem is onderzoek met gebruik van big data dus niet vanzelfsprekend beter dan onderzoek aan de hand van bijvoorbeeld diepte interviews.
Big data kan dus veel betekenen voor verschillende sectoren, zoals de gezondheidszorg, de economie en de wetenschap, maar wanneer er geen rekening gehouden wordt met de vele beperkingen die ontstaan door het gebruik van big data zullen er ethische kwesties ontstaan of zullen de resultaten uit onderzoeken geen goede weerspiegeling van de werkelijkheid zijn. Het is dus belangrijk om rekening te houden met zowel de voordelen als de nadelen van big data. Ook moet voorkomen worden dat mensen big data op een verkeerde manier gebruiken of zelfs misbruiken. Wanneer men dus enkel let op de voordelen van big data en geen rekening houdt met de beperkingen, kan betwijfeld worden hoeveel big data ons daadwerkelijk oplevert.
Literatuurlijst
Boillier, D. (2010). The promise and peril of big data. Washington: The Aspen Institute.
Boyd, D., Crowford, K. (2012). Critical questions for big data. Information, Communication and Society, 15(5), 662-679.
Lohr, S. (2012, 11 februari). The age of big data. Geraadpleegd op http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the-world.html?_r=0
Manovich, L. (2011). Trending: the promises and the challenges of big social data. Minneapolis: The University of Minnesota Press.
Mayer-Schönenberger, V., Cukier, K. (2013). Big data, a revolution that will transform how we live, work and think. New York: Houghton Mifflin Harcourt Publising Company.
Michael, K., Miller, K.W. (2013). Big data: new opportunities and new challenges. Computer, 46(6), 22-24.
Pariser, E. (2011). The filter bubble: what the internet is hiding from you. Londen: Pengruin Group.
...