What Are the Monetary and Non-Monetary Returns on Education?
Autor: Sharon • December 18, 2017 • 4,975 Words (20 Pages) • 715 Views
...
De natuurlijke verwachting is dat wanneer het opleidingsniveau stijgt, zowel het gemiddelde inkomen als de levensverwachting zal stijgen. In de tabel hieronder is te zien wat het gemiddelde netto inkomen (in €) was in 1993 per opleidingsniveau, en eveneens het percentage overledenen per opleidingsniveau.
[pic 2]
Te zien is dat er gemiddeld inderdaad een duidelijk positief verband is tussen opleidingsniveau en inkomen. Van een persoon die enkel basisonderwijs gevolgd heeft is het gemiddelde netto inkomen ongeveer de helft van het gemiddelde netto inkomen van een persoon met hoger onderwijs. Ook is af te lezen dat het percentage overledenen onder personen met alleen basisonderwijs ongeveer twee keer hoger is dan onder personen met hoger onderwijs.
-
Data Time Series
Time Series worden gebruikt om te ontdekken in hoeverre het percentage 18-25 jarige mannen dat deelnam aan hoger onderwijs veranderde in de periode 1950 tot 2012. Om dubbel werk te voorkomen is alleen gekeken naar mannen, waar de analyse voor vrouwen moeilijker te maken is.
In grafiek 1 zijn de gevonden resultaten te zien. Een duidelijke stijgende lijn is zichtbaar, wat impliceert dat in de periode 1950-2012 een steeds hoger percentage van de 18-25 jarigen het hoger onderwijs geniet. Ook de levensverwachting voor de personen die onderzocht werden is in de betreffende tijd gestegen met bijna 10 jaar, te zien grafiek 2. De levensverwachting steeg tot maar liefst 79 jaar in 2012. Wat opvalt is dat er geen gegevens zijn van de levensverwachting in onder andere de jaren ‘72 en ’73.
[pic 3]
Bij het gebruik van een time series analyse kunnen non-stationaire variabelen problemen zoals random walks veroorzaken. Deze geven onbetrouwbare en willekeurige (spurious) verbanden. Daarom is het in het geval van ‘time series’ van belang te weten of de variabele stationair of non-stationair is.
Om te bepalen of de variabelen opleidingsniveau en levensverwachting stationair zijn is een Dickey-Fuller niveau 3 test gebruikt, welke rekening houdt met zowel een trend als een intercept. Er is namelijk in beide grafieken een duidelijke trend en intercept zichtbaar. Volgens deze test hebben beide variabelen een unit root. Dit impliceert dat de variabelen opleidingsniveau en levensverwachting non-stationair zijn (zie Appendix, tabel 4 en tabel 5). Een correctie van non-stationaire variabelen kan op twee manieren: detrending en first-differences. Detrending zorgt dat de trend wordt geabsorbeerd door een extra toegevoegde variabele. First-differences corrigeert de trend door te kijken naar twee opeenvolgende momenten. De exacte waarden van de correcties zijn te vinden in de Appendix onder Tabel 6 en Tabel 7.
-
Methodologie
In het cross-section gedeelte is gebruik gemaakt van lineaire regressies, logistische regressies en een probit model. In elk van de drie modellen is eerst getest op een van de verbanden educatie-inkomen, educatie-levensverwachting en levensverwachting-educatie, zonder toegevoegde variabelen.
In de lineaire regressie is inkomen de afhankelijke variabele, met educatie als onafhankelijke variabele. In de logistische (log-linear) regressie is netto inkomen de afhankelijke variabele en het opleidingsniveau de onafhankelijke variabele. In dit deel wordt ook een log-linear model berekend. Hier worden de zelfde variabelen gebruikt, maar met logaritmische netto inkomen als afhankelijke variabelen. Hiernaast is in het cross-section gedeelte een probit model berekend. De variabele overleden, ook wel levensverwachting, is de afhankelijke variabele en het opleidingsniveau de gezochte variabele. Vervolgens zijn aan alle drie de modellen de variabelen geboortejaar, sociaal-economische status, intelligentie en geslacht als controle variabelen toegevoegd. Hiermee wordt een eventueel (belangrijke) afwijking (bias) weggenomen.
In het time series gedeelte is gebruikt gemaakt van autoregressieve (AR) modellen. In dit model is opleidingsniveau de afhankelijke variabele en de onafhankelijke variabelen zijn levensverwachting en de lags van levensverwachting. Dit model is vervolgens verder uitgebreid met de derde lag van opleidingsniveau. Door een lag van de afhankelijke variabele mee te nemen, veranderd het model in een Autoregressive Distributed Lag model (ARDL).
In dit onderzoek is standaard een 5% significantieniveau gehanteerd. Het significantieniveau is het criterium voor het verwerpen van de nulhypothese. Een 5% significantieniveau impliceert dat er een kans van 5% is dat de nul hypothese incorrect wordt verworpen. De waarschijnlijkheid dat een nul hypothese wordt verworpen terwijl de nul hypothese wél waar is noemt men een "type 1 error".
Onderzoekers hebben een vrije keuze wat betreft significantieniveau, vaak aangegeven met de Griekse letter alpha. Echter, het kiezen van een kleinere alpha betekent dat je een kleinere foutmarge bereid bent te accepteren en dat het bewijs sterker is.
Resultaten
A. Cross-section
In de cross-section analyse is allereerst een lineaire regressie opgesteld van opleidingsniveau op inkomen (zie Appendix, Tabel 8). Opleidingsniveau volgt een bepaalde rangschikking in niveau, vandaar dat hier sprake is van een ordinale variabele. Het makkelijkst is om opleidingsniveau een dummyvariabele te maken, met basisonderwijs (primary education) als referentie. Om te testen of iemand met hoger onderwijs (higher education) meer verdient, is deze vergeleken met iemand met enkel basisonderwijs. Personen met hoger onderwijs verdienen ongeveer €27000 meer dan personen met basisonderwijs. Door een Wald-test te gebruiken is aangetoond dat opleidingsniveau als dummy variabele, statistisch gezien significant is (zie Appendix, Tabel 9). Om duidelijk te maken welke spreiding basisonderwijs en hoger onderwijs hebben is een betrouwbaarheidsinterval (‘confidence interval’) opgesteld, met een significantieniveau van 5% (zie Appendix, tabel 10). Dit wil zeggen dat 95% van de observaties in de dataset vallen binnen deze observaties. Basisonderwijs (27285, 30435) heeft een kleinere spreiding dan hoger onderwijs (32349, 87079), wat impliceert dat inkomens van personen met hoger onderwijs meer uiteenlopen.
Voor bovenstaand model, een lineair regressiemodel, is het van belang dat voldaan wordt aan de drie aannamen van dit model. Allereerst moet een variabele strikt exogeen zijn, wat wil zeggen dat er (over de gehele regressie) geen correlatie is van de variabele(n)
...