Steekproeven

Een ander manier om naar de nauwkeurigheid van een schatter te onderzoeken is het trekken van steekproeven te simuleren. In een bepaalde streek van Samplonië staan 169 boerderijen. Met een aselecte steekproef zonder teruglegging wordt de gemiddelde mestproductie per boerderij geschat. Om de eigenschappen van de schatter (het steekproefgemiddelde) te kunnen beoordelen, wordt het trekken van de steekproef een groot aantal malen herhaald. Er wordt zo een hele reeks schattingen verkregen en daarvan wordt een histogram gemaakt. Tevens wordt op basis van de uitkomsten van deze reeks steekproeven twee schattingen gemaakt:

Een schatting van de verwachting van de schatter. Hieruit kan worden afgeleid of de schatter zuiver is. Merk dat de werkelijke gemiddelde mestproductie van alle boerderijen gelijk is aan 1249.
Een schatting van de standaardfout van de schatter. Hieruit kan worden bepaald of de schatting nauwkeurig is.

Om een reeks simulaties uit te voeren, moet eerst de omvang van de steekproef worden ingesteld. Dat kan door klikken op het groene vierkantje onder Steekproef. Na elke keer klikken verschijnt een andere waarde. Er kan worden gekozen uit een omvang van 10, 20, 40 of 80. Door klikken op Start wordt de simulatie gestart.

Het histogram zal meestal lijken op een ééntoppige berg. De verdeling is symmetrisch en het midden ligt bij het te schatten populatiegemiddelde. Daaruit blijkt dat de schatter zuiver is.

Bij kleine steekproeven is de berg veel breder dan bij grote steekproeven. Daaruit kan worden afgeleid dat de schatter voor grote steekproeven nauwkeuriger is. Dan kan ook worden afglezen uit de waarde van de standaardfout: een vier maal zo grote steekproef leidt tot een tweemaal zo kleine standaardfout.

Betrouwbaarheidsintervallen

Met behulp van een simulatie kan ook worden geïllustreerd hoe betrouwbaarheidsintervallen werken. In een bepaalde streek van Samplonië staan 169 boerderijen. Met een aselecte steekproef zonder teruglegging wordt de gemiddelde mestproductie per boerderij geschat. Om de eigenschappen van de schatter (het steekproefgemiddelde) te kunnen beoordelen, wordt het trekken van de steekproef een groot aantal malen herhaald. Er wordt zo een hele reeks schattingen verkregen. Voor elke schatting wordt het 95%-betrouwbaarheidsinterval berekend. In de grafiek wordt dit interval weergegeven als een horizontaal groen lijnstuk.

Op basis van de uitkomsten van deze simulatie kunnen twee aspecten van betrouwbaarheidsintervallen worden onderzocht:

De breedte van de intervallen. Naarmate de steekproefomvang groter is, zal de breedte van het interval kleiner zijn. Er kan dus nauwkeuriger worden geschat.
De betrouwbaarheid. Er worden 95%-betrouwbaarheidsintervallen berekend. Dat houdt in dit gemiddeld in 95% van de gevallen het betrouwbaarheidsinterval het te schatten populatiegemiddelde (1249) zal moeten bevatten.

De simulatie blijft doorlopen tot op de rode knop naast Stop wordt geklikt. Rechtsboven wordt het percentage intervalen bijgehouden dat het te schatten populatiegemiddelde bevat.

Uit de experimenten kan worden geconcludeerd dat in principe de betrouwbaarheid niet afhangt van de omvang van de steekproef, maar de nauwkeurigheid wel.

Merk op dat voor kleine steekproeven dat betrouwbaarheid iets lager is dan 95%. Dat heeft te maken met het feit dat voor zo'n kleine steekproef het steekproefgemiddelde nog niet helemaal een Normale verdeling heeft.