Inhoud

Inleiding

Aselecte getallen

De verdeling van het steekproefgemiddelde

Betrouwbaarheidsintervalllen

Aselecte getallen

De demonstratie laat zien wat er gebeurt als je aselecte getallen loot uit de cijfers 0 t/m 9. Na klikken op het groene vierkantje bij Start wordt een groot aantal keren geloot. In een staafdiagram wordt bijgehouden hoe vaak elk cijfer is geloot.

Bij een 'eerlijke' aselector zal elk cijfer ongeveer even vaak voorkomen. Dat frequenties zullen echter nooit exact gelijk zijn. Als aan het einde van een experiment het gevoel bestaat dat een bepaald cijfer te weinig is geloot, dan kan deze hypothese worden getoetst door het experiment te herhaling. Het verschijnsel zal zich dan niet meer voordoen.

De verdeling van het steekproefgemiddelde

In de demonstratie hieronder kan worden onderzocht wat de invloed van de steekomvang is op de nauwkeurigheid van de de schatter.

In een bepaalde streek van Samplonië staan 169 boerderijen. Met een aselecte steekproef zonder teruglegging wordt de gemiddelde mestproductie per boerderij geschat. Om de eigenschappen van de schatter (het steekproefgemiddelde) te kunnen beoordelen, wordt het trekken van de steekproef een groot aantal malen herhaald. Er wordt zo een hele reeks schattingen verkregen en daarvan wordt een histogram gemaakt. Tevens wordt op basis van de uitkomsten van deze reeks steekproeven twee schattingen gemaakt:

Een schatting van de verwachting van de schatter. Hieruit kan worden afgeleid of de schatter zuiver is. Merk dat de werkelijke gemiddelde mestproductie van alle boerderijen gelijk is aan 1249.
Een schatting van de standaardfout van de schatter. Hieruit kan worden bepaald of de schatting nauwkeurig is.

Om een reeks simulaties uit te voeren, moet eerst de omvang van de steekproef worden ingesteld. Dat kan door klikken op het groene vierkantje onder Steekproef. Na elke keer klikken verschijnt een andere waarde. Er kan worden gekozen uit een omvang van 10, 20, 40 of 80. Door klikken op Start wordt de simulatie gestart.

Het histogram zal meestal lijken op een ééntoppige berg. De verdeling is symmetrisch en het midden ligt bij het te schatten populatiegemiddelde. Daaruit blijkt dat de schatter zuiver is.

Bij kleine steekproeven is de berg veel breder dan bij grote steekproeven. Daaruit kan worden afgeleid dat de schatter voor grote steekproeven nauwkeuriger is. Dan kan ook worden afglezen uit de waarde van de standaardfout: een vier maal zo grote steekproef leidt tot een tweemaal zo kleine standaardfout.

Betrouwbaarheidsintervallen

In de demonstratie hieronder kan worden onderzocht wat de invloed van de steekomvang is op de breedte en betrouwbaarheid van een 95%-betrouwbaarheidsinterval.

In een bepaalde streek van Samplonië staan 169 boerderijen. Met een aselecte steekproef zonder teruglegging wordt de gemiddelde mestproductie per boerderij geschat. Om de eigenschappen van de schatter (het steekproefgemiddelde) te kunnen beoordelen, wordt het trekken van de steekproef een groot aantal malen herhaald. Er wordt zo een hele reeks schattingen verkregen. Voor elke schatting wordt het 95%-betrouwbaarheidsinterval berekend. In de grafiek wordt dit interval weergegeven als een horizontaal groen lijnstuk.

Op basis van de uitkomsten van deze simulatie kunnen twee aspecten van betrouwbaarheidsintervallen worden onderzocht:

De breedte van de intervallen. Naarmate de steekproefomvang groter is, zal de breedte van het interval kleiner zijn. Er kan dus nauwkeuriger worden geschat.
De betrouwbaarheid. Er worden 95%-betrouwbaarheidsintervallen berekend. Dat houdt in dit gemiddeld in 95% van de gevallen het betrouwbaarheidsinterval het te schatten populatiegemiddelde (1249) zal moeten bevatten.

De simulatie blijft doorlopen tot op de rode knop naast Stop wordt geklikt. Rechtsboven wordt het percentage intervalen bijgehouden dat het te schatten populatiegemiddelde bevat.

Uit de experimenten kan worden geconcludeerd dat in principe de betrouwbaarheid niet afhangt van de omvang van de steekproef, maar de nauwkeurigheid wel.

Merk op dat voor kleine steekproeven dat betrouwbaarheid iets lager is dan 95%. Dat heeft te maken met het feit dat voor zo'n kleine steekproef het steekproefgemiddelde nog niet helemaal een Normale verdeling heeft.