Inleiding
Het uitvoeren van een simulatie
De menu's van het programma
Populatiebestanden
Downloaden van het programma

SimSam is een programma waarmee je het trekken van steekproeven uit eindige populaties kunt naspelen. Daarbij gaat het programma ervan uit dat je op basis van de gegevens in de steekproef het gemiddelde in de populatie van een variabele wilt schatten.

Het idee is om het trekken van een steekproef een groot aantal keren te herhalen. Voor elke getrokken steekproef kun je een schatting voor het gemiddelde in een populatie laten uitrekenen. Al die schattingen bij elkaar geven dan een goed beeld van de nauwkeurigheid van de schattingsprocedure.

De verdeling van de mogelijke uitkomsten van de schatter wordt weergegeven in de vorm van een histogram. Als je dit histogram nader bekijkt, krijg je een goed idee hoe dicht de schattingen in de buurt liggen van het werkelijke gemiddelde in de populatie.

SimSam kan twee soorten steekproeven trekken:

  • Steekproeven zonder teruglegging en met gelijke kansen;
  • Steekproeven met teruglegging en met ongelijke kansen. De kansen zijn evenredig aan de waarden van een hulpvariabele.

SimSam kan vier verschillende schatters berekenen:

  • Het eenvoudige steekproefgemiddelde;
  • De quotiëntschatter;
  • De regressieschatter;
  • De post-stratificatie-schatter.

Het is mogelijk om non-respons te genereren in de steekproeven. Daardoor kun je zien wat het effect is van non-respons op de toegepaste schatters.

Het resultaat van de simulatie wordt op het scherm gepresenteerd in de vorm van een histogram van de verdeling van de mogelijke uitkomsten van de schatter. Dit histogram kan worden opgeslagen als een plaatje in een bitmap-bestand. Zo kan het voor andere doeleinden worden gebruikt.

Het is ook mogelijk een numeriek overzicht te maken van de resultaten van de simulatie. Daarin zijn opgenomen het theoretisch en het het gesimuleerde gemiddelde van de schattingen, en ook de theoretische en gesimuleerde standaardfout van de schatter.


Om een simulatie met SimSam uit te voeren, moet je een aantal stappen doorlopen:
Stap 1: Lees een populatiebestand in. Doe dat met de optie Lees populatie in het menu Populatie.
Stap 2: Kies een steekproefontwerp. Doe dat met de diverse opties in het menu Steekproef.
Stap 3: Geef in het menu Non-respons aan of het programma non-respons moet genereren. Geef desgewenst ook in dit menu aan hoe die non-respons dan moet worden gegenereerd.
Stap 4: Stel de parameters voor de simulatie in. Doe dat met de optie Instellingen in het menu Simulatie.
Stap 5: Start de simulatie. Doe dat met de optie Begin in het menu Simulatie.

Populatie-menu

Het Populatie-menu kent de volgende opties:

Lees populatie

Lees hiermee een nieuw populatiebestand in. Selecteer de gewenste populatie uit de lijst met aanwezige populatiebestanden. Populatiebestanden hebben de extensie pop.

Toon variabele

Bekijk hiermee de verdeling van een variabele in de populatie bekijken. Nadat een variabele is geselecteerd in de lijst, wordt een histogram van de waarden van deze variabele getoond.

Steekproef-menu

Geef hiermee aan hoe het steekproefontwerp eruit moet zien. Het menu kent de volgende opties:

Doelvariabele

Selecteer hiermee de doelvariabele waarvoor het gemiddelde in de populatier moet worden geschat.

Steekproefontwerp

Stel hiermee het steekproefontwerp in. Geef aan hoe groot de omvang van de steekproef moet zijn. Kies ook of de steekproef met gelijke of ongelijke kansen moet worden getrokken.

Als de steekproef met ongelijke kansen moet worden getrokken, selecteer dan een hulpvariabele. De kansen zullen dan evenredig zijn aan de waarde van deze hulpvariabele.

Let op: Alleen die hulpvariabelen kunnen worden gebruikt waarvan alle waarden positief zijn. Verder kan bij het trekken met ongelijke kansen alleen het steekproefgemiddelde worden gebruikt als schatter.

Schatter

Selecteer hiermee de te gebruiken schatter. Kies uit vier verschillende schatters: de directe schatter (het steekproefgemiddelde), de quotiëntschatter, de regressieschatter en de post-stratificatie-schatter.

Als de quotiëntschatter, regressieschatter of de post-stratificatie-schatter is gekozen, selecteer dan ook nog een hulpvariabele.

De quotiëntschatter, regressieschatter en post-stratificatie-schatter zijn alleen te gebruiken als de steekproef met gelijke kansen wordt getrokken.

Let op: bij de post-stratificatie-schatter mag de hulpvariable maar ten hoogste 10 verschillende waarden aannemen, en deze waarden moeten volgnummers zijn die beginnen bij 1. Deze volgnummers duiden de strata aan.


Non-respons-menu

Geef hiermee aan of het programma non-respons moet genereren in de steekproeven. Gberuik dit menu ook om het genereren van non-respons weer uit te zetten. Het menu kent de volgende opties:

Genereer non-respons

Selecteer voor het genereren van non-respons eerst een non-respons-variabele. De kans op non-respons wordt afhankelijke gemaakt van de waarden van deze variabele

Geef vervolgens aan welke non-respons-kans hoort bij de kleinste waarde van deze variabele, en welke non-respons-kans hoort bij de grootste waarde van deze variabele. Voor alle tussenliggende waarden berekent het programma het non-respons-kans met behulp van interpolatie. De kansen moeten worden ingevoerd in de vorm van percentages. Het percentage moet minimaal gelijk zijn aan 1. Het mag niet hoger zijn dan 99.

Volledige respons

Zet hiermee het genereren van non-respons weer uit.

Simulatie-menu

Stel met de opties in het dit menu stel het simulatieproces in. Hier kan de simulatie ook daadwerkelijk worden gestart. Het menu kent de volgende opties:

Instellingen

Hiermee stel je de parameters voor het simulatie proces in:

  • Geef met de eerste parameter (Type uitvoer) geef aan wat er precies op het scherm moet komen. Kies uit een histogram van de verdeling van de schatter of 95%-betrouwbaarheidsintervallen.

  • Stel met de tweede parameter (Simulaties) het aantal simulaties in. Dit is het aantel steekproeven dat moet worden getrokken. Dit aantal staat in eerste instantie op 100, maar elke waarde tussen 2 en 1000 kan worden ingevuld.

  • Stel met de derde parameter (Schaling) de schaal in van de x-as van de grafiek in. Vul een beginwaarde en een eindwaarde in. Het is ook mogelijk een steekproefomvang in te vullen en dan op de knop Stel in te drukken. De beginwaarde van de x-as wordt dan gelijk genomen aan de kleinste waarde die de schatter bij deze steekproef kan aannemen. Voor het eindpunt van de x-as wordt de grootste waarde genomen die de schatter kan aannemen.

  • Geef met de vierde parameter (Compressie) aan hoe sterk het histogram in vertikale zin in elkaar gedrukt moet worden. Kies uit de waarden 1 t/m 4. De waarde 1 betekent geen compressie. De waarde 4 betekent dat het histogram met een factor 4 in elkaar wordt gedrukt. Alle waarden worden dan door 4 gedeeld.

Begin

Als een doelvariabele, steekproefontwerp en schatter zijn gekozen, en de parameters van het simulatieproces zijn ingesteld, wordt met deze optie de simulatie gestart. Er verschijnt een nieuw venster op het scherm.

De verticale rode lijn in de grafiek geeft het populatiegemiddelde van de doelvariabele aan. Dit is de waarde die met de steekproeven moet worden geschat.

Onder de grafiek staan de volgende knoppen:

  • Volgende. Druk op deze knop om het programma de volgende steekproef te laten trekken. Daarna wordt de schatting berekent. Deze wordt in de grafiek weergegeven als een klein groen blokje. Met deze knop wordt het simulatieproces dus stap voor stap uitgevoerd.

  • Automatisch. Na klikkeb op deze knop verloopt het simulatieproces verder automatisch. Alle steekproeven worden achter elkaar, zonder tussenkomst, getrokken. Het is niet meer mogelijk dit proces te onderbreken. Het loopt door tot alle steekproeven zijn verwerkt.

  • Statistiek. Na klikken op deze knop verschijnt een numeriek overzicht met de resulaten van de simulatie.

  • Bewaar. Na klikken op deze knop slaat het programma de grafiek op in de vorm van een bitmap-bestand (met extensie bmp).

Help-menu

Het Help-menu kent de volgende opties:

SimSam help

Deze optie geefttoegang tot het help-systeem van SimSam.

Over dit programma

Deze optie geeft enige informatie over het programma (versienummer) en de maker.

Bij het programma SimSam zitten een aantal populatiebestanden. Deze bestanden bevatten gegevens over het land Samplonië:

  • Samplon.pop bevat de volledige bevolking van Samplonië. Het bestand bevat 1000 records met de waarden van 6 variabelen. De variabelen zijn gemeente (er zijn 6 gemeenten), provincie (er zijn 2 provincies), geslacht (1=man, 2=vrouw), leeftijd (een waarde tussen 0 and 100), werk (1=heeft werk, 2=heeft geen werk) en netto maandinkomen (een waarde tussen 0 en 5000).

  • SamWerk.pop bevat de werkende bevolking van Samplonië. Dit is een deelbestand van het bestand Samplon.pop. Het bevat 341 records met gegevens van dezelfde 6 variabelen. Merk op dat in dit bestand de variabele werk altijd de waarde 1 (heeft werk) heeft.

  • SamMest.pop bevat de jaarlijkse mestproductie door koeien op de 169 veehouderijbedrijven in Samplonië. Er zijn drie variabelen: mestproductie, oppervlakte grasland van de boerderij en aantal koeien op de boerderij.

Het is ook mogelijk zelf een populatiebestand maken. Het maximale aantal records is 1000. Het aantal variabelen mag niet groter zijn dan 10. Alle waarden moeten gehele getallen zijn. Om de structuur van het bestand te kunnen beschrijven, staat hieronder, als voorbeeld, het eerste deel van het bestand Samplon.pop:

De bevolking van Samplonië
1000 6
Gemeente
Provincie
Geslacht
Leeftijd
Werkzaam
Inkomen
5 2 1 65 2 0
6 2 1 36 2 0
7 2 2 73 2 0
6 2 1 6 2 0
3 1 2 33 1 158
. . .

De eerste regel bevat een korte omschrijving van het bestand

De tweede regelbevat het aantal records gevolgd door het aantal variabelen. De twee getallen moeten van elkaar worden gescheiden door een of meer spaties.

De volgende regels bevatten de namen van de variabelen. De naam van elke variabele moet beginnen op een nieuwe regel.

Daarna volgende de echte gegevens. Elk record moet beginnen op een nieuwe regel. Elke regel bevat de waarden van de variabelen in de juiste volgorde. De getallen moeten van elkaar worden gescheiden door een of meer spaties.


SimSam is een freeware-programma. Downlaod het programma en een aantal populatiebestanden door hieronder te klikken:

Download SimSam

In het zip-bestand SimSam.zip zitten de volgende bestanden:

  • Het programmabestand simsam3.exe.
  • Het helpbestand simsam.chm
  • Drie populatiebestanden: Samplon.pop, SamWerk.pop en SamMest.pop.

Na uitpakken van de bestanden kan het programma worden gestart door dubbelklikken op simsam3.exe