VMO (Voorbereidend Marktonderzoek)
Collegejaar 2009/2010, periode 1 en 2
Naar sleperspagina LINKS

Oefeningen grafieken en tabellen met SPSS

Aan de hand van de door jullie ingevulde vragenlijst moet een aantal opdrachten worden uitgevoerd. In enkele gevallen komt er dan een kant en klare grafiek of tabel uit.

In een aantal gevallen moet er een voorbewerking gedaan worden (TRANSFORM wordt gebruikt), of er moeten selecties gedaan worden (DATA wordt gebruikt).

Het volledige bestand van jullie onderzoek kun je hier downloaden. Dit bestand bevat alle gegeven antwoorden. Ook de (helaas kwam dat voor) onzinnige antwoorden.

TOP

Opdracht 1

Open het bestand VMS werkbestand.sav.

Maak frequentietabellen van de variabelen Quest2, Quest3 en Quest4 door middel van:

 

 

Kies hier als statistieken:

 

Resultaat voor Quest2:

 

 

 

Hoe oud ben je?

N

Valid

288

Missing

0

Mean

19,29

Median

19,00

Mode

18

Std. Deviation

1,989

Minimum

16

Maximum

35

Percentiles

5

17,00

25

18,00

50

19,00

75

20,00

95

22,00

 

 

Hoe oud ben je?

 

 

Frequency

Percent

Valid Percent

Cumulative Percent

Valid

16

1

,3

,3

,3

17

29

10,1

10,1

10,4

18

82

28,5

28,5

38,9

19

69

24,0

24,0

62,8

20

49

17,0

17,0

79,9

21

34

11,8

11,8

91,7

22

14

4,9

4,9

96,5

23

5

1,7

1,7

98,3

24

1

,3

,3

98,6

25

1

,3

,3

99,0

26

1

,3

,3

99,3

33

1

,3

,3

99,7

35

1

,3

,3

100,0

Total

288

100,0

100,0

 

 

Past dit bij je verwachtingen?

Leeftijd 16, 33 en 35 springen er een beetje uit. Bekijk in het databestand eens of de respondenten met deze antwoorden als serieus te beschouwen zijn. Doe dit door in het databestand (in dataview) de kolom met variabele Quest2 te selecteren en dan te zoeken met behulp van het verrekijkertje. Begin met de 35-jarige.

Bekijk de overige antwoorden die deze respondent gegeven heeft.

Hoe serieus zal deze respondent de vragenlijst hebben ingevuld? En wat met de 16-jarige en de 33-jarige? Wat zou je met deze respondenten moeten doen. Moet je ze laten meetellen, of moet je ze uit het bestand verwijderen?

Verwijder nu de cases met de drie respondenten uit het SPSS-bestand.
Sla het SPSS-bestand op onder een andere naam.  Vanaf nu wordt er met het aangepaste bestand gewerkt.

TOP

 

Opdracht 2

Maak een histogram voor leeftijd, via Graphs en Chart Builder en klik op OK

Klik op Histogram, kies de eerste optie (linker plaatje) en sleep deze in het lege veld rechtsboven. Sleep Quest16 naar het vak “X-Axis?”

Je ziet dan het volgende in beeld

Klik op OK en je ziet afhankelijk van de instellingen en vorige acties het volgende resultaat.

Dit is natuurlijk geen fraai histogram. Verder valt op dat er door respondent(en) gegevens zijn ingevuld die nogal sterk afwijken van de rest en nogal onwaarschijnlijk zijn. Verwijder de cases van deze respondent(en)

Volg nu weer bovenstaande stappen om een histogram te maken. Je krijgt dan een dergelijk beeld.

Dit is al beter. De klassebreedte kun je nog aanpassen door te dubbelklikken op de staven. Je krijgt dan een pop-up menu met de kop “properties”

Bij custom kun je de klassebreedte of het aantal klassen kiezen. Bij “Custom value for anchor” kun  je de startwaarde (anchor) kiezen.

Kies een klassenbreedte van 20 en een startwaarde van 0,

Als je op andere delen in de grafiek  dubbelklikt krijg je hiervoor ook een pop-up menu “properties’

Op deze manier kun je bijvoorbeeld de schaal, de titel, de bijschriften van de assen, enzovoort veranderen.

Probeer onderstaand figuur te krijgen:

Zorg dat de grafiek verder  aan de randvoorwaarden voldoet, die in hoofdstuk 1 van VMW zijn genoemd.

Experimenteer in SPSS met de diverse eigenschappen (properties) van de figuur.

Probeer de volgende figuur te krijgen:

Opmerking
Bij histogrammen kunnen de asbenoemingen en de titel niet aangepast worden. Dit is waarschijnlijk een bug die SPSS nog moet oplossen.

TOP

Opdracht 3

Maak een bevolkingspiramide van de variabele Gemiddelde besteding aan online aankopen per maand (QUEST 16), via GRAPHS en CHART BUILDER.

 

Resultaat:

 

Maak er ook één waarbij je splitst door Quest4.

Je krijgt dan in eerste instantie:

 

"De andere opleiding" verpest het plaatje enigszins. Eigenlijk wil je alleen splitsen voor Commerciële Economie en Communicatie. Dat zijn de opleidingen met codes (values) 1 en 2.

De oplossing is door in het DATA-menu te kiezen voor SELECT CASES.

Je moet dan een formule ingeven voor de gewenste selectie.

Klik op continue en daarna op OK

Ga weer naar Variable View (onderin klikken).

Klik bij Quest4 onder Values rechts op het vakje. Je krijgt dan onderstaande pop up.

Verwijder optie 3 met behulp van Remove en klik daarna op OK.

Als je nu weer de grafiek maakt, zoal hierboven beschreven, dan krijg je het volgende resultaat:

http://vmo.femplaza.nl/images/Image5.gif

Wat is je conclusie?

TOP

Opdracht 4

Maak een boxplot van Quest2 met als onafhankelijke variabele Quest4.

Dat doe je via GRAPHS en dan CHART BUILDER.

Kies Boxplot en het eerste plaatje. Sleep QUEST2 naar Y-as en QUEST4 naar de x-as.

Klik op OK.

Resultaat:

Leg uit wat de lijnen en punten betekenen. Wat is nu je conclusie? Past deze bij je conclusie bij opdracht 3?

Bereken ook eens enkele centrummaten en spreidingsmaten bij deze gegevens. Dat kan via

Maar omdat er een uitsplitsing is gemaakt naar opleiding is de procedure via means handiger:

Het venster op deze manier invullen levert:

Via Options kun je nog Median, Minimum en Maximum kiezen.

Klik daarna op OK; Resultaat:

Report

Hoe oud ben je?

Welke opleiding doe je?

Mean

N

Std. Deviation

Median

Minimum

Maximum

Commerciële Economie

19,06

178

1,435

19,00

17

24

Communicatie

19,44

101

1,734

19,00

17

26

Total

19,20

279

1,557

19,00

17

26

Let op !! Herstel nu het bestand door bij Data, Select Cases weer All aan te klikken.

TOP

 

opdracht 5

Er is in de vragenlijst een vraag gesteld over de door jullie in de afgelopen week beluisterde radiozenders. In het databestand vind je de antwoorden terug bij Quest1101 tot en met Quest1119. Deze codering houdt in dat Quest11 uit 19 onderdelen bestaat die allemaal individueel aangevinkt konden worden. Bekijk in het codeboek hoe dit gecodeerd is.

Deze 19 variabelen zijn redelijk eenvoudig in één figuur weer te geven. Bedenk dat wanneer een radiostation aangekruist is er een "1" staat in het codeboek.

Aanpak:

 Kies onder Graphs de optie Legacy Dialogs en dan Bar.

Je krijgt dan onderstaand schermpje

Kies hierin voor de optie Simple en Summaries of seperate variables

Het menu invullen betekent dat de variabelen Quest1101 tot en met Quest1119 moeten worden geselecteerd.

 

Standaard wordt de functie means geselecteerd, maar dat is in dit geval onzinnig en moet worden aangepast. Dat gaat via

Je krijgt dan het volgende venster dat alvast is ingevuld.

Ga na waarom dit een goede keuze is. Je had hier ook "Sum of values" kunnen gebruiken. Kun je uitleggen waarom?

Als je op continue klikt zie je in het venster:

Door op OK te drukken krijg je de volgende grafiek:

Na wat aanpassingen kun je de volgende grafiek krijgen:

Hier zijn alleen standaardopties gebruikt. Probeer eens een vergelijkbare grafiek te krijgen.

TOP

 

Opdracht 6

De bovenstaande gegevens kunnen ook in een tabel worden weergegeven. Dat gaat op de volgende manier:

Eerst moeten de 19 variabelen bij elkaar worden genomen.

Kies onder Analyze de optie Multiple Response en dan Define Variable Sets.

Neem bovenstaande instellingen over en klik op Close en daarna OK.
Daarna kun je via Analyze, Multiple Response en Frequencies een tabel opvragen.

Het resultaat is:

$Vraag11_Totaal Frequencies

 

 

Responses

Percent of Cases

 

 

N

Percent

Afgelopen week beluisterde radiozendersa

Radio 1

15

2,2%

5,5%

Radio 2

9

1,3%

3,3%

3 FM

77

11,1%

28,1%

Radio 4

1

,1%

,4%

RTL FM

4

,6%

1,5%

Funx

3

,4%

1,1%

Radio 10 Gold

3

,4%

1,1%

Sky Radio

53

7,6%

19,3%

Radio 538

137

19,7%

50,0%

CAZ

155

22,3%

56,6%

Classic FM

2

,3%

,7%

SLAM!FM

107

15,4%

39,1%

Radio 103

3

,4%

1,1%

Qmusic

67

9,6%

24,5%

Regionale zenders

7

1,0%

2,6%

Business News

1

,1%

,4%

Radio Veronica

17

2,4%

6,2%

Anders, nl.:

35

5,0%

12,8%

Total

696

100,0%

254,0%

a. Dichotomy group tabulated at value 1.

Enkele vragen:

  • Er staan twee soorten percentages in. Wat betekenen deze percentages precies?
  • Welke getallen vind je ook in de grafiek bij de vorige opgave terug en wat zeggen deze getallen precies?

TOP


Bijgewerkt op 7 juni 2010
©Jos Seegers