Voor een longitude big datastudie wil ik bestanden van verschillende onderzoekseenheden samenvoegen.
Het longitude bestand bestaande uit drie waves (3 ID's: wave1_id, wave2_id en wave3_id) wordt aangevuld.
Ik wil dan een bestand met 2 ID's (wave1_id en wave2_id) samenvoegen met het longitude bestand.
Als eerste sorteer ik beide variabelen tegelijkertijd, optie 'Ascending'.
Vervolgens ga ik naar de merge optie van SPSS en kies ik voor de optie om nieuwe variabelen toe te voegen.
Dan selecteer ik de optie 'match cases on key variables in sorted files',
waarbij ik de wave1_id en wave2_id samen als key variabel gebruik.
Door twee ID variabelen te gebruiken wil ik voorkomen dat missing ID's niet fout worden samengevoegd.
We hebben veel missing ID's wegens in wave 1 (wegens nieuwe sampling in wave 2) en in wave 2 (wegens drop out).
Dit lijkt foutloos uitgevoerd te worden...
Echter vertelde mij een collega dat SPSS geen twee ID's als key variabel kan gebruiken.
Hebben jullie ervaring in het gebruik van meer dan 1 key variabel?
Hoe doorloopt het programma de koppeling (achte de schermen)?
Het idee is juist dat er soms enkel één ID voorhanden is (Wave1 of Wave 2).
Door beide in te zetten heb ik geen missing, welke dan als blanco fout worden gekoppeld.