SPSS Merge Longitude bestanden

Johannes Weigl · vr 17 jun 2016, 12:11

Voor een longitude big datastudie wil ik bestanden van verschillende onderzoekseenheden samenvoegen.
Het longitude bestand bestaande uit drie waves (3 ID's: wave1_id, wave2_id en wave3_id) wordt aangevuld.

Ik wil dan een bestand met 2 ID's (wave1_id en wave2_id) samenvoegen met het longitude bestand.

Als eerste sorteer ik beide variabelen tegelijkertijd, optie 'Ascending'.
Vervolgens ga ik naar de merge optie van SPSS en kies ik voor de optie om nieuwe variabelen toe te voegen.
Dan selecteer ik de optie 'match cases on key variables in sorted files',
waarbij ik de wave1_id en wave2_id samen als key variabel gebruik.

Door twee ID variabelen te gebruiken wil ik voorkomen dat missing ID's niet fout worden samengevoegd.
We hebben veel missing ID's wegens in wave 1 (wegens nieuwe sampling in wave 2) en in wave 2 (wegens drop out).

Dit lijkt foutloos uitgevoerd te worden...
Echter vertelde mij een collega dat SPSS geen twee ID's als key variabel kan gebruiken.

Hebben jullie ervaring in het gebruik van meer dan 1 key variabel?
Hoe doorloopt het programma de koppeling (achte de schermen)?
Het idee is juist dat er soms enkel één ID voorhanden is (Wave1 of Wave 2).
Door beide in te zetten heb ik geen missing, welke dan als blanco fout worden gekoppeld.

Saffron · zo 19 jun 2016, 21:59

Je kan best 2 key variabelen gebruiken. Maar of het in jouw geval goed gaat, hangt een beetje van af hoe je dataset er precies uitziet.

Ik weet niet of ik de situatie helemaal snap. Je hebt 3 waves (geen herhaalde metingen binnen dezelfde personen, klopt dat?) en die waves heb je onder elkaar staan in een bestand. Elke wave heeft een eigen ID-variabele en je wilt nu nieuwe variabele erin plakken? Zoiets? Zijn de ID variabelen te combineren tot 1 variabele of is de nummering van cases niet uniek?

Johannes Weigl · ma 20 jun 2016, 11:17

Saffron schreef: Je kan best 2 key variabelen gebruiken. Maar of het in jouw geval goed gaat, hangt een beetje van af hoe je dataset er precies uitziet.

Ik weet niet of ik de situatie helemaal snap. Je hebt 3 waves (geen herhaalde metingen binnen dezelfde personen, klopt dat?) en die waves heb je onder elkaar staan in een bestand. Elke wave heeft een eigen ID-variabele en je wilt nu nieuwe variabele erin plakken? Zoiets? Zijn de ID variabelen te combineren tot 1 variabele of is de nummering van cases niet uniek?

Besta Saffron, bedankt voor uw reactie.

We hebben 3 waves waarbij het voornamelijk herhaalde metingen zijn.
Echter hebben we ook veel nieuwe deelnemers in wave 2 en wave 3 opgenomen.
We hebben dus veel cases waar we geen wave-1 ID hebben (kernprobleem om enkel met 1 key-variabel samen te voegen).

Elke case heeft voor elke wave een eigen ID, welke per wave uniek is.
Echter zijn alle Wave-ID's onderling niet uniek.
Elk ID bestaat uit: schoolnummer, klasnummer en leerlingsnummer.
Het is dus goed mogelijk dat leerlingen uit andere leerjaren een zelfde casenummer hebben als leerlingen uit eerdere of latere jaren (waves).

Momenteel heb ik het probleem opgelost door voor elke missing uit Wave-1 een symbolische ID aan te maken. Met andere woorden heb ik voor leerlingen welke enkel in wave-2 en/of wave-3 deelnamen een fictieve ID aangemaakt.

Echter was dit omslachtig veel werk, waarbij ik via een omweg (Excel) heb gewerkt.
Het zou ideaal zijn om via een SPSS syntax bovenstaande voor elkaar te krijgen.
Wellicht heeft u een idee hoe ik dit zou kunnen aanpakken.
En de eerste vraag blijft dan nog altijd, zou ik dit geval het mergen met twee wave-id's wel of niet werken?

Saffron · ma 20 jun 2016, 19:39

Dus een respondent die op 3 waves heeft meegedaan, heeft 3 verschillende IDs? Er is geen uniek ID over alle waves heen? Das niet zo handig gedaan in het design dan.

Je kan altijd cases toevoegen door het ADD CASE command (ipv Add variables).

SPSS Merge Longitude bestanden

SPSS Merge Longitude bestanden

Re: SPSS Merge Longitude bestanden

Re: SPSS Merge Longitude bestanden

Re: SPSS Merge Longitude bestanden

Contact

Educatie

Community