Wat is de juiste methodiek?
Geplaatst: do 09 okt 2014, 22:44
Hi,
Ik ben bezig met een onderzoek om te kijken wat de mogelijkheden zijn van twitter om consumentengedrag te bepalen. Ik gebruik hiervoor de autobranche. Nu dacht ik dat ik een mooie methode had verzonnen maar die lijkt toch niet te kloppen dus vandaar dat ik hier hulp vraag.
Ik heb de volgende data:
Maandelijkse Twitter volume rondom een automodel vanaf 1 januari 2013 tot 1 oktober 2014.
Maandelijkse autoverkopen van een automodel van 1 januari 2014 tot 1 oktober 2014.
Voor de volkswagen golf heb ik bv de volgende data. Onderstaande gegevens heb ik voor 50 modellen
January
February
March
April
May
June
July
August
September
October
November
December
January
February
March
April
May
June
July
August
September
Car sales
1488
1339
1774
1110
1041
922
1128
974
1265
1575
1327
679
2.636
1288
1101
1203
1376
1047
1070
918
1161
Twitter volume model
904
960
1372
987
849
1016
729
963
1154
902
846
1155
2337
1400
1555
1908
1416
1162
968
969
1168
Twitter volume brand
5457
6391
5986
6547
5098
4904
4584
5101
7987
6186
5598
7093
8794
9213
6162
6494
6960
5703
7129
6292
5604
Waar ik dus naar op zoek ben is de relatie tussen twitter volume en de autoverkoop. Als je bovenstaande gegevens in een grafiek zet zie je een kleine delay tussen de stijging van het volume en de autoverkoop dus er is sprake van een soort voorspellende gave.
De Independ variabele = Twitter volume model (continues/interval)
De dependend variabele = Car sales (continues/interval)
Als ik vervolgens op zoek ga naar de juiste test in onderstaande tabel http://www.ats.ucla.edu/STAT/stata/whatstat/default.htm kom ik uit bij een correlatie of een simpel lineare regressie. Klopt dit?
Daarnaast zou ik graag een predictive model willen maken maar dan zit ik met het probleem dat ik maar 1 determinant heb of zou ik dan alle maanden apart moeten nemen als variabele? Of kan dat niet? Ik heb evt ook nog het totale merk (brand) volume maar ik loop hier nogal vast.
Ik hoop dat jullie mij kunnen helpen. Alvast dank.
ps. mocht dit het verkeerde plek zijn voor deze vraag dan hoor ik dat graag
Ik ben bezig met een onderzoek om te kijken wat de mogelijkheden zijn van twitter om consumentengedrag te bepalen. Ik gebruik hiervoor de autobranche. Nu dacht ik dat ik een mooie methode had verzonnen maar die lijkt toch niet te kloppen dus vandaar dat ik hier hulp vraag.
Ik heb de volgende data:
Maandelijkse Twitter volume rondom een automodel vanaf 1 januari 2013 tot 1 oktober 2014.
Maandelijkse autoverkopen van een automodel van 1 januari 2014 tot 1 oktober 2014.
Voor de volkswagen golf heb ik bv de volgende data. Onderstaande gegevens heb ik voor 50 modellen
January
February
March
April
May
June
July
August
September
October
November
December
January
February
March
April
May
June
July
August
September
Car sales
1488
1339
1774
1110
1041
922
1128
974
1265
1575
1327
679
2.636
1288
1101
1203
1376
1047
1070
918
1161
Twitter volume model
904
960
1372
987
849
1016
729
963
1154
902
846
1155
2337
1400
1555
1908
1416
1162
968
969
1168
Twitter volume brand
5457
6391
5986
6547
5098
4904
4584
5101
7987
6186
5598
7093
8794
9213
6162
6494
6960
5703
7129
6292
5604
Waar ik dus naar op zoek ben is de relatie tussen twitter volume en de autoverkoop. Als je bovenstaande gegevens in een grafiek zet zie je een kleine delay tussen de stijging van het volume en de autoverkoop dus er is sprake van een soort voorspellende gave.
De Independ variabele = Twitter volume model (continues/interval)
De dependend variabele = Car sales (continues/interval)
Als ik vervolgens op zoek ga naar de juiste test in onderstaande tabel http://www.ats.ucla.edu/STAT/stata/whatstat/default.htm kom ik uit bij een correlatie of een simpel lineare regressie. Klopt dit?
Daarnaast zou ik graag een predictive model willen maken maar dan zit ik met het probleem dat ik maar 1 determinant heb of zou ik dan alle maanden apart moeten nemen als variabele? Of kan dat niet? Ik heb evt ook nog het totale merk (brand) volume maar ik loop hier nogal vast.
Ik hoop dat jullie mij kunnen helpen. Alvast dank.
ps. mocht dit het verkeerde plek zijn voor deze vraag dan hoor ik dat graag