Anteros
Artikelen: 0
Berichten: 24
Lid geworden op: za 31 aug 2019, 21:40

Interpretatie Standard Residuals bij Regressie

Beste leden,

Momenteel ben ik bezig met het bepalen van woningprijzen op basis van een dataset. Hiervoor gebruik ik momenteel de regressie optie in EXCEL, echter valt bij het kijken naar de Standard Residuals op dat de gegevens hoogstwaarschijnlijk niet lineair zijn. Een veel voorkomende oplossing hiervoor is bijvoorbeeld de onafhankelijke variabele(x) non-lineair te maken. Bijvoorbeeld door een kolom toe te voegen met x^2 of log(x). Echter weet ik niet wat voor mijn huidige grafieken de beste oplossing is en hoe ik dit zou kunnen bepalen. Hierbij vraag ik dan ook jullie help.
Standard residuals perceeloppervlakte -> prijs
Standard residuals perceeloppervlakte -> prijs
Standard residuals woningoppervlakte -> prijs
Standard residuals woningoppervlakte -> prijs
Standard residuals bouwjaren -> prijs
Standard residuals bouwjaren -> prijs
Hierboven zijn 3 verschillende standard residual grafieken weergegeven. Ik heb voor deze onafhankelijke variabelen gekozen omdat deze vormen veruit het meeste terugkomen. Hiernaast zijn er ook nog enkele variabelen die te maken hebben met bijvoorbeeld het soort woonhuis [1(appartement),2 (rijwoning),3 (2-onder-1-kap),4 (Vrijstaand)]. Deze geven ook een grafiek maar deze interpreteren heb ik nog meer moeite mee.
Standard residuals Soort woonhuis -> prijs
Standard residuals Soort woonhuis -> prijs
Bij voorbaat dank voor het meedenken!

Met vriendelijke groet,
Anteros
Gebruikersavatar
wnvl1
Artikelen: 0
Berichten: 2.964
Lid geworden op: di 20 jul 2021, 21:43

Re: Interpretatie Standard Residuals bij Regressie

Wat dikwijls wordt gedaan is van de prijs de logaritme nemen. Je zou ook de hoogste prijzen uit het model weg kunnen laten. En dan nog eens opnieuw proberen.
Anteros
Artikelen: 0
Berichten: 24
Lid geworden op: za 31 aug 2019, 21:40

Re: Interpretatie Standard Residuals bij Regressie

Wanneer ik LOG neem van de prijs zorgt dit voor een nog schuinere verdeling en lagere R-kwadraat. Wanneer ik de LOG neem van bijv. de afhankelijke variabel woningoppervlakte heeft dit ook weinig effect. Zelf vond ik deze bron: https://www.qualtrics.com/support/stats ... egression/ maar deze lijkt ook weinig in te gaan op een Standard Residual grafiek die in een schuine lijn naar beneden gaat t.o.v. belvormig is.
Gebruikersavatar
wnvl1
Artikelen: 0
Berichten: 2.964
Lid geworden op: di 20 jul 2021, 21:43

Re: Interpretatie Standard Residuals bij Regressie

Die schuine lijn naar beneden die wordt veroorzaakt door het feit dat bij de goedkope huizen het residu niet sterk negatief kan zijn. Dat zou immers betekenen dat je er geld bij krijgt als je een huis koopt. Bij de duurde huizen zullen er wel grote negatieve correcties zijn. Een kasteel is per m^2 meestal goedkoper dan het model aangeeft. Dat wordt dikwijls wel wat opgelost door de log te nemen van de prijs, maar er is geen garantie.

Ik vermoed dat je graag wil voldoen aan Gauss-Markov met in begrip van homoskedasticiteit om de significanties te mogen interpreteren. Je zou eens de plots moeten maken van de partiële correlaties. Dat helpt wel om inzicht te krijgen in het model. Best is om te werken met R, SPSS, Python of iets anders. Ik heb geen ervaring in Excel, maar ik vermoed dat de mogelijkheden heel beperkt zijn in Excel.

Terug naar “Kansrekening en Statistiek”