Dummy μεταβλητή - Τι είναι, ορισμός και έννοια

Πίνακας περιεχομένων:

Dummy μεταβλητή - Τι είναι, ορισμός και έννοια
Dummy μεταβλητή - Τι είναι, ορισμός και έννοια
Anonim

Μια εικονική μεταβλητή είναι μια μεταβλητή που χρησιμοποιείται για να εξηγήσει ποιοτικές τιμές σε ένα μοντέλο παλινδρόμησης.

Τα μοντέλα παλινδρόμησης προσπαθούν να εξηγήσουν μια μεταβλητή σε σχέση με άλλες. Για παράδειγμα, ο μισθός ενός ατόμου με βάση την ηλικία, την εκπαίδευση και την εμπειρία του. Αυτές οι μεταβλητές μπορούν να ποσοτικοποιηθούν. Η ηλικία, η εκπαίδευση και η εμπειρία ενός ατόμου μπορούν να ποσοτικοποιηθούν σε αριθμό ετών. Αλλά τι συμβαίνει όταν έχουμε μεταβλητές που δεν μπορούν να ποσοτικοποιηθούν; Για παράδειγμα, το χρώμα των μαλλιών, η χώρα όπου ζείτε ή το φύλο. Η λύση σε αυτό το πρόβλημα βρίσκεται στις πλαστές μεταβλητές. Είναι μεταβλητές που συνήθως λαμβάνουν δυαδικές τιμές. Δηλαδή, η τιμή μηδέν ή ένα.

Για παράδειγμα, η μεταβλητή φύλο, έχουμε πει, είναι μια ποιοτική μεταβλητή. Για να το συμπεριλάβετε σε ένα μοντέλο παλινδρόμησης, πρέπει να δημιουργήσετε μια εικονική μεταβλητή. Θα ονομάσουμε τη μεταβλητή "γυναίκα" έτσι ώστε:

Γυναίκα = 1 (αν το άτομο είναι γυναίκα)

Γυναίκα = 0 (αν το άτομο δεν είναι γυναίκα, δηλαδή είναι άνδρας)

Σε αυτήν την περίπτωση, το "man" θεωρείται κατηγορία αναφοράς ή ομάδα βάσης.

Υπάρχουν δύο τύποι εικονικών μεταβλητών. Από τη μία πλευρά υπάρχουν οι μεταβλητές πλαστές ανδρείκελες και από την άλλη υπάρχουν οι μεταβλητές ανδρεικέλες.

Ανάλυση παλινδρόμησης

Πρόσθετη μεταβλητή πλαστή

Μια μεταβλητή ανδρεικέλου πρόσθετων συλλέγει μια σταθερή αλλαγή. Αυτή η αλλαγή επηρεάζει μόνο τον σταθερό όρο της εξίσωσης. Για παράδειγμα, ένα μοντέλο που στοχεύει στην εξήγηση των μισθών βάσει του φύλου και των ετών εκπαίδευσης. Μπορούμε να βάλουμε την εξίσωση ως αναφορά στους άντρες (δεύτερη εξίσωση) ή ως αναφορά στις γυναίκες (πρώτη εξίσωση):

Η γραφική αναπαράσταση των εξισώσεων θα ήταν: Στην περίπτωση που οι άνδρες έχουν υψηλότερους μισθούς, λαμβάνοντας μια μεταβλητή ανδρεικέλου πρόσθετου, το μοντέλο θα παριστάνεται ως η προηγούμενη εικόνα.

Στην περίπτωσή σας, εάν οι γυναίκες είχαν υψηλότερους μισθούς από τους άνδρες, λαμβάνοντας μια μεταβλητή ανδρεικέλου, το μοντέλο θα απεικονιζόταν γραφικά ως η προηγούμενη εικόνα.

Η ποσοτική διαφορά μεταξύ της μπλε γραμμής (άνδρες) και της πορτοκαλί γραμμής (γυναίκες) θα είναι ίση με την τιμή της μεταβλητής «γυναίκες" ή "Οι άνδρες»Σύμφωνα με το επιλεγμένο μοντέλο. Σε αυτήν την περίπτωση, αυτή των μεταβλητών ανδρεικέλων, η διαφορά μισθού δεν εξαρτάται από το επίπεδο σπουδών. Με άλλα λόγια, η διαφορά μισθών εξαρτάται αποκλειστικά και μόνο από το φύλο.

Πολλαπλασιαστική εικονική μεταβλητή

Μια πολλαπλασιαστική εικονική μεταβλητή συλλαμβάνει μια αλλαγή στην κλίση των εξισώσεων για άνδρες και γυναίκες. Συνεχίζοντας με το προηγούμενο παράδειγμα έχουμε:

Γραφικά, μια πιθανή αναπαράσταση θα ήταν:

Σε αυτήν την περίπτωση, το μοντέλο θα μας έλεγε δύο πράγματα. Πρώτα απ 'όλα, οι μισθοί των γυναικών είναι χαμηλότεροι από τους άνδρες. Και δεύτερον, ότι ένα επιπλέον έτος εκπαίδευσης πληρώνει καλύτερα για τους άνδρες από τις γυναίκες. Αυτό το γνωρίζουμε γιατί η κλίση της μπλε γραμμής (άνδρες) είναι μεγαλύτερη από την κλίση της πορτοκαλί γραμμής (γυναίκες).

Εάν ένα επιπλέον έτος εκπαίδευσης πληρώθηκε καλύτερα στις γυναίκες, τότε η κλίση της πορτοκαλί γραμμής (γυναίκες) θα ήταν μεγαλύτερη. Και, η μπλε γραμμή (άνδρες) θα ήταν κάτω.

Στατιστική μεταβλητή