Το μοντέλο γραμμικής πιθανότητας είναι ένα μοντέλο δυαδικής επιλογής. Σε αυτό, η υπό όρους προσδοκία της εξαρτημένης μεταβλητής είναι μια γραμμική συνάρτηση, δηλαδή, η σχέση της εξαρτημένης μεταβλητής με την επεξηγηματική μεταβλητή είναι σταθερή.
Για να το δούμε με άλλο τρόπο, το μοντέλο γραμμικής πιθανότητας είναι ένα μοντέλο όπου έχουμε μια εξαρτημένη μεταβλητή και μια ανεξάρτητη μεταβλητή πολλαπλασιαζόμενη με έναν μόνιμο συντελεστή (ες).
Πρέπει να επισημάνουμε ότι το μοντέλο γραμμικής πιθανότητας είναι ένα μοντέλο δυαδικής επιλογής, δηλαδή, όπου η εξαρτημένη μεταβλητή μπορεί να πάρει δύο τιμές. Αυτές οι τιμές είναι 1 ή 0, για να δείξουν επιτυχία ή αποτυχία, αντίστοιχα.
Το μοντέλο γραμμικής πιθανότητας εκφράζεται ως εξής:
E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1χ
Στην εξίσωση που παρουσιάζεται, η υπό όρους προσδοκία του Y που δίνεται X ερμηνεύεται ως ίση με β0 + β1x.
Σε αυτήν την περίπτωση, παίρνουμε την υπό όρους προσδοκία, καθώς μας ενδιαφέρει να γνωρίζουμε την πιθανότητα ότι ένα άτομο παίρνει μια απόφαση δεδομένου των χαρακτηριστικών του, για παράδειγμα (ή μια άλλη ανεξάρτητη μεταβλητή μπορεί να ληφθεί ως αναφορά).
Μειονεκτήματα του μοντέλου γραμμικής πιθανότητας
Ορισμένα μειονεκτήματα του μοντέλου γραμμικής πιθανότητας είναι τα εξής:
- Το μοντέλο γραμμικής πιθανότητας μπορεί να δείξει ετεροσκεδικότητα. Και συγκεκριμένα, η διακύμανση των σφαλμάτων δεν είναι η ίδια σε όλες τις παρατηρήσεις που έγιναν. Σε αυτήν την περίπτωση, χρησιμοποιούνται τυπικά σφάλματα.
- Δεν μπορεί να υποτεθεί ότι τα σφάλματα κατανέμονται κανονικά.
- Η εξαρτημένη μεταβλητή μπορεί να πάρει μόνο δύο τιμές.
- Υποτίθεται ότι οι ανεξάρτητες και εξαρτημένες μεταβλητές έχουν γραμμική σχέση, δηλαδή ο ρυθμός μεταβολής είναι πάντα ο ίδιος. Ωστόσο, μπορεί να είναι πιο ακριβές η κατασκευή ενός μοντέλου όπου ο ρυθμός αλλαγής αυξάνεται καθώς το Υ φτάνει σε υψηλότερη τιμή και το αντίθετο συμβαίνει όταν το Υ μειώνεται.
Δεδομένων αυτών των μειονεκτημάτων, υπάρχουν τα μοντέλα logit και probit.
Παράδειγμα γραμμικού μοντέλου πιθανότητας
Ένα γραμμικό μοντέλο πιθανότητας μπορεί να κατασκευαστεί, για παράδειγμα, όπου η εξαρτημένη μεταβλητή είναι αν το άτομο έχει επί του παρόντος μια επίσημη εργασία που έχει για ένα έτος ή περισσότερο. Οι ανεξάρτητες μεταβλητές θα μπορούσαν να είναι το επίπεδο των σπουδών ή το εκπαιδευτικό επίπεδο, το φύλο και η ηλικία.
Στο παράδειγμα που εμφανίζεται, η εξαρτημένη μεταβλητή θα είναι 1 ή 0, αλλά πρέπει να ερμηνεύεται ποιοτικά, ανεξάρτητα από την αριθμητική της τιμή. Έτσι, 1 σημαίνει ότι το άτομο έχει μια επίσημη εργασία που διατηρείται για περισσότερο από 1 έτος, και 0 θα είναι η κατάσταση στην οποία δεν συμβαίνει αυτό.