Στατιστική ομαλοποίηση - Τι είναι, ορισμός και έννοια

Πίνακας περιεχομένων:

Anonim

Η στατιστική ομαλοποίηση είναι ο μετασχηματισμός κλίμακας της κατανομής μιας μεταβλητής, ώστε να είναι σε θέση να κάνει συγκρίσεις σε σχέση με σύνολα στοιχείων και το μέσο, ​​εξαλείφοντας τα αποτελέσματα των επιδράσεων.

Με άλλα λόγια, η ομαλοποίηση είναι αναλογίες χωρίς μονάδες μέτρησης (χωρίς διάσταση ή αμετάβλητη κλίμακα) που μας επιτρέπουν να συγκρίνουμε στοιχεία διαφορετικών μεταβλητών και διαφορετικών μονάδων μέτρησης.

Στα στατιστικά και την οικονομετρία, χρησιμοποιούνται τυποποιημένοι πίνακες κατανομής πιθανότητας για την εύρεση της πιθανότητας που λαμβάνει μια παρατήρηση δεδομένης της συνάρτησης κατανομής που ακολουθεί η μεταβλητή.

Είναι σημαντικό να μην περιορίσετε τον όρο κανονικοποίησης μόνο σε σύνολα στοιχείων όπου η κανονική κατανομή είναι μια καλή προσέγγιση της συχνότητάς τους.

Στατιστική μεταβλητή

Τραπέζι

Ο παρακάτω πίνακας περιγράφει τις πιο κοινές τυποποιήσεις στα στατιστικά που εφαρμόζονται στη χρηματοδότηση και στα οικονομικά.

  • Η τυποποιημένη ή τυπική βαθμολογία ομαλοποιεί τα σφάλματα όταν μπορούμε να υπολογίσουμε τις παραμέτρους του δείγματος.
  • Η κανονικοποίηση στην κατανομή t του μαθητή ομαλοποιεί τα υπολείμματα όταν οι παράμετροι είναι άγνωστες και κάνουμε μια εκτίμηση για να τις αποκτήσουμε.
  • Ο συντελεστής διακύμανσης χρησιμοποιεί τον μέσο όρο ως μέτρο κλίμακας, σε αντίθεση με την τυποποιημένη βαθμολογία και το Student's t, που χρησιμοποιούν την τυπική απόκλιση. Η κατανομή είναι κανονικοποιημένη για τις Poisson και εκθετικές κατανομές.
  • Η τυποποιημένη ροπή μπορεί να εφαρμοστεί σε οποιαδήποτε κατανομή πιθανότητας που έχει λειτουργία δημιουργίας ροπής. Με άλλα λόγια, ότι τα ολοκληρώματα των στιγμών είναι συγκλίνουσες.

Εφαρμογές

Πόσες φορές έχουμε διαβάσει ότι η κανονική κατανομή πιθανότητας φαίνεται σαν μια αρκετά καλή προσέγγιση με τη συχνότητα των παρατηρήσεων και μας ζητείται να βρούμε την πιθανότητα ότι η μεταβλητή X παίρνει μια συγκεκριμένη τιμή;

Με άλλα λόγια, ορίζουμε X ~ N (μ, σ2και μας ζητείται να βρούμε το P (X ≤ x)Εγώ)

Γνωρίζουμε ότι για να βρούμε το P (X ≤ x)Εγώ), πρέπει να αναζητήσουμε την πιθανότητα στους πίνακες κατανομής πιθανότητας. Σε αυτήν την περίπτωση, στους πίνακες κατανομής της κανονικής κατανομής. Οι πιο ευρέως χρησιμοποιούμενοι πίνακες κατανομής πιθανότητας στην οικονομετρία και την ποσοτική χρηματοδότηση είναι: chi-square, Student's t, Fisher-Snedecor's F, Poisson, exponential, cauchy και το κανονικό κανονικό.

Οι πιθανότητες που υπολογίζονται στους πίνακες διανομής πληρούν την ιδιότητα:

Δηλαδή, οι πιθανότητες (οι αριθμοί στον πίνακα) είναι τυποποιημένες. Στη συνέχεια, θα πρέπει επίσης να πληκτρολογήσουμε τη μεταβλητή μας σύμφωνα με τις παραμέτρους της συνάρτησης διανομής εάν θέλουμε να βρούμε την πιθανότητα του P (X ≤ xΕγώ).

Πρακτικό παράδειγμα

Θέλουμε να μάθουμε την πιθανότητα ο αριθμός των σκιέρ να κάνουν σκι την Παρασκευή το πρωί είναι 288.

Το χιονοδρομικό κέντρο μας λέει ότι η συχνότητα της μεταβλητής σκιέρ μπορεί να προσεγγίσει μια κανονική κατανομή του μέσου όρου 280 και της διακύμανσης 16

Έχουμε λοιπόν:

X ~ N (μ, σ2)

όπου το X ορίζεται ως η μεταβλητή «σκιέρ»

Μας ρωτούν για την πιθανότητα ότι ο αριθμός των σκιέρ που θα κάνουν σκι την Παρασκευή είναι μικρότερος ή ίσος με 288. Δηλαδή:

Π (X ≤ 288)

Επεξεργάζομαι, διαδικασία

Για να βρούμε την πιθανότητα ότι ο αριθμός των σκιέρ ισούται με 288, πρέπει πρώτα να πληκτρολογήσουμε τη μεταβλητή.

Στη συνέχεια εξετάζουμε τον πίνακα διανομής του συνεχούς κανονικού κανονικού:

Ζ 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Η πιθανότητα 288 σκιέρ να κάνουν σκι την Παρασκευή το πρωί είναι 97,72% με βάση τις παραμέτρους μέσης και διακύμανσης.