Η στατιστική εξάπλωση είναι ο βαθμός στον οποίο η διανομή δεδομένων απομακρύνεται από, ή πλησιάζει, σε απόλυτη τιμή στον αριθμητικό μέσο, ως στατιστική κεντρικής θέσης.
Επομένως, τα μέτρα διασποράς θα συνοδεύουν πάντα αυτόν τον μέσο ή μέσο όρο
Με αυτόν τον τρόπο, θα αναφέρουν τη μεταβλητότητα ή τη διασπορά των δεδομένων σε σχέση με αυτά. Όσο υψηλότερες είναι οι τιμές, όπως θα δούμε παρακάτω, τόσο μεγαλύτερη είναι η στατιστική διασπορά.
Σημασία της στατιστικής διασποράς
Όταν θέλουμε να κάνουμε μια περιγραφική ανάλυση, υπολογίζουμε πρώτα τα συνοπτικά μέτρα της θέσης. Τα πιο συνηθισμένα είναι ο μέσος όρος, ο διάμεσος, ο τρόπος λειτουργίας ή τα τεταρτημόρια, τα δεκαδικά, τα πεντάμετρα ή τα εκατοστημόρια. Επίσης, πρέπει να γνωρίζουμε τη στατιστική εξάπλωση.
Τα μέτρα διασποράς παρέχουν πολύ σχετικές πληροφορίες. Εάν η διασπορά είναι πολύ υψηλή, επηρεάζει το μέσο όρο και αυτό δεν είναι πλέον αντιπροσωπευτικό της ομάδας ως συνοπτικό μέτρο. Επομένως, συνήθως και τα δύο δεδομένα ταυτίζονται
Στατιστικά μέτρα διασποράς
Υπάρχουν διάφορα μέτρα διασποράς που επιτρέπουν τη μέτρησή του. Ας δούμε μια περίληψη των πιο σχετικών. Τους αναλύσαμε λεπτομερέστερα εδώ.
- Τάξη: Δεν είναι μόνο η διαφορά μεταξύ της μικρότερης και της μεγαλύτερης αξίας της διανομής.
- Μέση απόκλιση: Θα ήταν το ισοδύναμο του μέσου όρου των διαφορετικών αποκλίσεων κάθε δεδομένων από το μέσο όρο.
- Διακύμανση και τυπική απόκλιση: Είναι τα πιο γνωστά μέτρα διασποράς. Συνήθως χρησιμοποιείται το δεύτερο που είναι πιο εύκολο να υπολογιστεί (ρίζα της διακύμανσης) και να ερμηνευθεί. Εκφράζονται σε απόλυτες τιμές.
- Συντελεστής διακύμανσης: Σε αυτήν την περίπτωση, υπολογίζεται με την τυπική απόκλιση και το μέσο όρο, και χρησιμοποιείται για σύγκριση, καθώς εκφράζεται σε σχετικές τιμές (%).
Παράδειγμα στατιστικής διασποράς
Τέλος, θα δούμε ένα παράδειγμα δέκα πλασματικών χωρών και του ΑΕγχΠ τους.
Μπορούμε να δούμε ότι είναι πολύ διαφορετικοί όσον αφορά το ΑΕγχΠ τους. Από το μεγαλύτερο, με 7.000 εκατομμύρια μονάδες, στο μικρότερο, με 2.500 εκατομμύρια.
Βλέπουμε ότι ο μέσος όρος είναι περίπου 4.500 εκατομμύρια, αλλά τα μέτρα διασποράς είναι πολύ υψηλά. Από τη μία πλευρά, η μέση απόκλιση, περίπου 1.500 εκατομμύρια μονάδες. Η διακύμανση, η οποία δεν συνεισφέρει πολύ, αλλά επιτρέπει τον υπολογισμό της τυπικής απόκλισης περίπου 1.500 εκατομμυρίων μονάδων. Τέλος, ένας συντελεστής διακύμανσης σχεδόν 33%.
Μπορούμε να πούμε ότι η στατιστική διασπορά είναι πολύ υψηλή και ο μέσος όρος δεν είναι αντιπροσωπευτικός. Κάτι που μπορεί να επαληθευτεί επειδή υπάρχουν λίγα δεδομένα και χώρες με υψηλό ΑΕΠ και άλλες με χαμηλό. Αλλά φανταστείτε το 194 που αναγνωρίστηκε από τον ΟΗΕ, υπάρχουν αρκετά χρήσιμα, σωστά;