Συντελεστής διακύμανσης - Τι είναι, ορισμός και σημασία
Ο συντελεστής διακύμανσης, επίσης γνωστός ως ο συντελεστής διακύμανσης του Pearson, είναι ένα στατιστικό μέτρο που μας ενημερώνει για τη σχετική διασπορά ενός συνόλου δεδομένων.
Δηλαδή, μας ενημερώνει, όπως και άλλα μέτρα διασποράς, για το αν μια μεταβλητή κινείται πολύ, λίγο, περισσότερο ή λιγότερο από μια άλλη.
Συντελεστής Τύπου Παραλλαγής
Ο υπολογισμός του επιτυγχάνεται διαιρώντας την τυπική απόκλιση με την απόλυτη τιμή του μέσου όρου του συνόλου και συνήθως εκφράζεται ως ποσοστό για καλύτερη κατανόηση.
- Χ: μεταβλητή στην οποία θα υπολογιστεί η διακύμανση
- σΧ: Τυπική απόκλιση της μεταβλητής X.
- | x̄ |: Είναι ο μέσος όρος της μεταβλητής X σε απόλυτη τιμή με x̄ ≠ 0
Ο συντελεστής διακύμανσης μπορεί να φανεί εκφράζεται με τα γράμματα CV ή r, ανάλογα με το εγχειρίδιο ή τη γραμματοσειρά που χρησιμοποιείται. Ο τύπος του είναι ο ακόλουθος:
Ο συντελεστής διακύμανσης χρησιμοποιείται για τη σύγκριση συνόλων δεδομένων που ανήκουν σε διαφορετικούς πληθυσμούς. Αν κοιτάξουμε τον τύπο του, βλέπουμε ότι λαμβάνει υπόψη την αξία του μέσου όρου. Επομένως, ο συντελεστής διακύμανσης μας επιτρέπει να έχουμε ένα μέτρο διασποράς που εξαλείφει τις πιθανές παραμορφώσεις των μέσων δύο ή περισσότερων πληθυσμών.
ΤάξηΠαραδείγματα χρήσης του συντελεστή διακύμανσης αντί της τυπικής απόκλισης
Ακολουθούν ορισμένα παραδείγματα αυτού του μέτρου διασποράς:
Σύγκριση συνόλων δεδομένων διαφορετικών διαστάσεων
Θέλουμε να αγοράσουμε τη διαφορά μεταξύ του ύψους 50 μαθητών σε μια τάξη και του βάρους τους. Για να συγκρίνουμε το ύψος, θα μπορούσαμε να χρησιμοποιήσουμε μετρητές και εκατοστά ως τη μονάδα μέτρησης και το κιλό για το βάρος. Η σύγκριση αυτών των δύο κατανομών χρησιμοποιώντας την τυπική απόκλιση δεν θα είχε νόημα, καθώς προσπαθούμε να μετρήσουμε δύο διαφορετικές ποιοτικές μεταβλητές (ένα μέτρο μήκους και μία μάζα).
Συγκρίνετε σύνολα με μεγάλη διαφορά μεταξύ μέσων
Φανταστείτε, για παράδειγμα, ότι θέλουμε να μετρήσουμε το βάρος των σκαθαριών και των ιπποπόταμων. Το βάρος των σκαθαριών μετράται σε γραμμάρια ή χιλιοστόγραμμα και το βάρος των ιπποπόδων μετριέται συνήθως σε τόνους. Εάν για τη μέτρησή μας μετατρέπουμε το βάρος των σκαθαριών σε τόνους, ώστε και οι δύο πληθυσμοί να είναι στην ίδια κλίμακα, η τυπική απόκλιση ως μέτρο διασποράς δεν θα ήταν κατάλληλη. Το μέσο βάρος σκαθάρι που μετράται σε τόνους θα είναι τόσο μικρό που εάν χρησιμοποιούσαμε την τυπική απόκλιση, δεν θα υπήρχε σχεδόν καμία διασπορά στα δεδομένα. Αυτό θα ήταν λάθος, καθώς το βάρος μεταξύ διαφορετικών ειδών σκαθαριών μπορεί να ποικίλλει σημαντικά.
Παράδειγμα υπολογισμού του συντελεστή διακύμανσης
Σκεφτείτε έναν πληθυσμό ελεφάντων και ένα άλλο ποντίκι. Ο πληθυσμός των ελεφάντων έχει μέσο βάρος 5.000 κιλά και τυπική απόκλιση 400 κιλών. Ο πληθυσμός του ποντικού έχει μέσο βάρος 15 γραμμάρια και τυπική απόκλιση 5 γραμμαρίων. Εάν συγκρίνουμε τη διασπορά και των δύο πληθυσμών χρησιμοποιώντας την τυπική απόκλιση, θα μπορούσαμε να πιστεύουμε ότι υπάρχει μεγαλύτερη διασπορά για τον πληθυσμό των ελεφάντων από εκείνη των ποντικών.
Ωστόσο, κατά τον υπολογισμό του συντελεστή διακύμανσης και για τους δύο πληθυσμούς, θα συνειδητοποιούσαμε ότι είναι ακριβώς το αντίθετο.
Ελέφαντες: 400/5000 = 0,08
Ποντίκια: 5/15 = 0,33
Αν πολλαπλασιάσουμε και τα δύο δεδομένα με 100, έχουμε ότι ο συντελεστής διακύμανσης για τους ελέφαντες είναι μόνο 8%, ενώ ο ποντικός είναι 33%. Ως συνέπεια της διαφοράς μεταξύ των πληθυσμών και του μέσου βάρους τους, βλέπουμε ότι ο πληθυσμός με τη μεγαλύτερη διασπορά δεν είναι αυτός με τη μεγαλύτερη τυπική απόκλιση.
Διάστημα εμπιστοσύνηςΣυντελεστής γραμμικής συσχέτισης