Spearman's Rho - Τι είναι, ορισμός και έννοια

Πίνακας περιεχομένων:

Spearman's Rho - Τι είναι, ορισμός και έννοια
Spearman's Rho - Τι είναι, ορισμός και έννοια
Anonim

Το Spearman's rho είναι ένα μη παραμετρικό μέτρο εξάρτησης στο οποίο υπολογίζεται η μέση ιεραρχία των παρατηρήσεων, οι διαφορές τετραγωνίζονται και ενσωματώνονται στον τύπο.

Με άλλα λόγια, εκχωρούμε μια κατάταξη στις παρατηρήσεις κάθε μεταβλητής και μελετάμε τη σχέση εξάρτησης μεταξύ δύο δεδομένων μεταβλητών.

Οι ταξινομημένες συσχετίσεις είναι μια μη παραμετρική εναλλακτική ως μέτρο εξάρτησης μεταξύ δύο μεταβλητών όταν δεν μπορούμε να εφαρμόσουμε τον συντελεστή συσχέτισης του Pearson.

Γενικά αντιστοιχεί το γράμμα giega Ρο στον συντελεστή συσχέτισης.

Η εκτίμηση του Spearman rho δίνεται από:

Διαδικασία Rho Spearman

0. Ξεκινάμε από ένα δείγμα του ν παρατηρήσεις (ΑΕγώΒΕγώ).

1. Ταξινομήστε τις παρατηρήσεις κάθε μεταβλητής προσαρμόζοντάς τις για δεσμούς.

  • Χρησιμοποιούμε μια λειτουργία excel που ταξινομεί τις παρατηρήσεις για εμάς και τις προσαρμόζει αυτόματα εάν εντοπίσει δεσμούς μεταξύ των στοιχείων. Αυτή η συνάρτηση ονομάζεται HERARCH.MEDIA (ταξινόμηση ΑΕγώΜια ταξινόμησην;Σειρά).
  • Ο τελευταίος παράγοντας της συνάρτησης είναι προαιρετικός και μας λέει με ποια σειρά θέλουμε να παραγγείλουμε τις παρατηρήσεις. Ένας μη μηδενικός αριθμός θα ταξινομήσει τις παρατηρήσεις σε αύξουσα σειρά. Για παράδειγμα, θα εκχωρήσει στο μικρότερο στοιχείο μια κατάταξη 1. Εάν βάζουμε ένα μηδέν στη μεταβλητή Σειρά, θα εκχωρήσει στο μεγαλύτερο αντικείμενο μια κατάταξη 1 (φθίνουσα σειρά).

Πρακτικό παράδειγμα

  • Στην περίπτωσή μας, εκχωρούμε στη μεταβλητή παραγγελίας έναν μη μηδενικό αριθμό για να ταξινομήσουμε τις παρατηρήσεις σε αύξουσα σειρά. Δηλαδή, εκχωρώντας το μικρότερο στοιχείο της μεταβλητής κατάταξη 1.
  • Ελέγχουμε ότι τα συνολικά ποσά των στηλών του Ταξινόμηση Α Γ Ταξινόμηση Β είναι ίσοι μεταξύ τους και συναντούν:

Σε αυτήν την περίπτωση n = 10 επειδή έχουμε συνολικά 10 στοιχεία / παρατηρήσεις σε κάθε μεταβλητή ΠΡΟΣ ΤΗΝ Γ σι.

Το συνολικό άθροισμα της Ταξινόμησης Α ισούται με το συνολικό άθροισμα της Ταξινόμησης Υ και πληρούν επίσης τον παραπάνω τύπο.

ΠΡΟΣ ΤΗΝ σι Ταξινόμηση Α Ταξινόμηση Β Τετραγωνικές διαφορές
0 50 2,5 8,5 36
70 -20 9 3 36
-20 30 1 6,5 30,25
40 -90 6 1 25
30 0 5 4 1
50 30 7 6,5 0,25
20 20 4 5 1
0 -40 2,5 2 0,25
80 70 10 10 0
60 50 8 8,5 0,25
Σύνολο 55 55 130

2. Προσθέστε τις διαφορές μεταξύ των κατατάξεων και τετραγωνίστε τις.

  • Μόλις έχουμε όλες τις διαβαθμισμένες παρατηρήσεις λαμβάνοντας υπόψη τους δεσμούς μεταξύ τους, υπολογίζουμε τη διαφορά με τη μορφή:

ρεΕγώ = ΑΕγώ - ΒΕγώ

Ορίζουμε (δΕγώ) ως η διαφορά μεταξύ της ταξινόμησης του ΑΕγώ και την ταξινόμηση του ΒΕγώ.

  • Μόλις επιτευχθεί η διαφορά, την τετραγώνουμε. Τα τετράγωνα των διαφορών εφαρμόζονται για να έχουν μόνο θετικές τιμές.

Ορίζουμε dΕγώ2 ως η τετραγωνική διαφορά μεταξύ της ταξινόμησης του ΑΕγώ και την ταξινόμηση του ΒΕγώ.

Στη στήλη των τετραγώνων διαφορών θα έχουμε:

ρεΕγώ2 = (ΑΕγώ - ΒΕγώ)2

3. Υπολογίστε το rho του Spearman:

  • Υπολογίζουμε το συνολικό άθροισμα των τετραγώνων διαφορών της φόρμας:

Στο παράδειγμά μας:

  • Ενσωματώνουμε το αποτέλεσμα στη φόρμουλα του Spearman's rho:

Στο παράδειγμά μας:

Σύγκριση: Pearson εναντίον Spearman

Αν υπολογίσουμε τον συντελεστή συσχέτισης του Pearson με δεδομένες τις προηγούμενες παρατηρήσεις και τον συγκρίνουμε με τον συντελεστή συσχέτισης του Spearman, λαμβάνουμε:

  • Pearson = 0.1109
  • Spearman = 0,2121

Μπορούμε να δούμε ότι η εξάρτηση μεταξύ των μεταβλητών Α και Β παραμένει αδύναμη ακόμη και χρησιμοποιώντας το Spearman αντί του Pearson.

Εάν τα outliers είχαν μεγάλη επιρροή στα αποτελέσματα, θα βρούμε μια μεγάλη διαφορά μεταξύ Pearson και Spearman και, επομένως, πρέπει να χρησιμοποιήσουμε το Spearman ως μέτρο εξάρτησης.