Kendall's Tau (II) - Τι είναι, ορισμός και έννοια

Πρόκειται για ένα μη παραμετρικό μέτρο εξάρτησης που προσδιορίζει τα αντίστοιχα και ασυνεπή ζεύγη δύο μεταβλητών. Μόλις προσδιοριστούν, τα σύνολα υπολογίζονται και το πηλίκο γίνεται.

Με άλλα λόγια, εκχωρούμε μια κατάταξη στις παρατηρήσεις κάθε μεταβλητής και μελετάμε τη σχέση εξάρτησης μεταξύ δύο δεδομένων μεταβλητών.

Υπάρχουν δύο τρόποι για τον υπολογισμό του Kendall's Tau. επιλέγουμε να υπολογίσουμε τη σχέση εξάρτησης μετά την παραγγελία των παρατηρήσεων κάθε μεταβλητής. Στο παράδειγμά μας, θα δούμε ότι ταξινομούμε τις ταξινομήσεις στη στήλη X με αύξουσα σειρά.

Οι ταξινομημένες συσχετίσεις είναι μια μη παραμετρική εναλλακτική ως μέτρο εξάρτησης μεταξύ δύο μεταβλητών όταν δεν μπορούμε να εφαρμόσουμε τον συντελεστή συσχέτισης του Pearson.

Αυτά είναι τα αποτελέσματα που αναφέραμε στο πρώτο άρθρο -> Kendall's Tau (I):

Θέρετρο σκι (Εγώ) Χ Ζ ντο ΝΚ
ΠΡΟΣ ΤΗΝ 1 1 6 0
σι 2 3 5 0
ντο 3 4 5 1
ρε 4 2 4 0
ΚΑΙ 5 7 4 1
φά 6 6 4 1
σολ 7 5 43 3 ΣΥΝΟΛΟ
  • Το ζεύγος BC-CB είναι ένα ασυνεχές ζεύγος. Εισάγουμε 1 στη στήλη NC και παγώνουμε τον μετρητή στην τελευταία θέση μέχρι να βρούμε ξανά ένα αντίστοιχο ζεύγος. Σε αυτήν την περίπτωση, έχουμε παγώσει τον αριθμό των ζευγαριών που ταιριάζουν σε 5 έως το σταθμό D. Ο σταθμός D μπορεί να σχηματίσει μόνο 4 ζευγάρια που ταιριάζουν: AD-DA, DE-ED, DF-FD, DG-GD.

Ένα άλλο δυσαρεστημένο ζευγάρι θα ήταν το EF-FE:

  • Το ζεύγος EF-FE είναι ένα ασυνεχές ζεύγος. Γράφουμε 1 στη στήλη NC και συνεχίζουμε να σύρουμε τον αριθμό 4 των αντίστοιχων ζευγών που μπορούν να σχηματιστούν. Τα αντίστοιχα ζεύγη του σταθμού Ε θα ήταν: EA-AE, EB-BE, EC-CE, ED-DE, επειδή το EF-FE είναι ασυνεχές.
    • Το ζεύγος FG-GF είναι ένα ασυνεχές ζεύγος. Γράφουμε 1 στη στήλη NC και συνεχίζουμε να σύρουμε τον αριθμό 4 των αντίστοιχων ζευγών που μπορούν να σχηματιστούν. Τα αντίστοιχα ζεύγη του σταθμού F s (δεν έχουμε αλλάξει το αντί του 4. Τα αντίστοιχα ζεύγη που θα μπορούσαμε να δείξουμε στο παρελθόν (δεν είχαμε διαφοροποιήσει τα εξής: FA-AF, FB-BF, FC-CF, FD-DF γιατί το FG-GF είναι ασταθές.

Υπολογίζουμε τον Τάου του Κένταλ

Ο Τάου του Κένταλ δεν έχει κανένα μυστικό πέρα ​​από το να είναι το πηλίκο των σύμφωνων και ασυνεχών ζευγών ενός δείγματος παρατηρήσεων.

Ερμηνεία

Η αρχική μας ερώτηση ήταν: υπάρχει σχέση εξάρτησης μεταξύ των προτιμήσεων των σκιέρ κατάβασης και των σκανδιναβικών σκιέρ σε συγκεκριμένα χιονοδρομικά κέντρα;

Σε αυτήν την περίπτωση, έχουμε μια εξάρτηση μεταξύ των δύο μεταβλητών του 0,8695. Ένα αποτέλεσμα πολύ κοντά στο ανώτατο όριο. Αυτό το αποτέλεσμα μας λέει ότι οι αλπικοί σκιέρ (X) και οι σκανδιναβικοί σκιέρ (Z) έχουν ταξινομήσει τα θέρετρα με παρόμοιες ταξινομήσεις.

Χωρίς να πρέπει να κάνουμε οποιονδήποτε τύπο υπολογισμού, μπορούμε να δούμε ότι οι πρώτοι σταθμοί (A, B, C) λαμβάνουν τις καλύτερες βαθμολογίες από τις δύο ομάδες. Με άλλα λόγια, οι βαθμολογίες των σκιέρ ακολουθούν την ίδια κατεύθυνση.

Σύγκριση: Pearson εναντίον Kendall

Εάν υπολογίσουμε τον συντελεστή συσχέτισης του Pearson με δεδομένες τις προηγούμενες παρατηρήσεις και τον συγκρίνουμε με τον Tau του Kendall, λαμβάνουμε:

Σε αυτήν την περίπτωση, ο Tau του Kendall μας λέει ότι υπάρχει μια ισχυρότερη σχέση εξάρτησης μεταξύ των μεταβλητών X και Z σε σύγκριση με τον συντελεστή συσχέτισης του Pearson: 0,8695> 0,75.

Εάν τα outliers είχαν μεγάλη επιρροή στα αποτελέσματα, θα βρούμε μια μεγάλη διαφορά μεταξύ Pearson και Spearman και, επομένως, πρέπει να χρησιμοποιήσουμε το Spearman ως μέτρο εξάρτησης.