Τετραμετρική απόκλιση - Τι είναι, ορισμός και έννοια

Πίνακας περιεχομένων:

Anonim

Η απόκλιση τεταρτημόριου είναι ένα στατιστικό μέτρο διασποράς που επιστρέφει την κεντρική τιμή του εύρους μεταξύ των τεταρτημορίων και χρησιμοποιείται σε παραμορφωμένα σύνολα δεδομένων.

Με άλλα λόγια, η απόκλιση τεταρτημορίου είναι να υπολογίσει τη μέση τιμή του εύρους μεταξύ των τεταρτημορίων (IQR) και χρησιμοποιείται σε σύνολα δεδομένων με αρκετές ακραίες τιμές.

Η συντομογραφία για απόκλιση τεταρτημορίου είναι DQ.

Διατεταρτημοριακό εύρος

Το εύρος μεταξύ των τεταρτημορίων είναι ένα μέτρο διασποράς ενός συνόλου δεδομένων που χρησιμοποιείται γενικά στο διάγραμμα κουτιού. Με άλλα λόγια, το εύρος μεταξύ των τεταρτημορίων είναι η διαφορά μεταξύ του προτελευταίου και των πρώτων τεταρτημορίων μιας διανομής που χρησιμοποιείται στο διάγραμμα κουτιού.

IQR = Q3 - Q1

Το πλεονέκτημα της χρήσης του εύρους μεταξύ των τεταρτημορίων είναι ότι μπορεί να υπολογιστεί η απόκλιση τεταρτημορίου (DQ), η οποία είναι ένα πολύ κατάλληλο μέτρο διασποράς όταν έχουμε προκατειλημμένα σύνολα δεδομένων.

Τύπος τετραμερούς απόκλισης

Η απόκλιση τεταρτημόριου υπολογίζεται ως η διαίρεση του εύρους μεταξύ των τεταρτημορίων κατά 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Δεδομένου ότι εξετάζουμε μόνο τη διασπορά μεταξύ του τρίτου και του πρώτου τεταρτημορίου, αγνοούμε όλα τα δεδομένα εκτός αυτής της περιοχής. Και επομένως όλες οι τιμές είναι σχεδόν ακραίες. Επομένως, εάν διαιρέσουμε το εύρος μεταξύ των τεμαχίων με δύο, θα λάβουμε τη μέση τιμή της διασποράς.

Παράδειγμα απόκλισης τεταρτημορίου

Υποθέτουμε ότι θέλουμε να υπολογίσουμε το εύρος μεταξύ των τεταρτημόριων και την τεταρτημοριακή απόκλιση του αριθμού των ποδηλατών που περνούν το σπίτι μας κατά τη διάρκεια του έτους.

  1. Πρώτον, μετράμε τους ποδηλάτες και συλλέγουμε τις πληροφορίες σε έναν πίνακα.
  1. Δεύτερον, υπολογίζουμε το πρώτο και το τρίτο τεταρτημόριο για να αποκτήσουμε το εύρος μεταξύ των τεταρτημορίων.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. Τρίτον, υπολογίζουμε τη διασπορά τεταρτημορίου διαιρώντας απλώς το εύρος μεταξύ των τεταρτημορίων με δύο.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Το spread quartile για αυτό το σύνολο δεδομένων είναι 175. Αυτός ο αριθμός είναι η κεντρική τιμή του εύρους interquartile.

Είναι σημαντικό να σημειωθεί ότι τα δεδομένα για τον Ιούλιο είναι ακραία δεδομένα, καθώς είναι αρκετά φορές υψηλότερα από όλα τα άλλα δεδομένα. Θα μπορούσαμε λοιπόν να πούμε ότι αυτό το σύνολο δεδομένων είναι προκατειλημμένο προς αυτόν τον μήνα. Χάρη στην «άγνοια» της διασποράς του τεταρτημορίου προς ακραία δεδομένα, το αποτέλεσμα αυτού του μέτρου είναι πολύ παρόμοιο με το εάν κυκλοφορούσαν μόνο 600 ποδηλάτες τον Ιούλιο. Εάν υπήρχαν μόνο 600 ποδηλάτες τον Ιούλιο, η διασπορά του τεταρτημορίου θα ήταν 162,5, πολύ κοντά στους 175, λαμβάνοντας υπόψη ότι ο αριθμός των ποδηλατών τον μήνα αυτό είναι 10 φορές μικρότερος.