Ένα boxplot, από τα αγγλικά, boxplot, είναι μια αναπαράσταση μιας ποσοτικής ή κατηγορηματικής μεταβλητής με σκοπό την ταχεία αναγνώριση των τεταρτημορίων του συνόλου δεδομένων.
Με άλλα λόγια, ένα boxplot είναι ένα γράφημα που αντιπροσωπεύει μια ποσοτική ή ποιοτική μεταβλητή μέσω των τεταρτημορίων.
Στα στατιστικά στοιχεία, είναι ένα χρήσιμο εργαλείο για την εκπροσώπηση τόσο διακριτών όσο και συνεχών συνόλων δεδομένων.
Είναι σημαντικό να έχετε κατά νου ότι οι ποιοτικές μεταβλητές μεταβλητές ή που προορίζονται να αντιπροσωπεύουν μια παραγγελία ή μια κατηγορία πρέπει πάντα να συνδέονται με έναν αριθμητικό δείκτη μεγαλύτερο από 0, ώστε να μπορούν να εμφανίζονται στο γράφημα και να μπορούν να υπολογιστούν τα αντίστοιχα στατιστικά στοιχεία.
Οικόπεδο και ιστόγραμμα
Μια γραφική παράσταση κουτιού δεν είναι τίποτα περισσότερο από ένα ιστόγραμμα που φαίνεται από ψηλά, και με τον ίδιο τρόπο, ένα ιστόγραμμα είναι μια γραφική παράσταση κουτιού που φαίνεται από την πλευρά. Ένα παράδειγμα φαίνεται παρακάτω.
Το πρώτο χαρακτηριστικό που μοιράζονται και τα δύο γραφήματα είναι το ελάχιστο και το μέγιστο του συνόλου δεδομένων. Οι ακραίες ράβδοι μετά τις παύλες υποδεικνύουν την ελάχιστη (κάτω ράβδος) και τη μέγιστη (άνω ράβδος). Οι ακραίες τιμές θα εκπροσωπούνται εκτός του εύρους του μέγιστου και του ελάχιστου. Δηλαδή, πέρα από τις ράβδους μετά τις παύλες. Μπορούμε επίσης να βρούμε οριζόντια γραφήματα.
Με μια ματιά μπορείτε να δείτε ότι τα περισσότερα από τα δεδομένα επικεντρώνονται στις παρατηρήσεις κοντά στο ελάχιστο και στα δύο γραφήματα. Αυτό υποδηλώνεται από το διάγραμμα κουτιού στο οποίο το κουτί είναι πιο κοντά στο ελάχιστο από το μέγιστο. Αν κοιτάξουμε το ιστόγραμμα, θα δούμε ότι οι πιο συχνές παρατηρήσεις είναι οι παρατηρήσεις που είναι κοντά στο ελάχιστο και πολύ μακριά από το μέγιστο.
Πληροφορίες σχεδιαγράμματος κουτιού
Οι πληροφορίες που παρέχονται από το πλαίσιο είναι ως εξής:
- Το κάτω μέρος του κουτιού είναι το πρώτο τεταρτημόριο (Q1).
- Η ράβδος στη μέση του κουτιού είναι η διάμεση ή η δεύτερη τεταρτημόρια (Q2).
- Το πάνω μέρος του κουτιού είναι το τρίτο τεταρτημόριο (Q3).
- Το εύρος interquartile ή το IQR θα είναι το ύψος του κουτιού, δηλαδή η διαφορά μεταξύ Q3 και Q1.
Κλειδί οικόπεδο κουτιού
Αυτή η γραφική παράσταση ονομάζεται γραφική παράσταση επειδή μοιάζει με κουτί. Επομένως, για να θυμόμαστε αυτό το γράφημα, θα πρέπει να σκεφτούμε μόνο ένα τετράγωνο αντικείμενο ή ένα κουτί.
Για αναγνώστες που είναι εξοικειωμένοι με την τιμή των χρηματοοικονομικών περιουσιακών στοιχείων, θα δουν περισσότερη ομοιότητα με ένα κερί. Τα κεριά που βλέπετε στην προσφορά είναι γραφήματα προσαρμοσμένα στο επιλεγμένο παράθυρο ώρας.
Πλεονεκτήματα και μειονεκτήματα του οικοπέδου
Μεταξύ των πλεονεκτημάτων και των μειονεκτημάτων αυτού του διαγράμματος βρίσκουμε τα εξής:
Πλεονέκτημα
- Παγκοσμιοποιημένη όραση της απόλυτης συχνότητας μιας ποσοτικής ή ποιοτικής μεταβλητής.
- Γνώση των ελάχιστων, μέγιστων και τεταρτημορίων του συνόλου δεδομένων χωρίς να χρειάζεται να τα υπολογίσετε.
- Αναγνώριση ακραίων τιμών γρηγορότερα από ό, τι με ένα ιστόγραμμα επειδή οι ακραίες τιμές υποδεικνύονται με κύκλους εκτός του μέγιστου και του ελάχιστου.
Μειονεκτήματα
- Εάν το σύνολο δεδομένων είναι μικρό, κάνοντας μια γραφική παράσταση κουτιού για την έκφραση αυτών των δεδομένων θα γίνει πιο δύσκολο να κατανοηθεί.
Παράδειγμα κουτιού
Υποθέτουμε ότι θέλουμε να εκπροσωπήσουμε τον αριθμό των ποδηλατών που περνούν το σπίτι μας κατά τη διάρκεια ενός έτους. Πρώτον, μετράμε τους ποδηλάτες και συλλέγουμε τις πληροφορίες σε έναν πίνακα.
Μέσα από ορισμένα προγράμματα όπως το R ή το Excel μπορούμε να δημιουργήσουμε το γράφημα που φαίνεται παρακάτω.
Χάρη στην εκπροσώπηση του αριθμού των ποδηλατών μέσω της πλοκής κουτιού, μπορούμε γρήγορα να ενταχθούμε όπου βρίσκεται ο διάμεσος, τα άλλα τεταρτημόρια, το μέγιστο και το ελάχιστο. Σε αυτήν την περίπτωση δεν έχουμε άτυπα δεδομένα καθώς πέρα από το μέγιστο και το ελάχιστο δεν υπάρχει τίποτα.
Η εφαρμογή αυτού του τύπου γραφήματος είναι πολύ συχνή δεδομένης της απλότητας και της χρησιμότητάς της σε πολλούς τομείς πέρα από τη χρηματοδότηση και τα οικονομικά.