Ανάλυση διακύμανσης - Τι είναι, ορισμός και έννοια

Ανάλυση διακύμανσης, ή ANOVA (ανάλυση διακύμανσης), είναι πολυπαραγοντικές τεχνικές ανάλυσης εξάρτησης που χρησιμοποιούνται για να προσδιοριστεί εάν υπάρχουν σημαντικές διαφορές μεταξύ των μέσων τριών ή περισσότερων ομάδων πληθυσμού.

Επομένως, με αυτήν την ανάλυση θα ανακαλύψουμε εάν υπάρχουν διαφορές μεταξύ συγκεκριμένων ομάδων όταν τροποποιούμε ένα ή περισσότερα χαρακτηριστικά. Για να το μάθουμε, χρησιμοποιούμε την τιμή του μέσου όρου των δεδομένων.

Η χρήση του είναι πολύ συχνή σε τομείς όπως τα οικονομικά ή η ιατρική.

Προηγούμενες παραδοχές της ανάλυσης διακύμανσης

Υπάρχουν ορισμένες προϋποθέσεις για την εκτέλεση του ANOVA που πρέπει να είναι γνωστό. Αυτά είναι απαραίτητα για να είναι τα αποτελέσματα επαρκή.

  • Πρώτον, ο πληθυσμός πρέπει να ακολουθεί μια κανονική κατανομή. Επομένως, έχουμε να κάνουμε με έναν τύπο παραμετρικής αντίθεσης, καθώς είναι γνωστές οι παράμετροι του μέσου όρου και της τυπικής απόκλισης.
  • Επιπλέον, τα δείγματα που χρησιμοποιούνται πρέπει να είναι ανεξάρτητα το ένα από το άλλο. Αυτό σημαίνει ότι μια τροποποίηση σε ένα από αυτά δεν πρέπει να επηρεάσει την αξία των άλλων.
  • Από την άλλη πλευρά, οι διαφορές των υπό μελέτη πληθυσμών πρέπει να είναι ίσες. Αυτό ονομάζεται ομοσβεστικότητα.

Ταξινόμηση της ανάλυσης μοντέλων διακύμανσης

Για την ανάλυση των μοντέλων διακύμανσης, μπορούν να χρησιμοποιηθούν οι παρακάτω τρεις ταξινομήσεις:

  • Μοντέλο σταθερών εφέ: Οι πληθυσμοί είναι φυσιολογικοί και διαφέρουν μόνο στην αξία των αντίστοιχων μέσων τους.
  • Μοντέλο τυχαίων εφέ: Σε αυτήν την περίπτωση, τα δεδομένα έχουν ιεραρχία και οι πληθυσμιακές διαφορές εξαρτώνται από αυτό.
  • Μοντέλο μικτών εφέ: Θα αντιμετωπίζαμε ένα μοντέλο που είναι ένα μείγμα των δύο προηγούμενων.

Παράδειγμα ANOVA: σημαντικές έννοιες

Υπάρχουν μαθηματικές εξισώσεις κάποιας πολυπλοκότητας για την εκτέλεση του ANOVA. Ωστόσο, στο Economy-Wiki.com επιλέγουμε την απλή οικονομία και, επομένως, και εκμεταλλευόμενοι την τεχνολογία, θα δείξουμε πώς θα μπορούσε να γίνει σε ένα υπολογιστικό φύλλο.

Ας υποθέσουμε ότι θέλουμε να μάθουμε αν υπάρχουν σημαντικές διαφορές μεταξύ των αναγνωστών του Economy-Wiki.com, με βάση τη συνάφεια του πτυχίου τους με τα οικονομικά.

Προειδοποίηση: Τα δεδομένα που θα χρησιμοποιήσουμε είναι εικονικά.

Πρέπει να μεταβούμε στα δεδομένα, στην ανάλυση δεδομένων και θα επιλέξουμε την ανάλυση της διακύμανσης ενός παράγοντα.

Η κατάταξη θα ήταν ο πίνακας των τριών ομάδων. Μπορεί να είναι πιο ενδιαφέρον να συμπεριλάβετε τις επικεφαλίδες μετά και να δώσετε την επιθυμητή μορφοποίηση. Στην περίπτωσή μας, με το λογότυπο και το μπλε χρώμα.

Βλέπουμε ότι υπάρχουν κάποιες έννοιες όπως βαθμοί ελευθερίας και πιθανότητα ή σημασία. Το πρώτο υπολογίζεται αυτόματα και είναι ο αριθμός των ομάδων μείον μία. Το δεύτερο μας λέει αν οι διαφορές είναι σημαντικές ή όχι.

Συνήθως ξεκινάτε από ένα αποδεκτό επίπεδο εμπιστοσύνης. Στα οικονομικά είναι συνήθως 95% (0,95), το οποίο σχετίζεται με μια σημασία 0,05 (1-0.095). Έτσι, εάν αυτή η πιθανότητα ή η τιμή p είναι κάτω από την αποδεκτή σημασία, οι διαφορές είναι σημαντικές.

Σε αυτήν την περίπτωση, φαίνεται ότι ο βαθμός δεν επηρεάζει τον αριθμό των αναγνωστών (σημασία> 0,05). Επομένως, η ανάλυση της απόκλισης φαίνεται να δείχνει ότι το Economy-Wiki.com ενδιαφέρει όλους, όχι μόνο εξειδικευμένους αναγνώστες. Φυσικά είναι εικονικά δεδομένα ή όχι;