Απλή συνάρτηση αυτοσυσχέτισης - Παράδειγμα στο R

Πίνακας περιεχομένων:

Απλή συνάρτηση αυτοσυσχέτισης - Παράδειγμα στο R
Απλή συνάρτηση αυτοσυσχέτισης - Παράδειγμα στο R
Anonim

Με άλλα λόγια, η συνάρτηση Simple Autocorrelation (FAS), ή από τα αγγλικά, Λειτουργία αυτοσυσχέτισης, Είναι μια μαθηματική συνάρτηση που μας βοηθά να γνωρίζουμε πόσο εξαρτάται τα δεδομένα μιας δεδομένης περιόδου από τα ίδια δεδομένα από τις προηγούμενες περιόδους.

Δημιουργούμε μια ετήσια χρονική σειρά Χ που ακολουθεί μια κανονική κατανομή συν μια αδράνεια. Μπορούμε επίσης να χρησιμοποιήσουμε πραγματικά δεδομένα.

Μεθοδολογία

Τα προγράμματα είναι απαραίτητα για την επεξεργασία της αυτοσυσχέτισης ανάλυσης. Προγράμματα όπως το Python μπορούν να χρησιμοποιηθούν, αλλά για στατιστική ανάλυση και διαχείριση δεδομένων προτείνουμε το R, ή τη βελτιωμένη έκδοσή του, το R Studio. Εδώ θα συνεργαστούμε με τον R.

Υπολογισμός

Και πώς γράφουμε τον τύπο FAS στον κώδικα R;

Τόσο το R όσο και το Python έχουν βιβλιοθήκες όπου οι τύποι συνδέονται με ένα όνομα. Τότε αρκεί να έχουμε εγκαταστήσει τη βιβλιοθήκη που περιέχει τον τύπο που θέλουμε να χρησιμοποιήσουμε και να την ονομάσουμε στο σενάριο.

Στο quion του R πρέπει να γράψουμε:

Η λειτουργία εικ είναι μέσα στη βιβλιοθήκη στατιστικά.

Χ -> Χρονικές σειρές που χρησιμοποιούμε ως δείγμα για τον υπολογισμό του FAS.

acf (X, ylim = c (-1,1)) -> Απλή συνάρτηση αυτοσυσχέτισης στο Χ με όρια στον κατακόρυφο άξονα μεταξύ -1 και 1, οι οποίες είναι οι τιμές που μπορεί να πάρει ο συντελεστής αυτοσυσχέτισης.

Επαλήθευση

Αυτό το βήμα δεν είναι απαραίτητο εάν έχουμε χρησιμοποιήσει τον προηγούμενο κώδικα, καθώς υπολογίζει το ίδιο το συγκρότημα εμπιστοσύνης.

Για να προσδιορίσουμε εάν οι υπολογισμένοι συντελεστές αυτοσυσχέτισης είναι στατιστικά σημαντικοί, θα πρέπει να καθορίσουμε ζώνες εμπιστοσύνης με τις κρίσιμες τιμές. Με αυτόν τον τρόπο, δεδομένου ενός ποσοστού σημασίας, μπορούμε να πούμε με στατιστική βεβαιότητα εάν υπάρχει ή όχι η παρουσία αυτοσυσχέτισης στα δεδομένα.

Με τον ίδιο τρόπο όπως ο συντελεστής συσχέτισης, ο συντελεστής αυτοσυσχέτισης προϋποθέτει επίσης κανονικότητα και, επομένως, θα υπολογίσουμε το διάστημα εμπιστοσύνης ως εξής:

Ορίζουμε τον έλεγχο υπόθεσης ως:

Με 95% εμπιστοσύνη με επίπεδο σημασίας 5%, βρίσκουμε το διάσημο 1,96 στους κανονικούς πίνακες. Η κρίσιμη τιμή δίνεται από:

Όπου η διακύμανση των συντελεστών δίνεται από την προσέγγιση:

Παρόλο που δίνουμε τον τύπο, σας συνιστούμε να χρησιμοποιείτε στατιστικά προγράμματα για μεγαλύτερη ακρίβεια και ταχύτητα.

Αποτέλεσμα

Όλες οι γραμμές που τελειώνουν εκτός της ζώνης εμπιστοσύνης σημαίνουν ότι οι χρονικές σειρές εμφανίζουν αυτοσυσχέτιση στην υποδεικνυόμενη περίοδο.

Έτσι, με βάση το γράφημα, βλέπουμε ότι υπάρχει παρουσία αυτοσυσχέτισης σε αυτή τη χρονική σειρά στις περιόδους που η γραμμή προεξέχει από την ασυνεχή ζώνη.

Η πρώτη γραμμή που βρίσκεται στο 0 και η φωτιά προς το 1 μπορεί να αγνοηθεί καθώς το t πρέπει να είναι αυστηρά μεγαλύτερο από το 0 και στην περίπτωση αυτή δεν είναι. Δεν έχει νόημα να κάνουμε όλα τα προηγούμενα βήματα για να μάθουμε την αυτοσυσχέτιση του τώρα με τώρα γιατί το γνωρίζουμε ήδη: ο συσχετισμός μιας μεταβλητής με τον εαυτό του είναι 1, οπότε έχουμε ήδη την απάντηση.