Εξόρυξη δεδομένων - Τι είναι, ορισμός και έννοια

Πίνακας περιεχομένων:

Εξόρυξη δεδομένων - Τι είναι, ορισμός και έννοια
Εξόρυξη δεδομένων - Τι είναι, ορισμός και έννοια
Anonim

Η εξόρυξη δεδομένων είναι η διαδικασία αναζήτησης μεγάλων βάσεων δεδομένων για την εύρεση χρήσιμων πληροφοριών που μπορούν να χρησιμοποιηθούν για τη λήψη αποφάσεων. Χρησιμοποιείται επίσης ο αγγλικός όρος "εξόρυξη δεδομένων".

Μπορεί να γίνει κατανοητό ως η τεχνολογία και το λογισμικό που χρησιμοποιούνται για την εύρεση μοτίβων συμπεριφοράς στη βάση δεδομένων. Η θεμελιώδης βάση για αυτό είναι ότι αυτά τα πρότυπα βοηθούν στη λήψη αποφάσεων. Για παράδειγμα, θα μπορούσε να βοηθήσει τις εταιρείες να κατανοήσουν τα πρότυπα συμπεριφοράς των πελατών τους. Με τέτοιο τρόπο ώστε να διευκολύνει τη χάραξη στρατηγικών για την αύξηση των πωλήσεων ή τη μείωση του κόστους.

Πλεονεκτήματα της εξόρυξης δεδομένων

Το θεμελιώδες πλεονέκτημα αυτής της διαδικασίας ανάλυσης δεδομένων είναι ο μεγάλος αριθμός επιχειρηματικών σεναρίων στα οποία μπορεί να εφαρμοστεί, για παράδειγμα έχουμε:

  • Προφητεία: Πρόβλεψη των πωλήσεων της εταιρείας.
  • Πιθανότητα: Επιλογή των καλύτερων πελατών για άμεση επαφή είτε μέσω τηλεφώνου είτε μέσω email.
  • Ανάλυση ακολουθίας: Ανάλυση των προϊόντων που έχουν αγοράσει οι πελάτες και ελέγξτε τη σχέση μεταξύ τους.

Στάδια εξόρυξης δεδομένων

Μέσα σε μια διαδικασία εξόρυξης δεδομένων μπορούμε να βρούμε πέντε φάσεις:

  • Στόχος και συλλογή δεδομένων: Το πρώτο απ 'όλα είναι να εστιάσουμε σε τι είδους πληροφορίες θέλουμε να λάβουμε. Ας φανταστούμε το παράδειγμα ότι ένα σούπερ μάρκετ θέλει να μάθει τι ώρα της ημέρας είναι εκεί όπου υπάρχει η μεγαλύτερη συμμετοχή πελατών. Αυτός θα ήταν ο στόχος και οι πληροφορίες που θέλει να λάβει το εμπόριο σε αυτήν την περίπτωση.
  • Επεξεργασία και διαχείριση δεδομένων: Μόλις γνωρίζουμε τα δεδομένα που θέλουμε να συλλέξουμε, θέτουμε τα δεδομένα σε λειτουργία. Αυτή είναι ίσως η πιο δύσκολη φάση της διαδικασίας. Λοιπόν, απαιτεί την επιλογή του αντιπροσωπευτικού δείγματος στο οποίο θα πραγματοποιηθεί η ανάλυση. Μόλις επιλεγεί το δείγμα, πρέπει να αναλυθεί τι είδους μεταβλητές ή μοντέλο παλινδρόμησης πρόκειται να πραγματοποιηθεί στο δείγμα.
  • Επιλογή μοντέλου: Συνδέεται στενά με την προηγούμενη φάση. Πρόκειται για τη δημιουργία ενός μοντέλου ή αλγορίθμου που μας δίνει το καλύτερο δυνατό αποτέλεσμα. Για να γίνει αυτό, πρέπει να πραγματοποιηθεί διεξοδική ανάλυση των μεταβλητών που θα συμπεριληφθούν στο μοντέλο. Αυτό γίνεται μια περίπλοκη εργασία, καθώς θα εξαρτηθεί από τον τύπο των πληροφοριών που θα αναλυθούν. Επομένως, οι ανθρακωρύχοι πραγματοποιούν διαφορετικές δοκιμές του αλγορίθμου όπως: γραμμική παλινδρόμηση, δέντρο αποφάσεων, χρονοσειρές, νευρωνικό δίκτυο κ.λπ.
  • Ανάλυση και αναθεώρηση των αποτελεσμάτων: Βασικά είναι να αναλύσουμε τα αποτελέσματα για να δούμε αν αποδίδουν μια λογική εξήγηση. Επεξήγηση που διευκολύνει τη λήψη αποφάσεων με βάση τις πληροφορίες που παρέχονται από τα αποτελέσματα.
  • Ενημέρωση μοντέλου: Το τελευταίο βήμα της διαδικασίας θα ήταν η ενημέρωση του μοντέλου. Είναι πολύ σημαντικό να γίνεται με την πάροδο του χρόνου, ώστε να μην είναι ξεπερασμένο. Οι μεταβλητές του μοντέλου θα μπορούσαν να γίνουν ασήμαντες και επομένως απαιτείται περιοδικός έλεγχος του μοντέλου.