Επιστήμη δεδομένων - Τι είναι, ορισμός και έννοια
Η επιστήμη δεδομένων είναι ένας κλάδος που μελετά από πού προέρχεται μια συγκεκριμένη βάση πληροφοριών. Συζητά επίσης πώς μπορούν αυτοί οι πόροι να ερμηνευθούν και να αναπαρασταθούν για παραγωγική χρήση.
Δηλαδή, η επιστήμη δεδομένων σχετίζεται με τη διαχείριση βάσεων δεδομένων, αποθηκευμένων σε ψηφιακά αρχεία, από τα οποία μπορούν να εξαχθούν πολλές χρήσιμες πληροφορίες ως στατιστικοί δείκτες. Αυτά μπορούν να βοηθήσουν, για παράδειγμα, μια εταιρεία στη λήψη επιχειρηματικών αποφάσεων.
Ομοίως, η επιστήμη δεδομένων παρέχει εργαλεία που επιτρέπουν όχι μόνο να ερμηνεύουν, αλλά επίσης να αντιπροσωπεύουν, για παράδειγμα, σε εικόνες, τα διαθέσιμα δεδομένα. Έτσι, έχουμε το ιστόγραμμα, το διάγραμμα ράβδων, το γράφημα πίτας, μεταξύ άλλων.
Όπως μπορούμε να συμπεράνουμε, αυτή η επιστήμη είναι διεπιστημονική, δεδομένου ότι καλύπτει κυρίως τις γνώσεις των μαθηματικών, των στατιστικών και της πληροφορικής.
Επιστήμη δεδομένων και τύποι δεδομένων
Πρέπει επίσης να σημειωθεί ότι η επιστήμη δεδομένων μπορεί να λειτουργήσει με δύο τύπους δεδομένων:
- Δομημένος: Είναι αυτοί που είναι οργανωμένοι, όπως αυτοί οι πίνακες με διαφορετικές στήλες, καθένας με διαφορετική κατηγορία όπως: όνομα, επώνυμο, ηλικία, αριθμός εγγράφου ταυτότητας κ.λπ.
- Μη δομημένο: Εκείνα που δεν αντιστοιχούν σε μια συγκεκριμένη μορφή, όπως ένα ελεύθερα γραμμένο κείμενο. Σε αυτήν την περίπτωση, πρέπει να ερμηνεύσετε το περιεχόμενο και να εξαγάγετε δεδομένα που μπορούν να διαχειριστούν.
Λαμβάνοντας υπόψη όλα όσα έχουν εξηγηθεί, οι επαγγελματίες που ειδικεύονται στην επιστήμη των δεδομένων πρέπει όχι μόνο να έχουν αναλυτικές δεξιότητες, αλλά πρέπει να είναι σε θέση να κοινοποιούν το περιεχόμενο των πληροφοριών που έχουν επεξεργαστεί.
Σημασία της επιστήμης δεδομένων
Η επιστήμη δεδομένων είναι σημαντική για εταιρείες ή ιδρύματα που πρέπει να συνεργάζονται με μεγάλο αριθμό δεδομένων. Έτσι, αυτά μπορούν να γίνουν πολύτιμες πληροφορίες.
Μπορούμε να συσχετίσουμε την επιστήμη δεδομένων με τα Big Data, η οποία αποτελείται από την ανάπτυξη μηχανισμών ικανών να επεξεργάζονται και να διαχειρίζονται τεράστια δεδομένα που προέρχονται από διάφορες πηγές. Ο στόχος είναι να τις μετατρέψουμε σε πληροφορίες ικανές να ερμηνευτούν από τον άνθρωπο και που τον βοηθά στη λήψη αποφάσεων.
Αυτά τα δεδομένα προς επεξεργασία μπορεί να προέρχονται από συναλλαγές μεταξύ ατόμων και οργανισμών (όπως τραπεζικές πράξεις), καθημερινές ενέργειες ατόμων (όπως αναζητήσεις στο Διαδίκτυο), μηχανήματα (όπως το GPS του κινητού τηλεφώνου που καταγράφει την τοποθεσία του χρήστη) ή πληροφορίες βιομετρικά (όπως δακτυλικό αποτύπωμα).
Ιστορία της επιστήμης δεδομένων
Μπορούμε να πούμε ότι ο Αμερικανός στατιστικός John Wilder Tukey πρωτοστάτησε στην επιστήμη των δεδομένων στη δεκαετία του 1960, τονίζοντας τη σημασία της ανάλυσης δεδομένων αντί να δοκιμάσει στατιστικά μοντέλα.
Ωστόσο, μόλις το 1996 ο όρος επιστήμη δεδομένων χρησιμοποιήθηκε για πρώτη φορά στον τίτλο μιας διάλεξης, στην ομιλία με τίτλο: «Επιστήμη δεδομένων, ταξινόμηση και συναφείς μέθοδοι». Αυτό, στο πλαίσιο της συνάντησης των μελών της «Διεθνούς Ομοσπονδίας Εταιρειών Ταξινόμησης» (IFCS) που πραγματοποιήθηκε στο Κόμπε της Ιαπωνίας.
Ένα άλλο σημαντικό ορόσημο ήρθε το 2005, όταν το "Εθνικό Συμβούλιο Επιστημών" δημοσίευσε "Συλλογές Ψηφιακών Δεδομένων που Ενεργούν την Έρευνα και την Εκπαίδευση στον 21ο αιώνα". Σε αυτό το έγγραφο, οι επιστήμονες δεδομένων ορίζονται ως εμπειρογνώμονες υπολογιστών, προγραμματιστές βάσεων δεδομένων και λογισμικού και επαγγελματίες από άλλους κλάδους (όπως βιβλιοθηκονόμοι και αρχειοθέτες), οι οποίοι είναι ζωτικής σημασίας για την επιτυχή διαχείριση μιας ψηφιακής συλλογής δεδομένων.
Ωστόσο, αυτό είναι ακόμη ένα πεδίο μελέτης που βρίσκεται ακόμη σε εξέλιξη.