Τι ακριβώς είναι τα "μεγάλα δεδομένα";

Και γιατί είναι μια μεγάλη διαπραγμάτευση;

Τα «μεγάλα δεδομένα» είναι η νέα επιστήμη της κατανόησης και της πρόβλεψης της ανθρώπινης συμπεριφοράς, μελετώντας μεγάλους όγκους αδόμητων δεδομένων. Τα μεγάλα δεδομένα είναι επίσης γνωστά ως «προγνωστικά στοιχεία».

Αναλύοντας τις δημοσιεύσεις Twitter, τις ροές Facebook, τις αναζητήσεις μέσω eBay, τις συσκευές παρακολούθησης GPS και τις μηχανές ATM, είναι μερικά μεγάλα παραδείγματα δεδομένων. Η μελέτη των βίντεο ασφαλείας, των δεδομένων κίνησης, των καιρικών συνόλων, των αφίξεων πτήσης, των κορμών του πύργου κυττάρων και των ιχνηλατών καρδιακού ρυθμού είναι άλλες μορφές. Τα μεγάλα δεδομένα είναι μια ακατάστατη νέα επιστήμη που αλλάζει κάθε εβδομάδα και μόνο λίγοι ειδικοί το καταλαβαίνουν όλα.

Ποια είναι μερικά παραδείγματα μεγάλων δεδομένων στην τακτική ζωή;

screenshot http://project.wnyc.org/transit-time

Ενώ τα περισσότερα μεγάλα έργα δεδομένων είναι πολύ ασαφή, υπάρχουν επιτυχημένα παραδείγματα μεγάλων δεδομένων που επηρεάζουν την καθημερινή ζωή των ατόμων, των εταιρειών και των κυβερνήσεων:

Προβλέποντας την έκρηξη των ιών: Μελετώντας τα κοινωνικοπολιτικά δεδομένα, τα δεδομένα για το καιρό και το κλίμα και τα νοσοκομειακά / κλινικά δεδομένα, αυτοί οι επιστήμονες προβλέπουν τώρα εστίες πυρετού του δάγκειου πυρετού με προειδοποίηση 4 εβδομάδων.

Watch Homicide Watch: αυτό το μεγάλο έργο σχεδιάζει τα προφίλ θυμάτων δολοφονίας, ύποπτων και εγκληματιών στην Ουάσιγκτον, DC. Τόσο ως τρόπος για να τιμήσει τον αποθανόντα όσο και ως μέσο ενημέρωσης για τους ανθρώπους, αυτό το μεγάλο έργο δεδομένων είναι συναρπαστικό.

Διαμετακομιστικός Σχεδιασμός Διαμετακόμισης, NYC: Ο προγραμματιστής ραδιοφώνου WNYC Steve Melendez συνδύασε το χρονοδιάγραμμα του online μετρό με το λογισμικό διαδρομής ταξιδιού. Η δημιουργία του επιτρέπει στους New Yorkers να κάνουν κλικ στη θέση τους στον χάρτη και θα εμφανιστεί μια πρόβλεψη του χρόνου ταξιδιού για τρένα και μετρό.

Η Xerox μείωσε την απώλεια εργατικού δυναμικού: η εργασία στο τηλεφωνικό κέντρο είναι συναισθηματικά εξαντλητική. Η Xerox έχει μελετήσει αναφορές δεδομένων με τη βοήθεια επαγγελματιών αναλυτών και τώρα μπορούν να προβλέψουν ποιες προσλήψεις τηλεφωνικών κέντρων είναι πιθανό να παραμείνουν στην εταιρεία τη μεγαλύτερη.

Υποστήριξη της καταπολέμησης της τρομοκρατίας: Μελετώντας τα κοινωνικά μέσα, τα οικονομικά αρχεία, τις κρατήσεις πτήσεων και τα δεδομένα ασφαλείας, η επιβολή του νόμου μπορεί να προβλέψει και να εντοπίσει υπόπτους τρομοκρατών πριν κάνουν τις κακές πράξεις τους.

Προσαρμογή μάρκετινγκ μάρκας με βάση τα σχόλια των κοινωνικών μέσων : οι άνθρωποι απλά και γρήγορα μοιράζονται τις online σκέψεις τους σε ένα παμπ, εστιατόριο ή γυμναστήριο. Είναι δυνατή η μελέτη αυτών των εκατομμυρίων θέσεων κοινωνικών μέσων ενημέρωσης και η παροχή ανατροφοδότησης στην εταιρεία σχετικά με το τι σκέφτονται οι άνθρωποι για τις υπηρεσίες τους.

Ποιος χρησιμοποιεί μεγάλα δεδομένα; Τι κάνουν με αυτό;

Πολλές μονολιθικές εταιρείες χρησιμοποιούν μεγάλα δεδομένα για να προσαρμόσουν τις προσφορές τους και τις τιμές τους για να μεγιστοποιήσουν την ικανοποίηση των πελατών.

Γιατί είναι μεγάλα δεδομένα τόσο μεγάλη διαπραγμάτευση;

4 πράγματα κάνουν σημαντικά δεδομένα σημαντικά:

1. Τα δεδομένα είναι τεράστια. Δεν θα χωρέσει σε έναν σκληρό δίσκο , πολύ λιγότερο ένα stick USB . Ο όγκος των δεδομένων υπερβαίνει κατά πολύ αυτό που μπορεί να αντιληφθεί ο ανθρώπινος νους (σκεφτείτε ένα δισεκατομμύριο δισεκατομμύρια δισεκατομμύρια μίγματα, και στη συνέχεια πολλαπλασιάστε αυτό κατά περισσότερα δισεκατομμύρια).

2. Τα δεδομένα είναι ακατάστατα και αδόκιμα. Το 50% έως 80% της μεγάλης εργασίας δεδομένων μετατρέπει και καθαρίζει τις πληροφορίες έτσι ώστε να μπορεί να αναζητηθεί και να ταξινομηθεί. Μόνο μερικές χιλιάδες εμπειρογνώμονες στον πλανήτη μας ξέρουν πλήρως πώς να κάνουν αυτό το καθαρισμό δεδομένων. Αυτοί οι ειδικοί χρειάζονται επίσης πολύ εξειδικευμένα εργαλεία, όπως το HPE και Hadoop, για να κάνουν τη δουλειά τους. Ίσως σε 10 χρόνια, οι μεγάλοι εμπειρογνώμονες δεδομένων θα γίνουν δεκάδες, αλλά προς το παρόν είναι πολύ σπάνιο είδος αναλυτή και το έργο τους είναι ακόμα πολύ ασαφές και κουραστικό.

3. Τα δεδομένα έχουν γίνει εμπόρευμα ** που μπορεί να πωληθεί και να αγοραστεί. Υπάρχουν αγορές δεδομένων όπου εταιρείες και ιδιώτες μπορούν να αγοράζουν terabyte από κοινωνικά μέσα και άλλα δεδομένα. Τα περισσότερα δεδομένα είναι βασισμένα σε σύννεφο, καθώς είναι πολύ μεγάλα για να χωρέσουν σε οποιονδήποτε σκληρό δίσκο. Η αγορά δεδομένων συνήθως περιλαμβάνει συνδρομή συνδρομής όπου συνδέεστε σε μια εκμετάλλευση διακομιστών σύννεφο.

** Οι ηγέτες των μεγάλων εργαλείων και ιδεών δεδομένων είναι οι Amazon, Google, Facebook και Yahoo. Επειδή οι εταιρείες αυτές εξυπηρετούν τόσους πολλούς εκατομμύρια ανθρώπους με τις ηλεκτρονικές υπηρεσίες τους, έχει νόημα ότι θα είναι το σημείο συλλογής και οι οραματιστές πίσω από τις μεγάλες αναλύσεις δεδομένων.

4. Οι δυνατότητες των μεγάλων δεδομένων είναι ατελείωτες. Ίσως οι γιατροί μια μέρα να προβλέψουν καρδιακές προσβολές και εγκεφαλικά επεισόδια για άτομα εβδομάδες πριν συμβούν. Τα αεροπλάνα και τα αυτοκινητιστικά ατυχήματα ενδέχεται να μειωθούν με προβλέψεις αναλύσεων των μηχανικών τους δεδομένων και των μοντέλων κυκλοφορίας και καιρού. Η σε απευθείας σύνδεση χρονολόγηση μπορεί να βελτιωθεί με την ύπαρξη μεγάλων προγνωστικών δεδομένων για ποιοι είναι συμβατές προσωπικότητες για εσάς. Οι μουσικοί μπορεί να πάρουν μια εικόνα για το ποια μουσική σύνθεση είναι η πιο ευχάριστη για τις μεταβαλλόμενες προτιμήσεις του κοινού-στόχου. Οι διατροφολόγοι ίσως έχουν τη δυνατότητα να προβλέψουν ποιος συνδυασμός τροφίμων που αγοράζονται από τα καταστήματα θα επιδεινώσει ή θα βοηθήσει τις ιατρικές καταστάσεις ενός ατόμου. Η επιφάνεια είναι μόνο γδαρμένο, και ανακαλύψεις σε μεγάλα δεδομένα συμβαίνουν κάθε εβδομάδα.

Τα μεγάλα δεδομένα είναι ακατάστατα

Monty Rakusen / Getty

Τα μεγάλα δεδομένα είναι αναλυτικά στοιχεία πρόβλεψης: η μετατροπή μαζικών μη δομημένων δεδομένων σε κάτι που μπορεί να αναζητηθεί και να καθοριστεί. Πρόκειται για ένα βρώμικο και χαοτικό χώρο που απαιτεί ένα ιδιαίτερο είδος γνώσης και υπομονής.

Πάρτε για παράδειγμα την μονολιθική υπηρεσία παράδοσης UPS. Οι προγραμματιστές της UPS μελετούν δεδομένα από το GPS και τα smartphones των οδηγών τους για να αναλύσουν τους πιο αποτελεσματικούς τρόπους προσαρμογής στην κυκλοφοριακή συμφόρηση. Αυτά τα δεδομένα GPS και smartphone είναι γοργά και δεν είναι αυτόματα έτοιμα για ανάλυση. Αυτά τα δεδομένα εισάγονται από διάφορες βάσεις δεδομένων GPS και χάρτη μέσω διαφορετικών συσκευών υλικού smartphone. Οι αναλυτές της UPS έχουν περάσει μήνες μετατροπής όλων αυτών των δεδομένων σε μορφή που μπορεί εύκολα να αναζητηθεί και να ταξινομηθεί. Ωστόσο, η προσπάθεια αξίζει τον κόπο. Σήμερα, η UPS έσωσε πάνω από 8 εκατομμύρια γαλόνια καυσίμων από τότε που άρχισαν να χρησιμοποιούν αυτές τις μεγάλες αναλύσεις δεδομένων.

Επειδή τα μεγάλα δεδομένα είναι ακατάστατα και απαιτούν τόση προσπάθεια για να καθαριστούν και να προετοιμαστούν για χρήση, οι επιστήμονες των δεδομένων έχουν αποκαλυφθεί με την επωνυμία «φύλακες δεδομένων» για όλη την κουραστική δουλειά που κάνουν.

Η επιστήμη των μεγάλων δεδομένων και των προγνωστικών αναλύσεων βελτιώνεται κάθε εβδομάδα. Αναμείνετε τα μεγάλα δεδομένα για να έχετε πρόσβαση σε όλους έως το έτος 2025.

Δεν είναι μεγάλα δεδομένα μια διαρκή απειλή για την προστασία της ιδιωτικής ζωής;

Feingersh / Getty

Ναι, εάν οι νόμοι και τα προσωπικά μας προστατευτικά στοιχεία δεν προστατεύονται προσεκτικά, τότε τα μεγάλα δεδομένα εισέρχονται στην προσωπική ιδιωτική ζωή. Σήμερα, η Google, το YouTube και το Facebook παρακολουθούν ήδη τις καθημερινές σας συνήθειες στο διαδίκτυο . Η ζωή του smartphone και του υπολογιστή σας αφήνει καθημερινά ψηφιακά αποτυπώματα και εξελιγμένες εταιρείες μελετούν αυτά τα ίχνη.

Οι νόμοι γύρω από τα μεγάλα δεδομένα εξελίσσονται. Το απόρρητο είναι μια κατάσταση ύπαρξης που πρέπει τώρα να αναλάβετε προσωπική ευθύνη, καθώς δεν μπορείτε πλέον να την περιμένετε ως προεπιλεγμένο δικαίωμα.

Τι μπορείτε να κάνετε για να προστατέψετε την ιδιωτικότητά σας:

Το μεγαλύτερο μόνο βήμα που μπορείτε να κάνετε είναι να καλύψετε τις καθημερινές σας συνήθειες χρησιμοποιώντας μια σύνδεση δικτύου VPN . Μια υπηρεσία VPN θα ανακατεύει το σήμα σας έτσι ώστε η ταυτότητα και η τοποθεσία σας να καλύπτονται τουλάχιστον εν μέρει από τους ιχνηλάτες. Αυτό δεν θα σας κάνει 100% ανώνυμο, αλλά ένα VPN θα μειώσει σημαντικά πόσο ο κόσμος μπορεί να παρατηρήσει τις διαδικτυακές σας συνήθειες.

Πού μπορώ να μάθω περισσότερα για τα μεγάλα δεδομένα;

Monty Raskusen / Getty

Τα μεγάλα δεδομένα είναι ένα συναρπαστικό πράγμα για τους ανθρώπους με αναλυτικά μυαλά και την αγάπη για την τεχνολογία. Εάν είστε εσείς, επισκεφθείτε σίγουρα αυτή τη σελίδα ενδιαφέρουσα μεγάλη έργα δεδομένων.