Τι είναι το Google DeepMind;

by Τζέρεμι Λουκκόνεν

Πόσο βαθιά μάθηση ενσωματώνεται στα προϊόντα που χρησιμοποιείτε

Το DeepMind μπορεί να αναφερθεί σε δύο πράγματα: την τεχνολογία πίσω από την τεχνητή νοημοσύνη της Google (AI) και την εταιρεία που είναι υπεύθυνη για την ανάπτυξη αυτής της τεχνητής νοημοσύνης. Η εταιρεία που ονομάζεται DeepMind είναι θυγατρική της Alphabet Inc., η οποία είναι και η μητρική εταιρεία της Google, και η τεχνολογία τεχνητής νοημοσύνης της DeepMind έχει βρεθεί σε πολλά έργα και συσκευές της Google .

Εάν χρησιμοποιείτε το Google Home ή το Google Assistant , τότε η ζωή σας έχει ήδη διασταυρωθεί με το Google DeepMind με μερικούς εκπληκτικούς τρόπους.

Πώς και γιατί η Google απέκτησε DeepMind;

Το DeepMind ιδρύθηκε το 2011 με στόχο την «επίλυση της νοημοσύνης και στη συνέχεια τη χρησιμοποίησή της για την επίλυση οτιδήποτε άλλο». Οι ιδρυτές αντιμετώπισαν το πρόβλημα της μηχανικής μάθησης εξοπλισμένης με στοιχεία για τη νευροεπιστήμη με στόχο τη δημιουργία ισχυρών αλγορίθμων γενικής χρήσης που θα μπορούσαν να μάθουν παρά να χρειάζεται να προγραμματιστούν.

Αρκετοί μεγάλοι παίκτες στον τομέα της AI είδαν το τεράστιο ταλέντο που συγκέντρωσε το DeepMind, με τη μορφή εμπειρογνωμόνων τεχνητής νοημοσύνης και ερευνητών, και το Facebook έκανε ένα παιχνίδι για να αποκτήσει την εταιρεία το 2012.

Η διαπραγμάτευση στο Facebook υποχώρησε, αλλά η Google μπήκε και κέρδισε το DeepMind το 2014 για περίπου 500 εκατομμύρια δολάρια. Στη συνέχεια, η DeepMind έγινε θυγατρική της Alphabet Inc. κατά τη διάρκεια της εταιρικής αναδιάρθρωσης της Google που έλαβε χώρα το 2015 .

Ο κύριος λόγος της Google για την αγορά DeepMind ήταν να ξεκινήσει τη δική της έρευνα τεχνητής νοημοσύνης. Ενώ η κύρια πανεπιστημιούπολη του DeepMind παρέμεινε στο Λονδίνο, μετά την εξαγορά της Αγγλίας, αποστέλλεται μια εφαρμοσμένη ομάδα στα κεντρικά γραφεία της Google στο Mountain View της Καλιφόρνιας για να ενσωματώσει το DeepMind AI σε προϊόντα της Google.

Τι κάνει το Google με το DeepMind;

Ο στόχος της DeepMind για την επίλυση της νοημοσύνης δεν άλλαξε όταν παρέδωσαν τα κλειδιά στην Google. Οι εργασίες συνεχίστηκαν σε βαθιά εκμάθηση , η οποία είναι ένας τύπος μηχανογραφικής μάθησης που δεν είναι συγκεκριμένης εργασίας. Αυτό σημαίνει ότι το DeepMind δεν προγραμματίζεται για μια συγκεκριμένη εργασία, σε αντίθεση με τα προηγούμενα AIs.

Για παράδειγμα, η Deep Blue της IBM κατάφερε να νικήσει τον σκακίστα Grandmaster Gary Kasparov. Ωστόσο, το Deep Blue σχεδιάστηκε για να εκτελεί αυτή τη συγκεκριμένη λειτουργία και δεν ήταν χρήσιμο εκτός αυτού του ενός σκοπού. Το DeepMind, από την άλλη πλευρά, έχει σχεδιαστεί για να μαθαίνει από την εμπειρία, η οποία θεωρητικά το καθιστά χρήσιμο σε πολλές διαφορετικές εφαρμογές.

Η τεχνητή νοημοσύνη του DeepMind έχει μάθει πώς να παίξει νωρίς τα βιντεοπαιχνίδια, όπως το Breakout, καλύτερα από τους καλύτερους ανθρώπινους παίκτες, και ένα πρόγραμμα υπολογιστή Go που τροφοδοτείται από το DeepMind κατάφερε να νικήσει τον παίκτη του πρωταθλητή Go πέντε στο μηδέν.

Εκτός από την καθαρή έρευνα, η Google ενσωματώνει επίσης το DeepMind AI στα προϊόντα της ναυαρχίδας και τα καταναλωτικά προϊόντα όπως τα τηλέφωνα Home και Android.

Πώς το Google DeepMind επηρεάζει την καθημερινή σας ζωή;

Τα εργαλεία βαθιάς εκμάθησης της DeepMind έχουν εφαρμοστεί σε όλο το φάσμα των προϊόντων και των υπηρεσιών της Google, οπότε αν χρησιμοποιήσετε την Google για οτιδήποτε, υπάρχει μια καλή πιθανότητα να έχετε αλληλεπιδράσει με το DeepMind με κάποιο τρόπο.

Ορισμένες από τις πιο σημαντικές τοποθεσίες DeepMind AI έχουν χρησιμοποιηθεί για αναγνώριση ομιλίας, αναγνώριση εικόνων, ανίχνευση απάτης, ανίχνευση και αναγνώριση ανεπιθύμητων μηνυμάτων, αναγνώριση χειρόγραφου, μετάφραση, Street View και ακόμη και τοπική αναζήτηση.

Η υπερβολική ακρίβεια αναγνώρισης ομιλίας της Google

Η αναγνώριση ομιλίας ή η ικανότητα του υπολογιστή να ερμηνεύει ομιλούμενες εντολές, υπήρξε εδώ και πολύ καιρό, αλλά οι συμπαθείς του Siri , Cortana , Alexa και Βοηθός Google έχουν φέρει όλο και περισσότερο στην καθημερινότητά μας.

Στην περίπτωση της τεχνολογίας αναγνώρισης φωνής της Google, η βαθιά εκμάθηση έχει χρησιμοποιηθεί με μεγάλη επιτυχία. Στην πραγματικότητα, η εκμάθηση μηχανών επέτρεψε στην Google να αναγνωρίσει φωνή για να επιτύχει ένα εκπληκτικό επίπεδο ακρίβειας για την αγγλική γλώσσα, μέχρι το σημείο που είναι εξίσου ακριβές με το ανθρώπινο ακροατή.

Εάν διαθέτετε συσκευές Google, όπως τηλέφωνο Android ή Google Home, αυτό έχει μια άμεση, πραγματική εφαρμογή στη ζωή σας. Κάθε φορά που λέτε "Εντάξει, Google" ακολουθούμενη από μια ερώτηση, το DeepMind κάμπτεται στους μυς του για να βοηθήσει τον Βοηθό του Google να καταλάβει τι λέτε.

Αυτή η εφαρμογή της μηχανικής μάθησης στην αναγνώριση ομιλίας έχει έναν πρόσθετο αντίκτυπο που ισχύει ειδικά για το Google Home. Σε αντίθεση με την Alexa του Αμαζονίου, η οποία χρησιμοποιεί οκτώ μικρόφωνα για την καλύτερη κατανόηση των φωνητικών εντολών, η αναγνώριση φωνής της Google Home με DeepMind χρειάζεται μόνο δύο.

Αρχική σελίδα και Βοηθητική φωνητική δημιουργία Google

Η παραδοσιακή σύνθεση ομιλίας χρησιμοποιεί κάτι που ονομάζεται concatenative word-to-speech (TTS). Όταν αλληλεπιδράτε με μια συσκευή που χρησιμοποιεί αυτή τη μέθοδο σύνθεσης ομιλίας, συμβουλεύεται μια βάση δεδομένων γεμάτη θραύσματα ομιλίας και τα συγκεντρώνει σε λέξεις και προτάσεις. Αυτό οδηγεί σε παράξενες φράσεις, και είναι συνήθως αρκετά σαφές ότι δεν υπάρχει άνθρωπος πίσω από τη φωνή.

Το DeepMind αντιμετώπισε την παραγωγή φωνής με ένα έργο που ονομάζεται WaveNet. Αυτό επιτρέπει σε φωνές τεχνητά δημιουργούμενες, όπως αυτή που ακούτε όταν μιλάτε στο σπίτι σας στο Google ή στο βοηθό Google στο τηλέφωνό σας, να ακούγεται πολύ φυσικό.

Το WaveNet βασίζεται επίσης σε δείγματα πραγματικής ανθρώπινης ομιλίας, αλλά δεν τα χρησιμοποιεί για να συνθέσει τίποτα άμεσα. Αντ 'αυτού, αναλύει τα δείγματα της ανθρώπινης ομιλίας για να μάθει πώς λειτουργούν οι ακατέργαστες κυματομορφές ήχου. Αυτό του επιτρέπει να εκπαιδεύεται για να μιλάει διαφορετικές γλώσσες, να χρησιμοποιεί τόνους ή ακόμα και να εκπαιδεύεται για να ακούγεται σαν ένα συγκεκριμένο άτομο.

Σε αντίθεση με άλλα συστήματα TTS, το WaveNet παράγει επίσης μη ομιλούντες ήχους, όπως η αναπνοή και το χτύπημα των χείλη, γεγονός που μπορεί να το κάνει πιο ρεαλιστικό.

Αν θέλετε να ακούσετε τη διαφορά ανάμεσα σε μια φωνή που παράγεται από το concatenative κείμενο σε ομιλία και ένα που παράγεται από το WaveNet, το DeepMind έχει μερικά πολύ ενδιαφέροντα δείγματα φωνής που μπορείτε να ακούσετε.

Βαθιά μάθηση και αναζήτηση φωτογραφιών Google

Χωρίς τεχνητή νοημοσύνη, η αναζήτηση εικόνων βασίζεται σε ενδείξεις περιβάλλοντος όπως ετικέτες, περιβάλλοντα κείμενα σε ιστότοπους και ονόματα αρχείων. Με τα βαθιά εργαλεία εκμάθησης της DeepMind, η αναζήτηση Google Photos μπόρεσε πραγματικά να μάθει τι μοιάζει με τα πράγματα, επιτρέποντάς σας να αναζητάτε τις δικές σας εικόνες και να λαμβάνετε σχετικά αποτελέσματα χωρίς να χρειάζεται να επισημάνετε τίποτα.

Για παράδειγμα, μπορείτε να αναζητήσετε "σκύλο" και θα τραβήξει φωτογραφίες του σκύλου σας που πήρατε, παρόλο που ποτέ δεν τους έχετε επισημάνει. Αυτό συμβαίνει επειδή μπόρεσε να μάθει τι μοιάζουν με τα σκυλιά, με τον ίδιο τρόπο που οι άνθρωποι μαθαίνουν πώς μοιάζουν τα πράγματα. Και, σε αντίθεση με το obsessed Deep Dream της Google, είναι περισσότερο από 90 τοις εκατό ακριβές στον εντοπισμό όλων των ειδών διαφορετικών εικόνων.

DeepMind στο Google Lens και στην οπτική αναζήτηση

Μια από τις πιο εντυπωσιακές επιπτώσεις που έχει κάνει το DeepMind είναι το Google Lens. Αυτό είναι ουσιαστικά μια μηχανή οπτικής αναζήτησης που σας επιτρέπει να τραβήξετε μια εικόνα από κάτι στον πραγματικό κόσμο και να τραβήξετε αμέσως πληροφορίες σχετικά με αυτό. Και δεν θα λειτουργούσε χωρίς DeepMind.

Ενώ η εφαρμογή είναι διαφορετική, αυτό είναι παρόμοιο με τον τρόπο που χρησιμοποιείται η βαθιά εκμάθηση στην αναζήτηση εικόνων στο Google+. Όταν τραβάτε μια φωτογραφία, το Google Lens είναι σε θέση να το εξετάσει και να καταλάβει τι είναι. Βάσει αυτού, μπορεί να εκτελέσει διάφορες λειτουργίες.

Για παράδειγμα, εάν τραβήξετε μια φωτογραφία ενός διάσημου ορόσημου, θα σας προμηθεύσει πληροφορίες σχετικά με το ορόσημο ή εάν τραβήξετε μια φωτογραφία ενός τοπικού καταστήματος, μπορείτε να τραβήξετε πληροφορίες σχετικά με αυτό το κατάστημα. Αν η εικόνα περιλαμβάνει έναν αριθμό τηλεφώνου ή μια διεύθυνση ηλεκτρονικού ταχυδρομείου, το Google Lens μπορεί επίσης να το αναγνωρίσει και θα σας δώσει τη δυνατότητα να καλέσετε τον αριθμό ή να στείλετε ένα μήνυμα ηλεκτρονικού ταχυδρομείου.