Μπαίνουμε στη ζώνη λυκόφως του AI μεταξύ στενού και γενικού AI

Μπαίνουμε στη ζώνη λυκόφως του AI μεταξύ στενού και γενικού AI


Με τις πρόσφατες εξελίξεις, η βιομηχανία τεχνολογίας αφήνει τα όρια της περιορισμένης τεχνητής νοημοσύνης (AI) και κινείται σε ένα ζώνη λυκόφατος, μια κακώς καθορισμένη περιοχή μεταξύ στενής και γενικής AI.

Μέχρι σήμερα, όλες οι δυνατότητες που αποδίδονται στη μηχανική μάθηση και την τεχνητή νοημοσύνη ανήκουν στη στενή κατηγορία AI. Ανεξάρτητα από το πόσο εξελιγμένο – από την αποτίμηση της ασφάλισης έως τον εντοπισμό απάτης έως τον έλεγχο ποιότητας της παραγωγής και εναέρια μάχη ή ακόμη και βοηθώντας έρευνα πυρηνικής σχάσης – κάθε αλγόριθμος μπόρεσε να εκπληρώσει μόνο έναν σκοπό. Αυτό σημαίνει μερικά πράγματα: 1) ένας αλγόριθμος που έχει σχεδιαστεί για να κάνει ένα πράγμα (για παράδειγμα, αναγνώριση αντικειμένων) δεν μπορεί να χρησιμοποιηθεί για οτιδήποτε άλλο (παίζοντας ένα βιντεοπαιχνίδι, για παράδειγμα), και 2) ανεξάρτητα από τον αλγόριθμο ” μαθαίνει “δεν μπορεί να μεταφερθεί αποτελεσματικά σε άλλον αλγόριθμο που έχει σχεδιαστεί για να εκπληρώνει έναν διαφορετικό συγκεκριμένο σκοπό. Για παράδειγμα, το AlphaGO, ο αλγόριθμος που ξεπέρασε τον παγκόσμιο πρωταθλητή στο παιχνίδι του Go, δεν μπορεί να παίξει άλλα παιχνίδια, παρά το γεγονός ότι αυτά τα παιχνίδια είναι πολύ πιο απλά.

Πολλά από τα σημερινά κορυφαία παραδείγματα τεχνητής νοημοσύνης χρησιμοποιούν μοντέλα βαθιάς μάθησης που εφαρμόζονται χρησιμοποιώντας τεχνητά νευρικά δίκτυα. Με την προσομοίωση συνδεδεμένων εγκεφαλικών νευρώνων, αυτά τα δίκτυα λειτουργούν σε μονάδες επεξεργασίας γραφικών (GPU), πολύ προηγμένους μικροεπεξεργαστές σχεδιασμένους να εκτελούν παράλληλα εκατοντάδες ή χιλιάδες διαδικασίες επεξεργασίας, εκατομμύρια φορές το δευτερόλεπτο. Τα πολυάριθμα επίπεδα στο νευρικό δίκτυο προορίζονται να μιμηθούν συνάψεις, αντανακλώντας τον αριθμό των παραμέτρων που πρέπει να αξιολογήσει ο αλγόριθμος. Τα μεγάλα νευρωνικά δίκτυα σήμερα μπορούν να έχουν 10 δισεκατομμύρια Παράμετροι. Οι λειτουργίες του μοντέλου προσομοιώνουν τον εγκέφαλο, διαδοχικές πληροφορίες από στρώμα σε στρώμα στο δίκτυο – κάθε επίπεδο αξιολογεί μια άλλη παράμετρο – για να βελτιώσει την αλγοριθμική έξοδο. Για παράδειγμα, στην επεξεργασία εικόνας, τα κατώτερα στρώματα μπορούν να αναγνωρίσουν άκρα, ενώ τα ανώτερα στρώματα μπορούν να προσδιορίσουν έννοιες σχετικές με έναν άνθρωπο, όπως σχήματα ή πρόσωπα.

(Πάνω: Νευρωνικά δίκτυα Deep Understanding. Πηγή: Lucy Studying in Περιοδικό Quanta.)

Ενώ είναι δυνατόν να επιταχυνθούν περαιτέρω αυτοί οι υπολογισμοί και να προστεθούν περισσότερα επίπεδα στο νευρωνικό δίκτυο για να εξυπηρετηθούν πιο εξελιγμένες εργασίες, υπάρχουν περιορισμοί που πλησιάζουν γρήγορα υπολογιστική δύναμη είναι κατανάλωση ενέργειας που περιορίζουν πόσο μακριά μπορεί να εκτελεστεί το τρέχον παράδειγμα. Αυτά τα όρια θα μπορούσαν να οδηγήσουν σε ένα άλλο “AI χειμώναΌπου οι τεχνολογικές προσδοκίες δεν ανταποκρίνονται στη διαφημιστική εκστρατεία, μειώνοντας έτσι τη μελλοντική εφαρμογή και επένδυση. Αυτό συνέβη δύο φορές στην ιστορία της τεχνητής νοημοσύνης – στη δεκαετία του 1980 και του 1990 – και κάθε φορά που ήταν απαραίτητο πολλά χρόνια για να το ξεπεράσουμε, περιμένοντας πρόοδο στην τεχνική ή τις δεξιότητες υπολογισμού.

Η αποφυγή ενός άλλου χειμώνα AI θα απαιτήσει επιπλέον υπολογιστική ισχύ, ίσως από εξειδικευμένους επεξεργαστές για λειτουργίες AI που βρίσκονται υπό ανάπτυξη και οι οποίοι θα πρέπει να είναι πιο αποτελεσματικοί και αποδοτικοί από τους GPU της τρέχουσας γενιάς, μειώνοντας παράλληλα την κατανάλωση ενέργειας. Δεκάδες εταιρείες εργάζονται σε νέα σχέδια επεξεργαστών που έχουν σχεδιαστεί για να επιταχύνουν τους αλγόριθμους που απαιτούνται για την AI ελαχιστοποιώντας ή εξαλείφοντας τα κυκλώματα που θα υποστηρίζουν άλλες χρήσεις. Ένας άλλος τρόπος για να αποφύγετε πιθανώς έναν χειμώνα AI απαιτεί μια αλλαγή παραδείγματος, που κινείται πέρα ​​από το τρέχον μοντέλο βαθιάς μάθησης / νευρωνικού δικτύου. Η περισσότερη υπολογιστική ισχύς και / ή η αλλαγή παραδείγματος θα μπορούσαν να οδηγήσουν σε μια αλλαγή πέρα ​​από την περιορισμένη AI στην «γενική AI», επίσης γνωστή ως γενική τεχνητή νοημοσύνη (AGI).

Αλλάζουμε

Σε αντίθεση με τους στενούς αλγόριθμους AI, οι γνώσεις που αποκτήθηκαν από το γενικό AI μπορούν να μοιραστούν και να αποθηκευτούν μεταξύ των στοιχείων του συστήματος. Σε ένα γενικό μοντέλο AI, ο αλγόριθμος που μπορεί να κερδίσει τα καλύτερα στον κόσμο στο Alpha Go θα μπορούσε να μάθει σκάκι ή οποιοδήποτε άλλο παιχνίδι. Το AGI έχει σχεδιαστεί ως ένα γενικά έξυπνο σύστημα που μπορεί να δράσει και να σκεφτεί πολύ παρόμοιο με τον άνθρωπο, αν και με την ταχύτητα των ταχύτερων συστημάτων υπολογιστών.

Μέχρι σήμερα, δεν υπάρχουν παραδείγματα συστήματος AGI, και οι περισσότεροι πιστεύουν ότι υπάρχει ακόμη πολύς δρόμος για να φτάσουμε σε αυτό το κατώφλι. Νωρίτερα φέτος, ο Geoffrey Hinton, καθηγητής στο Πανεπιστήμιο του Τορόντο, ο οποίος είναι πρωτοπόρος της βαθιάς μάθησης, παρατήρησα: “Υπάρχουν τρισεκατομμύρια συνάψεις σε ένα κυβικό εκατοστό του εγκεφάλου. Εάν υπάρχει γενική τεχνητή νοημοσύνη, [the system] θα απαιτούσε πιθανώς ένα τρισεκατομμύριο συνάψεις. “

Ωστόσο, υπάρχουν ειδικοί που πιστεύουν ότι η βιομηχανία είναι σημείο καμπής, μεταβαίνοντας από το στενό AI στο AGI. Σίγουρα υπάρχουν και εκείνοι που υποστηρίζουν ότι βλέπουμε ήδη ένα πρωταρχικό παράδειγμα συστήματος AGI στο πρόσφατα ανακοινωθέν GPT-3 νευρωνικό δίκτυο επεξεργασίας φυσικής γλώσσας (NLP). Ενώ τα συστήματα NLP συνήθως εκπαιδεύονται σε ένα μεγάλο σώμα κειμένου (αυτή είναι η εποπτευόμενη μαθησιακή προσέγγιση που απαιτεί κάθε κομμάτι δεδομένων να επισημαίνεται), η πρόοδος προς το AGI θα απαιτήσει μη εποπτευμένη βελτιωμένη μάθηση, στην οποία το Η τεχνητή νοημοσύνη εκτίθεται σε πολλά δεδομένα χωρίς ετικέτα και πρέπει να καταλάβει οτιδήποτε άλλο από μόνη της. Αυτό κάνει το GPT-3. μπορεί να μάθει από οποιοδήποτε κείμενο.

Το GPT-3 “μαθαίνει” με βάση μοτίβα που αποκαλύπτει σε δεδομένα που συλλέγονται από το Διαδίκτυο, από δημοσιεύσεις Reddit έως Wikipedia, φανταστικές θαυμαστές και άλλες πηγές. Με βάση αυτή τη μάθηση, το GPT-3 είναι ικανό πολλές διαφορετικές εργασίες χωρίς πρόσθετη εκπαίδευση, ικανή να παράγει συναρπαστικές αφηγήσεις, δημιουργήστε κωδικός υπολογιστή, αυτόματη συμπλήρωση εικόνων, μετάφραση μεταξύ γλωσσών και εκτέλεση μαθηματικοί υπολογισμοί, μεταξύ άλλων επιχειρήσεων, συμπεριλαμβανομένων ορισμένων που δεν είχαν προγραμματίσει οι δημιουργοί της. Αυτή η προφανής πολυλειτουργική ικανότητα δεν μοιάζει πολύ με τον ορισμό της περιορισμένης AI. Στην πραγματικότητα, είναι πολύ πιο γενικό σε λειτουργία.

Με 175 δισεκατομμύρια παράμετροι, το μοντέλο πηγαίνει πάνω από 10 δισεκατομμύρια στα πιο προηγμένα νευρωνικά δίκτυα και πάνω από 1,5 δισεκατομμύριο στον προκάτοχό του, GPT-2. Πρόκειται για μια αύξηση κατά 10 φορές μεγαλύτερη πολυπλοκότητα στο μοντέλο λίγο περισσότερο από ένα χρόνο. Πιθανώς, αυτό είναι το αρχείο μεγαλύτερο νευρωνικό δίκτυο ακόμα δημιουργήθηκε και πολύ πιο κοντά στο προτεινόμενο τρισεκατομμύριο επίπεδο του Hinton για το AGI. Το GPT-3 καταδεικνύει ότι αυτό που περνά για νοημοσύνη μπορεί να είναι συνάρτηση της υπολογιστικής πολυπλοκότητας, η οποία προκύπτει με βάση τον αριθμό των συνάψεων. Όπως προτείνει ο Hinton, όταν τα συστήματα τεχνητής νοημοσύνης γίνονται συγκρίσιμα σε μέγεθος με τον ανθρώπινο εγκέφαλο, θα μπορούσαν να γίνουν εξίσου έξυπνα με τους ανθρώπους. Αυτό το επίπεδο θα μπορούσε να επιτευχθεί νωρίτερα από το αναμενόμενο εάν σχέσεις των νευρωνικών δικτύων που φθάνουν με ένα τρισεκατομμύριο παραμέτρους είναι αλήθεια.

Ο μέσος τρόπος

Είναι λοιπόν το GPT-3 το πρώτο παράδειγμα ενός συστήματος AGI Αυτό είναι αμφισβητήσιμος, αλλά η συναίνεση είναι ότι δεν είναι AGI. Ωστόσο, δείχνει ότι η μεταφορά περισσότερων δεδομένων και περισσότερου χρόνου και η ισχύς επεξεργασίας στο πρότυπο βαθιάς μάθησης μπορεί να οδηγήσει σε εκπληκτικά αποτελέσματα. Το γεγονός ότι το GPT-3 αξίζει ακόμη και ένα “είναι αυτό το AGI” η συνομιλία δείχνει κάτι σημαντικό: σηματοδοτεί μια ριζική αλλαγή στην ανάπτυξη της AI.

Αυτό είναι εκπληκτικό, ειδικά λόγω της συναίνεσης πολλών Δημοσκοπήσεις εμπειρογνωμόνων AI υποδηλώνει ότι το AGI είναι ακόμη δεκαετίες στο μέλλον. Αν δεν υπάρχει τίποτα άλλο, το GPT-3 μας λέει ότι υπάρχει ένα μέσο έδαφος μεταξύ στενού και γενικού AI. Πιστεύω ότι το GPT-3 δεν ταιριάζει απόλυτα με τον ορισμό της περιορισμένης AI ή της γενικής AI. Αντ ‘αυτού, δείχνει ότι έχουμε προχωρήσει σε μια ζώνη λυκόφατος. Επομένως, το GPT-3 είναι ένα παράδειγμα αυτού που αποκαλώ “AI changeover”.

Αυτή η μετάβαση θα μπορούσε να διαρκέσει μόνο λίγα χρόνια ή θα μπορούσε να διαρκέσει δεκαετίες. Η πρώτη είναι δυνατή αν προχωρήσει νέα σχέδια τσιπ AI κινούνται γρήγορα και η νοημοσύνη προκύπτει πραγματικά από την πολυπλοκότητα. Ακόμα και χωρίς αυτό, η ανάπτυξη της τεχνητής νοημοσύνης κινείται γρήγορα, όπως αποδεικνύεται από περαιτέρω ευρήματα με φορτηγό χωρίς οδηγό είναι αυτόνομος μαχητής πίδακες.

Υπάρχει επίσης σημαντική συζήτηση σχετικά με το αν η επίτευξη γενικής τεχνητής νοημοσύνης είναι καλό. Όπως και με οποιαδήποτε προηγμένη τεχνολογία, η τεχνητή νοημοσύνη μπορεί να χρησιμοποιηθεί για την επίλυση προβλημάτων ή για κακόβουλους σκοπούς. Το AGI θα μπορούσε να οδηγήσει σε έναν πιο ουτοπικό κόσμο ή μεγαλύτερη δυστοπία. Οι πιθανότητες είναι ότι θα είναι και οι δύο και φαίνεται ότι θα φτάσει πολύ νωρίτερα από το αναμενόμενο.

Ο Gary Grossman είναι Ανώτερος Αντιπρόεδρος Τεχνολογικής Πρακτικής στο Έντελμαν και παγκόσμιος επικεφαλής του Edelman AI Heart of Excellence.





[via]

Απάντηση

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει τα ανεπιθύμητα σχόλια. Μάθετε πώς υφίστανται επεξεργασία τα δεδομένα των σχολίων σας.