Οι ερευνητές προτείνουν το LEAF, ένα frontend για την ανάπτυξη αλγορίθμων ταξινόμησης AI

Οι ερευνητές προτείνουν το LEAF, ένα frontend για την ανάπτυξη αλγορίθμων ταξινόμησης AI


Στη μηχανική εκμάθηση, οι τράπεζες φίλτρων mel – σταθερές, χειροκίνητες αναπαραστάσεις ήχου – χρησιμοποιούνται συχνά για την εκπαίδευση αλγορίθμων που ταξινομούν τον ήχο. Δεκαετίες μετά το σχεδιασμό των τραπεζών mel filter, η έρευνα δείχνει ότι εμφανίζουν μαθηματικές ιδιότητες που είναι επιθυμητές για εκμάθηση εκμάθησης. Με άλλα λόγια, αντιπροσωπεύουν ισχυρά χαρακτηριστικά ήχου. Ωστόσο, ο σχεδιασμός των τραπεζών φίλτρων mel είναι ελαττωματικός από την προκατάληψη και αυτές οι προκαταλήψεις μπορεί να είναι επιζήμιες για εργασίες που απαιτούν λεπτομερή ανάλυση σε υψηλές συχνότητες.

Σε ένα βήμα προς μια προηγμένη εναλλακτική λύση AI, οι ερευνητές της Google έχουν αναπτύξει ΦΥΛΛΟ, ένα frontend που διασπά τις τράπεζες φίλτρων mel σε διαφορετικά στοιχεία – φιλτράρισμα, ομαδοποίηση και συμπίεση / ομαλοποίηση – για να δημιουργήσει φαινομενικά ελάχιστα μοντέλα ταξινόμησης ήχου μεροληψίας. Οι ερευνητές λένε ότι το LEAF μπορεί να μάθει ένα μόνο σύνολο παραμέτρων που ξεπερνά τις τράπεζες φίλτρων, υποδηλώνοντας ότι μπορεί να χρησιμοποιηθεί για εργασίες ταξινόμησης ήχου γενικής χρήσης.

Η LEAF έχει πραγματικές επιπτώσεις, δεδομένου ότι η παγκόσμια αγορά αναγνώρισης ήχου εκτιμήθηκε σε 66,5 εκατομμύρια δολάρια το 2018, σύμφωνα με το Έρευνα Grand Look at. Εκτός από την αναγνώριση φωνής και ομιλίας, το η αίσθηση της ακοής έχει γίνει απαραίτητη στο AI Ο ήχος επιτρέπει στο AI να κατανοεί το περιβάλλον και να διακρίνει μεταξύ των διαφόρων γεγονότων που συμβαίνουν σε ένα περιβάλλον. Για παράδειγμα, σε περίπτωση εισβολής, ένα σύστημα διαχείρισης συμβάντων με ένα σύστημα τεχνητής νοημοσύνης τεχνολογία ανίχνευσης ήχου Θα μπορούσε να ανάψει τα φώτα και να παίξει δυνατή μουσική για να αποθαρρύνει μια παραβίαση, καθώς και να στείλει ειδοποιήσεις σε ιδιοκτήτες σπιτιού. Το LEAF θα μπορούσε να διευκολύνει τη δημιουργία τέτοιων τύπων προϊόντων χωρίς να χρειάζεται να δημιουργήσει επίπονα ήχους αναπαραστάσεων.

Στα πειράματα, οι ερευνητές χρησιμοποίησαν το LEAF για την ανάπτυξη ανεξάρτητων εποπτευόμενων μονών εργασιών σε οκτώ διαφορετικά προβλήματα ταξινόμησης, όπως η ταξινόμηση ακουστικής σκηνής, η ανίχνευση τραγουδιών πουλιών, η αναγνώριση συναισθημάτων, η αναγνώριση ηχείων, το μουσικό όργανο και η ανίχνευση τόνου, η αναγνώριση λέξεων-κλειδιών και η αναγνώριση γλώσσας. Λένε ότι τα μοντέλα που δημιουργήθηκαν με το LEAF έχουν ξεπεράσει σχεδόν όλες τις εναλλακτικές λύσεις ή ταιριάζουν με την ακρίβεια των άλλων frontends.

Στο εγγύς μέλλον, η ομάδα σκοπεύει να κυκλοφορήσει τον πηγαίο κώδικα για τα δικά τους μοντέλα και γραμμές βάσης, καθώς και προ-εκπαιδευμένα frontends. “Σε αυτό το άρθρο, υποστηρίζουμε ότι μια αξιόπιστη εναλλακτική λύση για τις τράπεζες φίλτρων για ταξινόμηση θα πρέπει να αξιολογείται σε πολλές δραστηριότητες και προτείνουμε την πρώτη σε βάθος μελέτη των μαθημάτων με δυνατότητα μάθησης για ήχο σε ένα ευρύ και ποικίλο εύρος ηχητικών σημάτων, συμπεριλαμβανομένης της ομιλίας , μουσική, ηχητικά γεγονότα και ήχοι ζώων “, έγραψαν σε ένα άρθρο που περιγράφει τη δουλειά τους.” Χωρίζοντας τις τράπεζες φίλτρων mel σε τρία συστατικά … προτείνουμε το LEAF, ένα νέο frontend που μπορεί να μάθει εντελώς σε όλες τις λειτουργίες του, ελεγχόμενο από μερικά εκατοντάδες παραμέτρους. [T]Αυτά τα αποτελέσματα επαναλαμβάνονται κατά την εκπαίδευση ενός διαφορετικού μοντέλου για κάθε μεμονωμένη δραστηριότητα. Επιβεβαιώνουμε αυτά τα αποτελέσματα ακόμη και σε ένα προκλητικό κριτήριο αναφοράς μεγάλης κλίμακας “.

VentureBeat

Η αποστολή της VentureBeat είναι να είναι ένα ψηφιακό τετράγωνο πόλης για τεχνικούς υπεύθυνους λήψης αποφάσεων για να αποκτήσουν πληροφορίες σχετικά με τη μετασχηματιστική τεχνολογία και τις συναλλαγές. Ο ιστότοπός μας παρέχει βασικές πληροφορίες σχετικά με τις τεχνολογίες δεδομένων και τις στρατηγικές για να σας καθοδηγήσει καθώς οδηγείτε τους οργανισμούς σας. Σας προσκαλούμε να γίνετε μέλος της κοινότητάς μας, για πρόσβαση:

  • ενημερωμένες πληροφορίες για θέματα που σας ενδιαφέρουν
  • τα ενημερωτικά δελτία μας
  • Περιεχόμενο περιφραγμένο με κορυφαία σκέψη και μειωμένη πρόσβαση στις πολύτιμες εκδηλώσεις μας, όπως το Rework
  • δυνατότητες δικτύωσης και άλλα

Γίνομαι μέλος



[via]