Spotify ανοιχτού κώδικα Klio, ένα πλαίσιο έρευνας ήχου AI

Spotify ανοιχτού κώδικα Klio, ένα πλαίσιο έρευνας ήχου AI


Αυτή την εβδομάδα στο συνέδριο Διεθνούς Εταιρείας για Ανάκτηση Πληροφοριών για το 2020, Spotify ανοιχτής προέλευσης Κλίο, ένα οικοσύστημα που επιτρέπει στους επιστήμονες δεδομένων να επεξεργάζονται αρχεία ήχου (ή οποιαδήποτε δυαδικά αρχεία) εύκολα και σε μεγάλη κλίμακα. Κατασκευάστηκε για τη διαχείριση των συστημάτων ευφυΐας ήχου μεγάλης κλίμακας του Spotify και αξιοποιείται από τους μηχανικούς ήχους της εταιρείας για να βοηθήσει στην ανάπτυξη και την εφαρμογή αλγορίθμων ήχου επόμενης γενιάς.

Το Klio με βάση το Apache Beam επιτρέπει στους οργανισμούς να δημιουργούν συστήματα επεξεργασίας πολυμέσων που μοιράζονται εργαλεία και υποδομές μεταξύ συστημάτων παραγωγής και ερευνητικών ομάδων. Η αρχιτεκτονική της πλατφόρμας ενθαρρύνει επαναχρησιμοποιήσιμες εργασίες και κοινόχρηστη παραγωγή, μειώνοντας προφανώς το κόστος συντήρησης και επανυπολογισμού. Επιπλέον, το Klio υποστηρίζει τη συνεχή, καθοδηγούμενη από τα γεγονότα επεξεργασία ταχέως αναπτυσσόμενων καταλόγων περιεχομένου πολυμέσων, παρέχοντας στους μηχανικούς ένα πλαίσιο για την παραγωγή διαδικασιών επεξεργασίας και οργανισμών έναν τρόπο επεξεργασίας νέου περιεχομένου κατά την εισαγωγή.

“Το Klio είναι βασικά ένας τρόπος για να εμπλέκονται οι άνθρωποι και να κατασκευάζουν εξυπνότερους αγωγούς δεδομένων για κάθε τύπο μέσων”, δήλωσε ο Tyson Singer, αντιπρόεδρος της τεχνολογίας Spotify, σε τηλεφωνική συνέντευξη. “Επιτρέπει στους προγραμματιστές και τους ερευνητές να εργάζονται στα μέσα ενημέρωσης πιο αποτελεσματικά.”

Σύμφωνα με τον Singer, ο Klio είχε τη γέννησή του στην επιτάχυνση της μετάβασης του Spotify στην έρευνα που βασίζεται σε AI. Με την πάροδο των ετών, η εταιρεία έχει αρχίσει να αξιοποιεί την επεξεργασία φυσικών γλωσσών, μοντέλα ήχου και φίλτρα για να παρέχει προτάσεις και επιμέλεια λιστών αναπαραγωγής, όπως το Discovery Weekly και το Release Radar. Μόλις τον περασμένο Δεκέμβριο στην Ιαπωνία, το Spotify κυκλοφόρησε το Sing Alongside, μια λειτουργία που μοιάζει με καραόκε που χρησιμοποιεί το AI για να διαχωρίσει τα φωνητικά από ένα ορχηστρικό κομμάτι λίγα λεπτά μετά τη συμμετοχή ενός τραγουδιού στον κατάλογο. (Για τα συμφραζόμενα, 40.000 τραγούδια την ημέρα προστίθενται στη βάση δεδομένων του Spotify με πάνω από 60 εκατομμύρια τραγούδια που υποβάλλονται σε επεξεργασία σε τακτική βάση.)

“Αρχίσαμε να αντιμετωπίζουμε κάποιες προκλήσεις και περιορισμούς με τα υπάρχοντα εργαλεία μας”, δήλωσε ο Singer. «Ανησυχούσαμε αρκετά επειδή λάβαμε όλα αυτά τα σχόλια από τους ερευνητές μας που δεν ήταν πολύ χαρούμενοι. Δεν μπόρεσαν να είναι πολύ παραγωγικοί και χρειάστηκε πολύς χρόνος για να έχουν τον αντίκτυπο που ήθελαν. “

Οι εργασίες για το Klio, του οποίου το ομώνυμο είναι το Clio, η ελληνική μούσα της ιστορίας, ξεκίνησαν στις αρχές του 2019. Ένα πρωτότυπο έγινε το φθινόπωρο και, αργότερα μέσα στο έτος, το Klio έπαιξε καθοριστικό ρόλο στην έναρξη παραγωγή ταινίας μεγάλου μήκους από το Spotify. Τώρα, οι προγραμματιστές Spotify χρησιμοποιούν το Klio για να δημιουργήσουν αγωγούς που βασίζονται σε εσωτερικές εργασίες και αξιοποιούν API με πλήρεις δυνατότητες ήχου.

“Έχουμε πολλούς έξυπνους ερευνητές και κάνουν πολύ ωραία πράγματα με την ανάκτηση μουσικών πληροφοριών, όπου η μηχανή ακούει πραγματικά το τραγούδι και όχι μόνο ανθρώπινα αυτιά και προσπαθεί να μάθει από αυτό”, Lynn Root, ένας από τους μηχανικούς που οδήγησε το Το πρόγραμμα Klio, είπε στο VentureBeat. «Με το Klio, μπορείτε να κάνετε πολύ περισσότερη επεξεργασία ήχου και να το ρυθμίσετε έτσι ώστε να μην χρειάζεται να επαναλάβετε την εργασία. Το Klio μπορεί επίσης να βασιστεί σε άλλες έρευνες: παρέχει στους ερευνητές έναν τρόπο να αξιοποιήσουν την υπάρχουσα εργασία με έγκυρα και καθαρά σύνολα δεδομένων. “

Το Klio προορίζεται κυρίως για μηχανικούς και ερευνητές και όχι για εκείνους που δεν διαθέτουν εμπειρία στην επιστήμη δεδομένων – προς το παρόν, απαιτούνται 50 έως 60 γραμμές κώδικα για να φέρουν τη βασική λειτουργικότητα της πλατφόρμας σε ένα έργο. Ωστόσο, οι Root και Singer λένε ότι οι βελτιώσεις χρηστικότητας βρίσκονται στον χάρτη πορείας των χαρακτηριστικών.

“Μόλις ενσωματωθεί το Klio, μπορείτε να εκμεταλλευτείτε ορισμένα χαρακτηριστικά με έναν πολύ απλό τρόπο, όπως τον προσδιορισμό του ρυθμού και του παράγοντα χορού ενός τραγουδιού”, δήλωσε ο Singer. “Είναι πολύ προσιτό στους ανθρώπους – θα έλεγα ίσως προσβάσιμο σε κάποιον που δεν είναι μηχανικός και σίγουρα προσβάσιμος, όπως, σε έναν διαχειριστή προϊόντων.”



[via]

Απάντηση

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει τα ανεπιθύμητα σχόλια. Μάθετε πώς υφίστανται επεξεργασία τα δεδομένα των σχολίων σας.