Open supply του LinkedIn Dagli, μια βιβλιοθήκη μηχανικής μάθησης για Java

Open source του LinkedIn Dagli, μια βιβλιοθήκη μηχανικής μάθησης για Java


Το LinkedIn είναι ανοιχτού κώδικα Δώσ ‘το, μια βιβλιοθήκη μηχανικής εκμάθησης για Java (και άλλες JVM γλώσσες) που προφανώς διευκολύνει την εγγραφή ανθεκτικών σε σφάλματα, αναγνώσιμων, επεξεργάσιμων, διαχειρίσιμων και αναπτυσσόμενων αγωγών μοντέλου χωρίς να δημιουργηθεί τεχνικό χρέος

Ενώ η ωριμότητα μηχανικής μάθησης αυξάνεται γενικά στην επιχείρηση, οι περισσότερες εταιρείες (50%) ξοδεύουν μεταξύ 8 και 90 ημερών για να εφαρμόσουν ένα μόνο μοντέλο μηχανικής μάθησης (με το 18% να παίρνει περισσότερες από 90 ημέρες) , ένα 2019 ψηφοφορία βρέθηκαν από την Αλγορίθμια. Οι περισσότεροι κατηγορούν την έλλειψη επεκτασιμότητας, ακολουθούμενα από προβλήματα αναπαραγωγιμότητας μοντέλων, έλλειψη συναίνεσης διαχείρισης και ανεπαρκή εξοπλισμό.

Με το Dagli, το μοντέλο αγωγού ορίζεται ως ένα άμεσο ακυκλικό γράφημα, ένα γράφημα που αποτελείται από κορυφές και ακμές με κάθε άκρη κατευθυνόμενη από κορυφή σε κορυφή για εκπαίδευση και συμπεράσματα. Το περιβάλλον Dagli παρέχει ορισμούς αγωγών, στατική πληκτρολόγηση, σχεδόν πανταχού μεταβλητότητα και άλλες δυνατότητες που αποτρέπουν τη συντριπτική πλειονότητα πιθανών σφαλμάτων λογικής.

“Τα μοντέλα είναι συνήθως μέρος ενός ολοκληρωμένου αγωγού … και η κατασκευή, η κατάρτιση και η ανάπτυξη αυτών των αγωγών παραγωγής παραμένει πιο περίπλοκη από ό, τι θα έπρεπε”, έγραψε σε μια δημοσίευση στο web site του ερευνητή του LinkedIn Jeff Pasternack. επεξεργασία φυσικής γλώσσας. “Διπλότυπο ή ξένο έργο απαιτείται συχνά για να καλύψει τόσο την εκπαίδευση όσο και το συμπέρασμα, δημιουργώντας έναν εύθραυστο κώδικα” κόλλας “που περιπλέκει τη μελλοντική εξέλιξη και τη συντήρηση του μοντέλου.”

Το Dagli λειτουργεί σε διακομιστές, Hadoop, διεπαφές γραμμής εντολών, IDE και άλλα τυπικά περιβάλλοντα JVM. Πολλά εξαρτήματα αγωγών είναι έτοιμα για χρήση αμέσως, συμπεριλαμβανομένων των νευρικών δικτύων, της υλικοτεχνικής παλινδρόμησης, των δέντρων βελτιστοποιημένης απόφασης κλίσης, του γρήγορου κειμένου, της εγκυρότητας, της διασταυρούμενης εκπαίδευσης, της επιλογής χαρακτηριστικών, των αναγνωστών δεδομένων, της αξιολόγησης και των μετασχηματισμών δυνατοτήτων.

Για έμπειρους επιστήμονες δεδομένων, η Dagli προσφέρει μια διαδρομή για υψηλής απόδοσης, έτοιμα για παραγωγή μοντέλα AI που είναι διατηρήσιμα και επεκτάσιμα μακροπρόθεσμα που μπορούν να αξιοποιήσουν μια υπάρχουσα στοίβα τεχνολογίας JVM. Για λιγότερο έμπειρους μηχανικούς λογισμικού, το Dagli παρέχει ένα API που μπορεί να χρησιμοποιηθεί με μια γλώσσα JVM και εργαλεία σχεδιασμένα για την αποφυγή τυπικών σφαλμάτων λογικής.

«Με το Dagli, ελπίζουμε να κάνουμε πιο αποτελεσματικά και έτοιμα για την παραγωγή πρότυπα ευκολότερα να γράφουμε, να αναθεωρούμε και να διανέμουμε, αποφεύγοντας παράλληλα το τεχνικό χρέος και τις μακροπρόθεσμες προκλήσεις συντήρησης που τις συνοδεύουν συχνά», συνέχισε ο Pasternack “Η Dagli εκμεταλλεύεται πλήρως τους σύγχρονους επεξεργαστές πολύ-πολλών πυρήνων και … ισχυρές κάρτες γραφικών για αποτελεσματική εκπαίδευση ενός μηχανήματος με πραγματικά μοντέλα.”

Η κυκλοφορία του Dagli έρχεται αφού το LinkedIn έκανε το αρχείο διαθέσιμο Εργαλειοθήκη Fairness LinkedIn (Raise), μια βιβλιοθήκη λογισμικού ανοιχτού κώδικα που έχει σχεδιαστεί για να επιτρέπει τη μέτρηση της ισότητας στις ροές εργασίας τεχνητής νοημοσύνης και μηχανικής μάθησης. Πριν από το Lift, το LinkedIn έκανε το ντεμπούτο του DeText, ένα πλαίσιο ανοιχτού κώδικα για ταξινόμηση, ταξινόμηση και δημιουργία γλωσσών που σχετίζονται με τη διαδικασία της φυσικής γλώσσας που αξιοποιεί τη σημασιολογική αντιστοίχιση, χρησιμοποιώντας βαθιά νευρωνικά δίκτυα για την κατανόηση της πρόθεσης των μελών στα συστήματα αναζήτησης και προτάσεων.


Πώς οι επιχειρήσεις ξεκινούν την επικοινωνία:

Η πανδημία αναγκάζει τις νεοσύστατες επιχειρήσεις να ρίξουν μια πιο προσεκτική ματιά στην άνοδο των λύσεων επικοινωνίας τους. Μάθε πως να




[via]