Πώς η Hasty χρησιμοποιεί αυτοματοποίηση και γρήγορη ανατροφοδότηση για την εκπαίδευση μοντέλων AI και τη βελτίωση του σχολιασμού

Πώς η Hasty χρησιμοποιεί αυτοματοποίηση και γρήγορη ανατροφοδότηση για την εκπαίδευση μοντέλων AI και τη βελτίωση του σχολιασμού


Η μηχανική όραση παίζει έναν ολοένα και πιο κεντρικό ρόλο σε όλους τους βιομηχανικούς τομείς, από παρακολούθηση της προόδου σε εργοτάξια στη διανομή έξυπνη σάρωση γραμμωτών κωδίκων σε αποθήκες. Όμως, η κατάρτιση του υποκείμενου μοντέλου AI για την ακριβή αναγνώριση των εικόνων μπορεί να είναι μια αργή και εντατικής κατανάλωσης πόρων που δεν είναι εγγυημένη για την παραγωγή αποτελεσμάτων. Νέα γερμανική εκκίνηση Βιαστικός θέλει να βοηθήσει με την υπόσχεση εργαλείων “επόμενης γενιάς” που επιταχύνουν ολόκληρη τη διαδικασία εκπαίδευσης μοντέλου για σχολιασμό εικόνας.

Η Hasty, που ιδρύθηκε στο Βερολίνο το 2019, ανακοίνωσε σήμερα ότι έχει συγκεντρώσει 3,7 εκατομμύρια δολάρια σε έναν γύρο σπόρων με επικεφαλής τον Shasta Ventures. Η εταιρεία Silicon Valley VC έχει πολλές σημαντικές κυκλοφορίες στο όνομά της, συμπεριλαμβανομένης της Nestεπίκτητος από την Google), Eero (επίκτητος από την Amazon) και Zuora (IPO). Άλλοι συμμετέχοντες στον γύρο περιλαμβάνουν iRobot Ventures είναι Κοπαρίον.

Η παγκόσμια αγορά μηχανικής όρασης ήταν ορίστηκε σε 11,4 δισεκατομμύρια δολάρια το 2020, ένα ποσοστό που αναμένεται να αυξηθεί σε πάνω από 19 δισεκατομμύρια δολάρια έως το 2027. Η προετοιμασία και η επεξεργασία δεδομένων είναι μία από τις πιο χρονοβόρες δραστηριότητες στο AI, το οποίο αντιπροσωπεύει περίπου το 80% του χρόνου που αφιερώνεται σε σχετικά έργα. Στην όραση του υπολογιστή, ο σχολιασμός ή η προσθήκη ετικετών είναι μια τεχνική που χρησιμοποιείται για τη σήμανση και την ταξινόμηση των εικόνων για να δώσει στις μηχανές το νόημα και το πλαίσιο πίσω από την εικόνα, επιτρέποντάς τους να εντοπίζουν παρόμοια αντικείμενα. Μεγάλο μέρος αυτής της σχολιαστικής εργασίας εμπίπτει σε αξιόπιστους γέρους.

Το πρόβλημα που προσπαθεί να λύσει ο Hasty είναι ότι η συντριπτική πλειονότητα των έργων επιστήμης δεδομένων ποτέ δεν το έβαλε στην παραγωγή, με σημαντικούς πόρους σπατάλη στη διαδικασία.

“Οι τρέχουσες προσεγγίσεις στην επισήμανση δεδομένων είναι πολύ αργές”, δήλωσε ο συνιδρυτής και διευθύνων σύμβουλος της Hasty, Tristan Rouillard, στην VentureBeat. “Οι μηχανικοί μηχανικής μάθησης συχνά πρέπει να περιμένουν τρεις έως έξι μήνες για τα πρώτα αποτελέσματα για να δουν εάν η στρατηγική και η προσέγγιση σχολιασμού τους λειτουργεί λόγω της καθυστέρησης μεταξύ της επισήμανσης και της εκπαίδευσης μοντέλων.”

Βιάσου

Η Hasty διαθέτει 10 ενσωματωμένους αυτοματοποιημένους βοηθούς τεχνητής νοημοσύνης, καθένας αφιερωμένος στη μείωση της ανθρώπινης εργασίας. Το Dextr, για παράδειγμα, επιτρέπει στους χρήστες να κάνουν κλικ μόνο σε τέσσερα ακραία σημεία σε ένα αντικείμενο για να το επισημάνουν και να προτείνουν σχολιασμούς.

Πάνω: Βοηθός AI της Hasty, Dextra

Και ο βοηθός “τμηματοποίηση παρουσίας” του Hasty δημιουργεί γρηγορότερους σχολιασμούς όταν εντοπίζει πολλαπλές εμφανίσεις ενός αντικειμένου μέσα σε μια εικόνα.

Πάνω: Ταχεία τμηματοποίηση της παρουσίας AI

Ο βοηθός παρακολουθεί ως χρήστες σχολιασμό και μπορεί να κάνει προτάσεις για ετικέτες μόλις επιτευχθεί ένα συγκεκριμένο σκορ εμπιστοσύνης. Και ο χρήστης μπορεί να διορθώσει αυτές τις προτάσεις για να βελτιώσει το μοντέλο, ενώ λαμβάνει σχόλια σχετικά με την αποτελεσματικότητα της στρατηγικής σχολιασμού.

“Αυτό δίνει στο νευρωνικό δίκτυο μια καμπύλη μάθησης – μαθαίνει για το έργο όπως επισημαίνετε”, δήλωσε ο Rouillard.

Υπάρχουν ήδη αμέτρητα εργαλεία σχεδιασμένα για να διευκολύνουν αυτήν τη διαδικασία, όπως Το SageMaker του Amazon, Το Labelbox υποστηρίζεται από την Google, V7, είναι Dataloop, ο οποίος ανακοίνωσε ένα νέο γύρο χρηματοδότησης 11 εκατομμυρίων δολαρίων μόλις τον περασμένο μήνα.

Αλλά ο Hasty ισχυρίζεται ότι μπορεί να κάνει όλη τη διαδικασία πολύ πιο γρήγορη με τον συνδυασμό αυτοματοποίησης, προπόνησης μοντέλου και σχολιασμού.

Όπως και με παρόμοιες πλατφόρμες, η Hasty χρησιμοποιεί μια διεπαφή μέσω της οποίας συνεργάζονται άνθρωποι και μηχανές. Ο βιαστικός μπορεί να κάνει προτεινόμενους σχολιασμούς αφού εκτεθεί σε μερικές εικόνες σχολιασμένες από άτομα, με τον χρήστη (όπως ο μηχανικός μηχανικής εκμάθησης) να αποδεχτεί, να απορρίψει ή να αλλάξει αυτήν την πρόταση. Αυτή η ανατροφοδότηση σε πραγματικό χρόνο σημαίνει ότι τα μοντέλα γίνονται καλύτερα όσο χρησιμοποιούνται σε αυτό που αναφέρεται συχνά ως “σφόνδυλος δεδομένων”.

«Όλοι προσπαθούν να δημιουργήσουν ένα αυτο-βελτιωμένο σφόνδυλο δεδομένων. Το πρόβλημα με το AI (μηχανογραφημένο) όραμα έγκειται στην περιστροφή του σφονδύλου στην πρώτη θέση, [as] είναι εξαιρετικά ακριβό και λειτουργεί μόνο το 50% του χρόνου – εκεί μπαίνουμε », είπε ο Rouillard.

Γρήγορη ανατροφοδότηση

Πράγματι, τα νευρικά δίκτυα της Hasty μαθαίνουν καθώς οι μηχανικοί δημιουργούν τα σύνολα δεδομένων τους, οπότε οι πτυχές της διαδικασίας “construct”, “deploy” και “appraise” συμβαίνουν λίγο πολύ ταυτόχρονα. Μια τυπική γραμμική προσέγγιση θα μπορούσε να πάρει μήνες για να φτάσει σε ένα δοκιμαστικό μοντέλο AI, το οποίο θα μπορούσε να είναι βαθιά ελαττωματικό λόγω σφαλμάτων στα δεδομένα ή τυφλών υποθέσεων που έγιναν νωρίς στο έργο. Αυτό που υπόσχεται ο Hasty είναι ευκινησία.

Δεν είναι εντελώς καινούργιο, αλλά ο Rouillard είπε ότι η εταιρεία του θεωρεί την αυτοματοποιημένη επισήμανση παρόμοια με την αυτόνομη οδήγηση, καθώς λειτουργούν διαφορετικές τεχνολογίες σε επίπεδα. Στον τομέα των αυτοκινούμενων οχημάτων, ορισμένα αυτοκίνητα μπορούν μόνο να φρενάρουν ή να αλλάζουν λωρίδες, ενώ άλλα είναι ικανός σχεδόν πλήρους αυτονομίας. Μεταφρασμένος σε σχολιασμό, ο Rouillard είπε ότι η Hasty παίρνει αυτοματοποίηση πέρα ​​από πολλούς από τους ανταγωνιστές της, όσον αφορά την ελαχιστοποίηση του αριθμού των κλικ που απαιτούνται για την επισήμανση μιας εικόνας ή ομάδων εικόνων.

«Όλοι κηρύττουν αυτοματοποίηση, αλλά δεν είναι προφανές τι αυτοματοποιείται», εξήγησε ο Ρουίλαρντ. “Τα περισσότερα από τα εργαλεία έχουν καλές εφαρμογές αυτοματοποίησης επιπέδου 1, αλλά μόνο λίγοι από εμάς ασχολούνται με την παροχή επιπέδων 2 και 3 προκειμένου να παράγουν ουσιαστικά αποτελέσματα.”

Δεδομένου ότι τα δεδομένα είναι ουσιαστικά το καύσιμο για μηχανική μάθηση, η λήψη περισσότερων (ακριβών) δεδομένων σε ένα μοντέλο AI μεγάλης κλίμακας είναι κρίσιμη.

Πάνω: Βιασύνη: αυτοματοποιημένα επίπεδα επισήμανσης

Εκτός από ένα μη αυτόματο εργαλείο αντιμετώπισης προβλημάτων, η Hasty προσφέρει έναν ανιχνευτή σφαλμάτων που λειτουργεί με AI που εντοπίζει αυτόματα πιθανά προβλήματα στα δεδομένα εκπαίδευσης ενός έργου. Είναι ένα χαρακτηριστικό ελέγχου ποιότητας που παρακάμπτει την ανάγκη αναζήτησης σφαλμάτων στα δεδομένα.

“Αυτό σας επιτρέπει να αφιερώσετε το χρόνο σας διορθώνοντας τα σφάλματα αντί να τα αναζητήσετε και σας βοηθά να δημιουργήσετε γρήγορα εμπιστοσύνη στα δεδομένα σας καθώς γράφετε”, δήλωσε ο Rouillard.

Πάνω: Βιασύνη: Εύρεση σφάλματος

Η Hasty υποστηρίζει περίπου 4.000 χρήστες, έναν αρκετά ομοιόμορφο συνδυασμό επιχειρήσεων, πανεπιστημίων, νεοσύστατων επιχειρήσεων και προγραμματιστών εφαρμογών που καλύπτει σχεδόν κάθε κλάδο. «Έχουμε τρεις από τις 10 κορυφαίες γερμανικές εταιρείες logistics, γεωργίας και λιανικής που χρησιμοποιούν το Hasty», πρόσθεσε ο Rouillard.

Μια τυπική περίπτωση γεωργικής χρήσης μπορεί να περιλαμβάνει τη διαμόρφωση ενός μοντέλου AI για τον εντοπισμό καλλιεργειών, παρασίτων ή ασθενειών. Στην εφοδιαστική, το μοντέλο μπορεί να χρησιμοποιηθεί για την εκπαίδευση μηχανών για αυτόματη ταξινόμηση πακέτων ανά τύπο. Ο Rouillard πρόσθεσε ότι ο Hasty χρησιμοποιείται επίσης στον αθλητικό χώρο για να παρέχει ανάλυση σε πραγματικό χρόνο και στατιστικά για την κάλυψη του ποδοσφαίρου.

Με 3,7 εκατομμύρια δολάρια στην τράπεζα, η εταιρεία σκοπεύει να επιταχύνει την ανάπτυξη προϊόντων και να επεκτείνει την πελατειακή της βάση στην Ευρώπη και τη Βόρεια Αμερική.

Εγγραφείτε στο Εβδομαδιαία χρηματοδότηση για να ξεκινήσετε την εβδομάδα σας με τις καλύτερες ιστορίες χρηματοδότησης της VB.



[via]