Το ETL Airbyte συγκεντρώνει 5,2 εκατομμύρια δολάρια για την ενσωμάτωση δεδομένων ανοιχτού κώδικα

Το ETL Airbyte συγκεντρώνει 5,2 εκατομμύρια δολάρια για την ενσωμάτωση δεδομένων ανοιχτού κώδικα


Εγγραφείτε στο Rework 2021 για τα πιο σημαντικά θέματα σε AI και εταιρικά δεδομένα. να μάθω περισσότερα.


Airbyte ανακοίνωσε σήμερα ότι έχει συγκέντρωσε 5,2 εκατομμύρια δολάρια σε αρχική χρηματοδότηση ως μέρος μιας προσπάθειας να καταστούν πιο προσβάσιμα τα εργαλεία ανοιχτού κώδικα για τη διαχείριση δεδομένων και την ενοποίηση.

Η εταιρεία, η οποία προσφέρει ένα εργαλείο ανοιχτού κώδικα Extract Renovate and Load (ETL) που χρησιμοποιείται για τη δημιουργία αγωγός δεδομένων, τώρα επιδιώκει να εκδημοκρατίσει περαιτέρω αυτήν τη διαδικασία. Αυτό περιλαμβάνει, για παράδειγμα, τη δημιουργία συμπληρωματικών εργαλείων ανοιχτού κώδικα για τη διαχείριση και την προστασία των δεδομένων, δήλωσε ο συνιδρυτής της Airbyte και ο διευθύνων σύμβουλος Michel Tricot στο VentureBeat.

Οι εσωτερικές ομάδες IT χρησιμοποίησαν ιστορικά εργαλεία ETL για τη μεταφορά δεδομένων μεταξύ αποθετηρίων. Τα τελευταία χρόνια, ωστόσο, οι αναλυτές δεδομένων έχουν χρησιμοποιήσει αυτά τα εργαλεία για τη φόρτωση δεδομένων σε αποθήκες χωρίς να απαιτούν παρέμβαση από μια ομάδα πληροφορικής.

Όλα αυτά τα εργαλεία διαθέτουν άδεια από άτομα. Η Airbyte σχεδιάζει να παράσχει τελικά στους οργανισμούς εκδόσεις των εργαλείων με άδεια χρήσης, καθώς και μια επιλογή πρόσβασης σε αυτά τα εργαλεία μέσω μιας υπηρεσίας που φιλοξενείται από την Airbyte. Ο Tricot είπε ότι η εταιρεία σχεδιάζει επίσης μια υπηρεσία διαχειριζόμενης ολοκλήρωσης. “Δεν θα επικεντρωθούμε στη δημιουργία εσόδων μέχρι το 2022”, είπε.

Ο Accel ηγήθηκε του τρέχοντος γύρου χρηματοδότησης, με τη συμμετοχή του Y Combinator. 8VC Συν-ιδρυτής του τμήματος Calvin French-Owen. Ο πρώην GM της Cloudera Charles Zedlewski. Συνιδρυτής και Διευθύνων Σύμβουλος της Datavant Travis Could. Πρόεδρος Machinify Alain Rossmann · και Auren Hoffman, συνιδρυτής και διευθύνων σύμβουλος του LiveRamp και διευθύνων σύμβουλος της Safegraph.

Από τα τέλη Ιανουαρίου, περισσότεροι από 600 οργανισμοί χρησιμοποιούν τα εργαλεία ETL της Airbyte, συμπεριλαμβανομένων των Safegraph, Dribbble, Mercato, GraniteRock, Agridigital και Cart.com. Πολλοί από αυτούς τους οργανισμούς προσελκύονται από την Airbyte επειδή δεν χρειάζεται να περιμένουν έναν προμηθευτή εμπορικών εργαλείων ETL για τη δημιουργία συνδέσμων για διάφορες πηγές δεδομένων. Αντ ‘αυτού, η κοινότητα δημιουργεί και υποστηρίζει τους συνδέσμους που θεωρεί πιο κρίσιμους, είπε ο Tricot. Η κοινότητα έχει πιστοποιήσει μέχρι τώρα 50 συνδέσμους. Αυτοί οι σύνδεσμοι είναι ενθυλακωμένα δοχεία Docker, τα οποία τους επιτρέπουν να αναπτυχθούν σε οποιαδήποτε πλατφόρμα.

Οι διαδικασίες ETL, μαζί με άλλες κατηγορίες εργαλείων προετοιμασίας δεδομένων, επαναξιολογούνται καθώς οι οργανισμοί συνειδητοποιούν όλο και περισσότερο ότι η ποιότητα οποιουδήποτε μοντέλου AI που δημιουργούν εξαρτάται από την αξιοπιστία των δεδομένων που χρησιμοποιούνται για την εκπαίδευση αλγορίθμων μηχανικής μάθησης. Οι επιστήμονες δεδομένων θέλουν επίσης να είναι σε θέση να ενημερώνουν εύκολα τα δεδομένα που απαιτούνται για την επανεκπαίδευση μοντέλων καθώς εξελίσσονται επιχειρηματικές συνθήκες, κάτι που συνήθως περιλαμβάνει τον άμεσο έλεγχο των πηγών δεδομένων που χρησιμοποιούνται για την εκπαίδευση αυτών των μοντέλων.

Όσο κρίσιμος είναι ο έλεγχος οποιουδήποτε συνόλου δεδομένων, οι επιστήμονες δεδομένων διαπιστώνουν ότι τα περισσότερα από τα δεδομένα που είναι αποθηκευμένα σε εταιρικά συστήματα δεν είναι τόσο συνεπή ή αξιόπιστα. Οι ομάδες της επιστήμης δεδομένων μπορούν εύκολα να περάσουν περισσότερο χρόνο για να αντιμετωπίσουν προβλήματα υδραυλικής δεδομένων από την κατασκευή μοντέλων AI. Ως αποτέλεσμα, η επιτυχής κατασκευή ενός μοντέλου AI μπορεί συχνά να απαιτεί μήνες και προσπάθεια.

Τα εργαλεία ETL δεν θα λύσουν αυτό το πρόβλημα μόνοι τους. Όσο πιο εύκολο γίνεται ο χειρισμός των δεδομένων, τόσο λιγότερος χρόνος θα χρειαστεί για την κατασκευή ενός μοντέλου AI και, στη συνέχεια, θα διατηρείται συνεχώς καθώς θα γίνονται διαθέσιμες νέες πηγές δεδομένων.

Δεν είναι σαφές τι αντίκτυπο έχει η διαθεσιμότητα εργαλείων ανοιχτού κώδικα ETL σε πωλητές των ανταγωνιστικών εμπορικών προσφορών που χρησιμοποιούν ορισμένοι οργανισμοί εδώ και δεκαετίες. Αλλά σε μια εποχή που πολλοί οργανισμοί πιέζονται να μειώσουν το συνολικό κόστος της πληροφορικής, η έκκληση του λογισμικού ανοιχτού κώδικα έχει αποδειχθεί αναμφισβήτητη.

VentureBeat

Η αποστολή της VentureBeat είναι να είναι μια ψηφιακή πλατεία της πόλης για τεχνικούς υπεύθυνους λήψης αποφάσεων για να αποκτήσουν γνώσεις σχετικά με τη μετασχηματιστική τεχνολογία και τις συναλλαγές. Ο ιστότοπός μας παρέχει βασικές πληροφορίες σχετικά με τις τεχνολογίες δεδομένων και τις στρατηγικές για να σας καθοδηγήσει καθώς οδηγείτε τους οργανισμούς σας. Σας προσκαλούμε να γίνετε μέλος της κοινότητάς μας, για πρόσβαση:

  • ενημερωμένες πληροφορίες για θέματα που σας ενδιαφέρουν
  • τα ενημερωτικά δελτία μας
  • Περιεχόμενο περιφραγμένο με κορυφαία σκέψη και μειωμένη πρόσβαση στις πολύτιμες εκδηλώσεις μας, όπως το Rework
  • δυνατότητες δικτύωσης και άλλα

Γίνομαι μέλος



[via]