Η Trifacta επεκτείνει τα εργαλεία προετοιμασίας δεδομένων με την ενσωμάτωση Databricks

Η Trifacta επεκτείνει τα εργαλεία προετοιμασίας δεδομένων με την ενσωμάτωση Databricks


Παρακολουθήστε τη Σύνοδο Κορυφής GamesBeat 2021 από 28-29 Απριλίου. Εγγραφείτε για δωρεάν ή VIP κάρτα σήμερα.


Trifacta ανακοίνωσε σήμερα ότι έχει ενσωματώσει τα εργαλεία προετοιμασίας δεδομένων με μια πλατφόρμα αποθήκης δεδομένων που βασίζεται στο πλαίσιο ανοιχτού κώδικα Apache Spark που παρέχεται από την Βάσεις δεδομένων. Αυτό είναι επιπλέον των αποθετηρίων που βασίζονται σε ένα εργαλείο δημιουργίας δεδομένων ανοιχτού κώδικα (DBT) το οποίο διαχειρίζεται το Fishtown Analytics.

Και στις δύο περιπτώσεις, η Trifacta επεκτείνει την εμβέλεια των εργαλείων που παρέχει για τη διαχείριση αγωγών δεδομένων σε πλατφόρμες που χρησιμοποιούνται ευρέως στο cloud για επεξεργασία και ανάλυση δεδομένων, δήλωσε ο Adam Wilson, Διευθύνων Σύμβουλος της Trifacta.

Η Trifacta εντοπίζει την καταγωγή της σε ένα ερευνητικό έργο στο οποίο συμμετείχαν καθηγητές από το Πανεπιστήμιο του Στάνφορντ και το Πανεπιστήμιο της Καλιφόρνια στο Μπέρκλεϊ και παρήγαγαν ένα οπτικό εργαλείο που επιτρέπει στους αναλυτές δεδομένων χωρίς δεξιότητες προγραμματισμού να φορτώνουν δεδομένα. Στην πραγματικότητα, η Trifacta έχει αυτοματοποιήσει τις διαδικασίες εξαγωγής, μετατροπής και φόρτωσης (ETL) που προηγουμένως απαιτούσαν την εκτέλεση ειδικού πληροφορικής.

Δεν υπάρχει έλλειψη οπτικών εργαλείων που επιτρέπουν στους τελικούς χρήστες χωρίς δεξιότητες προγραμματισμού να μεταφέρουν δεδομένα. Όμως, η Trifacta έχει επεκτείνει την προσφορά της σε μια πλατφόρμα που επιτρέπει στους οργανισμούς να διαχειρίζονται τη διαδικασία αγωγών δεδομένων από άκρη σε άκρο ως μέρος της δέσμευσής της να συγχωνεύει τις λειτουργίες δεδομένων (DataOps) με λειτουργίες μηχανικής μάθησης (MLOps). Ο στόχος είναι να επιτρέπεται στους αναλυτές δεδομένων να αυτοεξυπηρετούνται οι απαιτήσεις δεδομένων τους χωρίς να απαιτείται παρέμβαση από μια ομάδα πληροφορικής, σημείωσε ο Wilson.

Η Google και η IBM μεταπωλούν ήδη την πλατφόρμα προετοιμασίας δεδομένων Trifacta και η εταιρεία έχει συνάψει συμμαχίες τόσο με τις Amazon Internet Products and services (AWS) όσο και με τη Microsoft. Αυτές οι σχέσεις επιτρέπουν στους οργανισμούς να χρησιμοποιούν το Trifacta ως κεντρικό κόμβο μετακίνηση δεδομένων μέσα και έξω από τις πλατφόρμες cloud. Η συμμαχία με τα Databricks και η υποστήριξη για το DBT επεκτείνει περαιτέρω αυτές τις δυνατότητες καθώς οι οργανισμοί έχουν αρχίσει να χρησιμοποιούν πιο συχνά σύννεφα πλαίσια πιο τακτικά για την επεξεργασία και την ανάλυση δεδομένων, δήλωσε ο Wilson.

Γενικά, η μηχανική δεδομένων έχει εξελιχθεί σε μια ξεχωριστή πειθαρχία πληροφορικής λόγω του τεράστιου όγκου δεδομένων που πρέπει να μετακινηθούν και να μετασχηματιστούν. Ενώ τα οπτικά εργαλεία επιτρέπουν στους αναλυτές δεδομένων να εκτελούν ανεξάρτητα τις απαιτήσεις δεδομένων τους, οι οργανισμοί τώρα προσπαθούν επίσης να μεταφέρουν προγραμματικά δεδομένα σε σύννεφα ως μέρος μιας μεγαλύτερης ροής εργασίας. Πολλοί άνθρωποι που έχουν εμπειρία στον προγραμματισμό ETL, που συχνά αναφέρονται ως μηχανικοί δεδομένων, έχουν πλέον μεγαλύτερη ζήτηση από τους αναλυτές δεδομένων, δήλωσε ο Wilson.

Μόλις θεωρηθεί το ισοδύναμο IT μιας δραστηριότητας καθαρισμού που περιστρέφεται κυρίως γύρω από τις δραστηριότητες δημιουργίας αντιγράφων ασφαλείας και ανάκτησης, η μηχανική δεδομένων είναι τώρα η πειθαρχία γύρω από την οποία περιστρέφονται όλα τα μεγάλα έργα επιστήμης δεδομένων, σημείωσε ο Wilson. Στην πραγματικότητα, επαγγελματίες πληροφορικής με δεξιότητες ETL έχουν ανακαλύψει εκ νέου τους εαυτούς τους για να γίνουν μηχανικοί δεδομένων, πρόσθεσε ο Wilson.

«Τους τελευταίους 12 μήνες, η μηχανική δεδομένων έχει γίνει η πιο καυτή δουλειά σε όλες τις τεχνολογίες πληροφορικής», δήλωσε ο Wilson.

Απομένει να δούμε πώς θα γίνουν οι αυτοματοποιημένες διαδικασίες μηχανικής δεδομένων τους επόμενους μήνες και χρόνια. Όχι μόνο υπάρχουν περισσότερα δεδομένα για επεξεργασία και ανάλυση από ποτέ, οι τύποι δεδομένων που πρέπει να υποβληθούν σε επεξεργασία δεν ήταν ποτέ τόσο ποικίλοι. Στο μέλλον, περισσότερα δεδομένα θα υποβληθούν σε επεξεργασία και ανάλυση σε πλατφόρμες υπολογιστών αιχμής, όπου δημιουργούνται και καταναλώνονται. Ωστόσο, τα συγκεντρωτικά αποτελέσματα όλης της επεξεργασίας δεδομένων θα πρέπει να κοινοποιηθούν σε πολλές πλατφόρμες αποθήκης δεδομένων που βρίσκονται στο cloud και σε τοπικά περιβάλλοντα πληροφορικής.

Ανεξάρτητα από το πού γίνεται επεξεργασία των δεδομένων, ο τεράστιος όγκος δεδομένων που μετακινούνται εντός της εκτεταμένης επιχείρησης θα συνεχίσει να αυξάνεται εκθετικά. Το πρόβλημα τώρα είναι να βρούμε πώς να αυτοματοποιήσουμε τη μετακίνηση αυτών των δεδομένων με τρόπο που να κλιμακώνεται πολύ πιο εύκολα.

VentureBeat

Η αποστολή της VentureBeat είναι να είναι ένα ψηφιακό τετράγωνο πόλης για τεχνικούς υπεύθυνους λήψης αποφάσεων για να αποκτήσουν πληροφορίες σχετικά με τη μετασχηματιστική τεχνολογία και τις συναλλαγές. Ο ιστότοπός μας παρέχει βασικές πληροφορίες σχετικά με τις τεχνολογίες δεδομένων και τις στρατηγικές για να σας καθοδηγήσει καθώς οδηγείτε τους οργανισμούς σας. Σας προσκαλούμε να γίνετε μέλος της κοινότητάς μας, για πρόσβαση:

  • ενημερωμένες πληροφορίες για θέματα που σας ενδιαφέρουν
  • τα ενημερωτικά δελτία μας
  • κορυφαίο περιφραγμένο περιεχόμενο και μειωμένη πρόσβαση στις εκδηλώσεις quality, όπως Μετασχηματισμός 2021: Για να μάθετε περισσότερα
  • δυνατότητες δικτύωσης και άλλα

Γίνομαι μέλος



[via]

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει τα ανεπιθύμητα σχόλια. Μάθετε πώς υφίστανται επεξεργασία τα δεδομένα των σχολίων σας.