Τυχαίες συνομιλίες στο Facebook

Το σύνολο δεδομένων του Fb καταπολεμά την προκατάληψη της AI, κάνοντας τους ανθρώπους να αναγνωρίζουν την ηλικία και το φύλο


Παρακολουθήστε τη Σύνοδο Κορυφής GamesBeat 2021 από 28-29 Απριλίου. Εγγραφείτε για δωρεάν ή VIP κάρτα σήμερα.


Το Fb άνοιξε σήμερα ένα σύνολο δεδομένων που έχει σχεδιαστεί για να αποκαλύψει προκαταλήψεις που σχετίζονται με την ηλικία, το φύλο και τον τόνο του δέρματος στα μοντέλα όρασης υπολογιστή και μηχανικής μάθησης. Η εταιρεία λέει ότι το σώμα – Τυχαίες συνομιλίες – είναι το πρώτο του είδους του με αμειβόμενους ανθρώπους που έχουν δηλώσει ρητά την ηλικία και το φύλο τους αντί να επισημαίνουν αυτές τις πληροφορίες από τρίτους ή να τις εκτιμούν χρησιμοποιώντας μοντέλα.

Οι προκαταλήψεις μπορούν να λειτουργήσουν ως προς τα δεδομένα που χρησιμοποιούνται για την εκπαίδευση συστημάτων AI, ενισχύοντας τα στερεότυπα και οδηγώντας σε καταστροφικές συνέπειες. Η έρευνα έχει απεικονίζεται από τα προηγμένα μοντέλα τεχνητής νοημοσύνης για την ταξινόμηση εικόνας ImageNet, ένα δημοφιλές σύνολο δεδομένων που περιέχει φωτογραφίες που τραβήχτηκαν από το Διαδίκτυο, μαθαίνει αυτόματα ανθρώπινες προκαταλήψεις σχετικά με τη φυλή, το φύλο, το βάρος και πολλά άλλα. Αμέτρητος Εκπαίδευση να έχω καθιερωμένος ότι η αναγνώριση προσώπου είναι ευαίσθητη σε προκατάληψη. Έχει αποδειχθεί επίσης ότι προκαταλήψεις Μπορούν να εισέλθουν στα εργαλεία τεχνητής νοημοσύνης που χρησιμοποιούνται για τη δημιουργία τέχνης, συμβάλλοντας δυνητικά σε ψευδείς αντιλήψεις σχετικά με τις κοινωνικές, πολιτιστικές και πολιτικές πτυχές του παρελθόντος και παρεμποδίζοντας την επίγνωση σημαντικών ιστορικών γεγονότων.

Τυχαίες συνομιλίες, που περιέχουν πάνω από 4.100 βίντεο από 3.000 συμμετέχοντες, μερικά από τα οποία Πρόκληση ανίχνευσης Deepfake, στοχεύει στην καταπολέμηση αυτής της προκατάληψης συμπεριλαμβάνοντας “φαινόμενα” ετικέτες τόνου δέρματος. Το Facebook δηλώνει ότι οι ήχοι υπολογίζονται χρησιμοποιώντας την κλίμακα Fitzpatrick, ένα σχήμα ταξινόμησης για το χρώμα του δέρματος που αναπτύχθηκε το 1975 από τον Αμερικανό δερματολόγο Thomas B. Fitzpatrick. Η κλίμακα Fitzpatrick είναι ένας τρόπος αξιολόγησης της απόκρισης των τύπων δέρματος στο υπεριώδες φως, από τον Τύπο Ι (ανοιχτόχρωμο δέρμα που πάντα καίει και δεν μαυρίζει ποτέ) έως τον Τύπο VI (δέρμα με έντονη βαφή που δεν καίει ποτέ).

Το Facebook ισχυρίζεται ότι έχει προσλάβει ειδικούς σχολιαστές περιστασιακής συνομιλίας για να προσδιορίσει τον τύπο δέρματος κάθε συμμετέχοντος. Οι σχολιαστές σημείωσαν επίσης ετικέτες στα βίντεο με συνθήκες φωτισμού περιβάλλοντος, οι οποίες βοήθησαν στη μέτρηση του τρόπου με τον οποίο τα μοντέλα αντιμετωπίζουν άτομα με διαφορετικούς τόνους δέρματος σε συνθήκες χαμηλού φωτισμού.

Ένας εκπρόσωπος του Fb είπε στο VentureBeat μέσω e mail ότι ένας αμερικανός πωλητής προσλήφθηκε για να επιλέξει σχολιαστές για το έργο από “ένα ευρύ φάσμα από φόντα, εθνικότητα και φύλο”. Οι συμμετέχοντες – που ήρθαν από την Ατλάντα, το Χιούστον, το Μαϊάμι, τη Νέα Ορλεάνη και το Ρίτσμοντ – πληρώθηκαν.

“Ως βιομηχανία, τόσο οι βιομηχανικοί όσο και οι ακαδημαϊκοί εμπειρογνώμονες βρίσκονται ακόμη στα αρχικά στάδια της κατανόησης της δικαιοσύνης και της προκατάληψης όταν πρόκειται για την τεχνητή νοημοσύνη … Η ερευνητική κοινότητα AI μπορεί να χρησιμοποιήσει τις περιστασιακές συνομιλίες ως σημαντικό βήμα για την ομαλοποίηση της μέτρησης υποομάδων και έρευνα μετοχών “, έγραψε το Fb σε μια ανάρτηση ιστολογίου. “Με τις περιστασιακές συνομιλίες, ελπίζουμε να ενθαρρύνουμε περαιτέρω έρευνα σε αυτό το σημαντικό αναδυόμενο πεδίο.”

Για την υποστήριξη του Fb, υπάρχουν ενδείξεις ότι τα μοντέλα μηχανικής όρασης είναι ιδιαίτερα ευαίσθητα σε καταστροφικές και διεισδυτικές προκατάληψη. Ένα έγγραφο το περασμένο φθινόπωρο Από το Πανεπιστήμιο του Κολοράντο, οι ερευνητές του Boulder έδειξαν ότι η τεχνητή νοημοσύνη από την Amazon, την Clarifai, τη Microsoft και άλλους διατήρησε ποσοστά ακρίβειας άνω του 95% για τους άνδρες και τις γυναίκες cisgender, αλλά οι εσφαλμένοι άνδρες ως 38% γυναίκες. Ανεξάρτητα σημεία αναφοράς των μεγάλων συστημάτων προμηθευτών από Αποχρώσεις του φύλου έργο ε το Εθνικό Ινστιτούτο Προτύπων και Τεχνολογίας (NIST) έδειξε ότι η τεχνολογία αναγνώρισης προσώπου παρουσιάζει φυλετική και μεροληπτική διάκριση φύλου και πρότεινε ότι τα τρέχοντα προγράμματα αναγνώρισης προσώπου μπορεί να είναι εξαιρετικά ανακριβή, εσφαλμένα να ταξινομούν άτομα άνω των 96% του χρόνου.

Εκτός από την αναγνώριση προσώπου, χαρακτηριστικά όπως οι εικονικές ταπετσαρίες του Zoom και το εργαλείο αυτόματης περικοπής φωτογραφιών του Twitter υπήρξαν ιστορικά μειονεκτήματα για άτομα με πιο σκούρο δέρμα. Το 2015, ένας μηχανικός λογισμικού επεσήμανε ότι οι αλγόριθμοι αναγνώρισης εικόνας στις Φωτογραφίες Google χαρακτήρισαν τους μαύρους φίλους του ως “γορίλες”. Και ο μη κερδοσκοπικός αλγόριθμοςWatch απέδειξε ότι το Cloud Vision API της Google ταυτόχρονα αυτόματα με την ένδειξη ένα θερμόμετρο που κατέχει ένα πρόσωπο με σκούρο δέρμα ως “όπλο”, ενώ επισημαίνει ένα θερμόμετρο που κατέχεται από ένα ανοιχτόχρωμο άτομο ως “ηλεκτρονική συσκευή”.

Οι ειδικοί αποδίδουν πολλά από αυτά τα σφάλματα σε ατέλειες των συνόλων δεδομένων που χρησιμοποιούνται για την εκπαίδευση των μοντέλων. Ένα πρόσφατο Έλεγχος από το MIT δημοφιλών συνόλων δεδομένων μηχανικής μάθησης το βρήκα κατά μέσο όρο σφάλματα σχολιασμού 3,4%, συμπεριλαμβανομένου ενός στο οποίο μια εικόνα του Τσιουάουα χαρακτηρίστηκε ως “feoa boa”. Μια παλαιότερη έκδοση του ImageNet, ένα σύνολο δεδομένων που χρησιμοποιείται για την εκπαίδευση συστημάτων τεχνητής νοημοσύνης σε όλο τον κόσμο, βρέθηκε να περιέχει φωτογραφίες γυμνών παιδιών, ηθοποιών πορνό, κολεγιακών πάρτι και πολλά άλλα, όλα διαγραμμένα από τον Ιστό χωρίς τη συγκατάθεση αυτών των ατόμων. Ένα άλλο σώμα όρασης υπολογιστή, 80 εκατομμύρια μικροσκοπικές εικόνες, βρέθηκε να περιέχει μια σειρά ρατσιστικών, σεξιστικών και κατά τα άλλα προσβλητικών σχολιασμών, όπως σχεδόν 2.000 εικόνες με ετικέτα Ν και ετικέτες όπως “ύποπτος βιασμός” και “παιδικός κακοποιός”. “

Τυχαίες συνομιλίες στο Facebook

Αλλά οι περιστασιακές συνομιλίες απέχουν πολύ από το να είναι ένα τέλειο σημείο αναφοράς. Το Facebook ισχυρίζεται ότι δεν έχει συλλέξει πληροφορίες σχετικά με την προέλευση των συμμετεχόντων. Και ζητώντας το φύλο τους, η εταιρεία παρείχε μόνο τις επιλογές “άνδρες”, “γυναίκες” και “άλλες”, αφήνοντας τα φύλα ως εκείνα που ταυτίζονται ως μη δυαδικά.

Ο εκπρόσωπος κατέστησε επίσης σαφές ότι οι απλές συνομιλίες είναι διαθέσιμες μόνο στις ομάδες του Fb από σήμερα και ότι οι εργαζόμενοι δεν θα έχουν ζήτηση, αλλά θα είναι. ενθαρρύνεται – χρησιμοποιήστε το για σκοπούς αξιολόγησης.

Τα ανοίγματα στις προσεγγίσεις του Fb στα ίδια κεφάλαια δεν έχουν κάνει πολλά χτίστε εμπιστοσύνη στην κοινότητα AI. Πανεπιστήμιο της Νέας Υόρκης αυτή μελετάει κυκλοφόρησε τον Ιούλιο του 2020 εκτιμά ότι τα συστήματα μηχανικής εκμάθησης του Fb κάνουν περίπου 300.000 λάθη εποπτείας περιεχομένου την ημέρα και ότι οι προβληματικές δημοσιεύσεις συνεχίζουν να περνούν από τα φίλτρα του Fb. Σε μια ομάδα Facebook που δημιουργήθηκε τον περασμένο Νοέμβριο και ταχέως αναπτυσσόμενη σε σχεδόν 400.000 άτομα, τα μέλη που ζητούσαν μια εθνική καταμέτρηση των προεδρικών εκλογών του 2020 στις ΗΠΑ αντάλλαξαν αβάσιμους ισχυρισμούς για φερόμενη εκλογική απάτη και καταμέτρηση κρατικών εκλογών κάθε λίγα δευτερόλεπτα.

Από την πλευρά του Facebook, η εταιρεία λέει ότι, ενώ βλέπει τις περιστασιακές συνομιλίες ως ένα «καλό και θαρραλέο» πρώτο βήμα, θα συνεχίσει να πιέζει προς την ανάπτυξη τεχνικών που θα συλλαμβάνουν μεγαλύτερη ποικιλομορφία τον επόμενο χρόνο. “Τον επόμενο χρόνο, ελπίζουμε να διερευνήσουμε διαδρομές για την επέκταση αυτού του συνόλου δεδομένων ώστε να είναι ακόμη πιο περιεκτικοί με αναπαραστάσεις που περιλαμβάνουν περισσότερες γεωγραφικές τοποθεσίες, δραστηριότητες και ένα ευρύτερο φάσμα ταυτότητας φύλου και ηλικιών”, δήλωσε ο εκπρόσωπος. “Είναι πολύ νωρίς για να σχολιάσουμε τη μελλοντική συμμετοχή των ενδιαφερόμενων μερών, αλλά είμαστε σίγουρα ανοιχτοί να μιλήσουμε με ενδιαφερόμενους από την τεχνολογία, τον ακαδημαϊκό χώρο, τους ερευνητές και άλλους.”

VentureBeat

Η αποστολή της VentureBeat είναι να είναι ένα ψηφιακό τετράγωνο πόλης για τεχνικούς υπεύθυνους λήψης αποφάσεων για να αποκτήσουν πληροφορίες σχετικά με τη μετασχηματιστική τεχνολογία και τις συναλλαγές. Ο ιστότοπός μας παρέχει βασικές πληροφορίες σχετικά με τις τεχνολογίες δεδομένων και τις στρατηγικές για να σας καθοδηγήσει καθώς οδηγείτε τους οργανισμούς σας. Σας προσκαλούμε να γίνετε μέλος της κοινότητάς μας, για πρόσβαση:

  • ενημερωμένες πληροφορίες για θέματα που σας ενδιαφέρουν
  • τα ενημερωτικά δελτία μας
  • κορυφαίο περιφραγμένο περιεχόμενο και μειωμένη πρόσβαση στις εκδηλώσεις high quality, όπως Μετασχηματισμός 2021: Για να μάθετε περισσότερα
  • δυνατότητες δικτύωσης και άλλα

Γίνομαι μέλος



[via]

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει τα ανεπιθύμητα σχόλια. Μάθετε πώς υφίστανται επεξεργασία τα δεδομένα των σχολίων σας.