Igor Bonifacic

Το Facebook ζήτησε από τους ανθρώπους να μοιραστούν την ηλικία και το φύλο τους για να δημιουργήσουν ένα πιο δίκαιο σύνολο δεδομένων AI | Έντζετ


Το Fb μοιράζεται ένα νέο και διαφορετικό σύνολο δεδομένων με την ευρύτερη κοινότητα AI. Σε ένα αρχείο Ενα δ προσδιορίζεται από VentureBeat, η εταιρεία λέει ότι αναμένει από τους ερευνητές να χρησιμοποιήσουν τη συλλογή, που ονομάζεται Everyday Conversations, για να δοκιμάσουν τα μοντέλα μηχανικής εκμάθησης για προκατάληψη. Το σύνολο δεδομένων περιλαμβάνει 3.011 άτομα σε 45.186 βίντεο και πήρε το όνομά του από το γεγονός ότι περιλαμβάνει εκείνους τους ανθρώπους που παρέχουν απρόγραφες απαντήσεις στις ερωτήσεις της εταιρείας.

Το σημαντικό πράγμα για τις απλές συνομιλίες είναι ότι περιλαμβάνει αμειβόμενους ηθοποιούς που το Fb ζήτησε ρητά να μοιραστούν την ηλικία και το φύλο τους. Η εταιρεία προσέλαβε επίσης εκπαιδευμένους επαγγελματίες για την επισήμανση του περιβάλλοντος φωτισμού και των τόνων του δέρματος των ατόμων που εμπλέκονται σύμφωνα με το Κλίμακα Fitzpatrick, ένα σύστημα που αναπτύχθηκε από τον δερματολόγο για να ταξινομήσει τα χρώματα του ανθρώπινου δέρματος. Το Fb λέει ότι το σύνολο δεδομένων είναι το πρώτο του είδους του.

Δεν χρειάζεται να κοιτάξετε μακριά για να βρείτε παραδείγματα προκατάληψης στο AI. Ενας πρόσφατες σπουδές διαπίστωσε ότι τα προγράμματα αναγνώρισης και ανάλυσης προσώπου, όπως το Confront ++, θα ταξινομήσουν τα μαύρα πρόσωπα ως πιο θυμωμένα από τα λευκά τους, ακόμα κι αν και οι δύο άνδρες χαμογελούν. Αυτά τα ίδια ελαττώματα έχουν βρεθεί στο λογισμικό AI που αντιμετωπίζει ο καταναλωτής. Το 2015, η Google τροποποίησε τις Φωτογραφίες για να σταματήσει να χρησιμοποιεί μια ετικέτα αφού ο μηχανικός λογισμικού Jacky Alciné ανακάλυψε ότι η εφαρμογή αναγνώρισε εσφαλμένα τους μαύρους φίλους του ως “γορίλες”. Μπορείτε να εντοπίσετε πολλά από αυτά τα προβλήματα πίσω στα σύνολα δεδομένων που χρησιμοποιούν οι οργανισμοί για να εκπαιδεύσουν το λογισμικό τους, και εδώ μπορεί να βοηθήσει μια τέτοια πρωτοβουλία. Μια πρόσφατη μελέτη MIT για δημοφιλή σύνολα δεδομένων μηχανικής μάθησης διαπίστωσε ότι περίπου το 3,4% των δεδομένων σε αυτές τις συλλογές ήταν ανακριβείς ή λανθασμένες.

Ενώ το Fb περιγράφει τις περιστασιακές συνομιλίες ως “καλό γενναίο πρώτο βήμα προς τα εμπρός”, παραδέχεται ότι το σύνολο δεδομένων δεν είναι τέλειο. Αρχικά, περιλαμβάνει μόνο άτομα από τις Ηνωμένες Πολιτείες. Η εταιρεία επίσης δεν ζήτησε από τους συμμετέχοντες να προσδιορίσουν την καταγωγή τους και, όταν αφορούσαν το φύλο, οι μόνες επιλογές που είχαν ήταν «άνδρες», «γυναίκες» και «άλλες». Ωστόσο, τον επόμενο χρόνο, σκοπεύει να κάνει το σύνολο δεδομένων πιο περιεκτικό.



[via]

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει τα ανεπιθύμητα σχόλια. Μάθετε πώς υφίστανται επεξεργασία τα δεδομένα των σχολίων σας.