Μελέτες εντοπίζουν σφάλματα στα μοντέλα AI που συνιστούν και διαγιγνώσκουν ασθένειες

Μελέτες εντοπίζουν σφάλματα στα μοντέλα AI που συνιστούν και διαγιγνώσκουν ασθένειες


Η έρευνα σχετικά με μεθόδους τεχνητής νοημοσύνης και μηχανικής μάθησης βάσει μοντέλου για την υγειονομική περίθαλψη υποδηλώνει ότι υπόσχονται στους τομείς της ταξινόμησης φαινοτύπων, της θνησιμότητας και της διάρκειας παραμονής και της πρότασης παρέμβασης. Αλλά τα μοντέλα παραδοσιακά αντιμετωπίζονται ως μαύρα κουτιά με την έννοια ότι το σκεπτικό πίσω από τις προτάσεις τους δεν εξηγείται ή δικαιολογείται. Αυτή η έλλειψη ερμηνευσιμότητας, καθώς και η προκατάληψη στα σύνολα δεδομένων κατάρτισης, απειλεί να παρακωλύσει την αποτελεσματικότητα αυτών των τεχνολογιών στην ICU.

Δύο μελέτες που δημοσιεύτηκαν αυτήν την εβδομάδα επισημαίνουν τις προκλήσεις που πρέπει να ξεπεραστούν κατά την εφαρμογή της τεχνητής νοημοσύνης σε εγκαταστάσεις φροντίδας. Στην πρώτη, ερευνητές από το Πανεπιστήμιο της Νότιας Καλιφόρνιας στο Λος Άντζελες πολύτιμος ιδιότητα μοντέλων που εκπαιδεύτηκαν με το Clinical Data Mart για Εντατική Φροντίδα IV (MIMIC-IV), το μεγαλύτερο διαθέσιμο ιατρικό αρχείο δεδομένων. Το άλλο, αυτό ήταν συν-συγγραφέας από επιστήμονες στο Πανεπιστήμιο Queen Mary, διερευνά τα τεχνικά εμπόδια στο σχηματισμό αμερόληπτων μοντέλων υγειονομικής περίθαλψης. Και οι δύο καταλήγουν στο συμπέρασμα ότι φαινομενικά «σωστά» μοντέλα που έχουν σχεδιαστεί για τη διάγνωση ασθενειών και προτείνουν θεραπείες είναι ευπαθή σε ανεπιθύμητα και ανεπιθύμητα φύλα και φυλετικές προκαταλήψεις.

Όπως σημειώνουν οι ερευνητές στο Πανεπιστήμιο της Νότιας Καλιφόρνιας, το MIMIC-IV περιέχει δεδομένα που δεν έχουν ταυτοποιηθεί από 383.220 ασθενείς που έχουν εισαχθεί σε μονάδα εντατικής θεραπείας (ICU) ή σε τμήμα έκτακτης ανάγκης στο ιατρικό κέντρο Beth Israel Deaconess στη Βοστώνη της Μασαχουσέτης μεταξύ 2008 και 2019. -Οι ειδικοί επικεντρώθηκαν σε ένα υποσύνολο 43,005 εισαγωγών ICU, φιλτράροντας τους ασθενείς κάτω των 15 ετών που δεν είχαν επισκεφθεί ICU περισσότερες από μία φορές ή που είχαν μείνει λιγότερο από 24 ώρες. Τα δείγματα περιελάμβαναν παντρεμένους ή ανύπανδρους ασιατικούς, μαύρους, ισπανικούς και λευκούς άνδρες και γυναίκες νοσοκομειακούς ασθενείς με Medicaid, Medicare ή ιδιωτική ασφάλιση.

Σε ένα από τα πολλά πειράματα για να προσδιορίσουν σε ποιο βαθμό μπορεί να υπάρχει προκατάληψη στην υποομάδα MIMIC-IV, οι ερευνητές εκπαίδευσαν ένα μοντέλο για να προτείνουν μία από τις πέντε κατηγορίες μηχανικού αερισμού. Ανησυχητικά, διαπίστωσαν ότι οι προτάσεις του μοντέλου διέφεραν μεταξύ διαφορετικών εθνικών ομάδων. Οι μαύρες και ισπανικές ομάδες είχαν κατά μέσο όρο λιγότερες πιθανότητες να λάβουν θεραπείες εξαερισμού, ενώ έλαβαν επίσης μικρότερη διάρκεια θεραπείας.

Σύμφωνα με τους ερευνητές, η κατάσταση ασφάλισης φαίνεται επίσης ότι έπαιξε ρόλο στη διαδικασία λήψης αποφάσεων για το μοντέλο θεραπείας του αναπνευστήρα. Οι ιδιωτικά ασφαλισμένοι ασθενείς τείνουν να λαμβάνουν μακρύτερες και μεγαλύτερες θεραπείες εξαερισμού από τους ασθενείς με Medicare και Medicaid, πιθανώς επειδή οι ασθενείς με γενναιόδωρη ασφάλιση μπορούσαν να έχουν καλύτερη θεραπεία.

Οι ερευνητές προειδοποιούν ότι υπάρχουν “πιο σύγχυση παράγοντες” στο MIMIC-IV που μπορεί να έχουν προκαλέσει προκατάληψη στις προβλέψεις του αναπνευστήρα. Ωστόσο, το δείχνουν ως κίνητρο για μια πιο προσεκτική ματιά στα μοντέλα υγειονομικής περίθαλψης και τα σύνολα δεδομένων που χρησιμοποιούνται για την εκπαίδευσή τους.

Στη μελέτη που δημοσιεύθηκε από ερευνητές στο Πανεπιστήμιο Queen Mary, το επίκεντρο ήταν η δίκαιη ταξινόμηση της ιατρικής εικόνας. Χρησιμοποιώντας το CheXpert, ένα σύνολο δεδομένων ακτινογραφίας αναφοράς που περιλαμβάνει 224.316 σχολιασμένες ακτινογραφίες, οι συν-συγγραφείς εκπαίδευσαν ένα μοντέλο για να προβλέψουν μία από τις πέντε ασθένειες από μία μόνο εικόνα. Στη συνέχεια αναζήτησαν ανισορροπίες στις προβλέψεις που παρέχονται από το μοντέλο για άνδρες έναντι γυναικών ασθενών.

Πριν εκπαιδεύσουν το μοντέλο, οι ερευνητές εφάρμοσαν τρεις τύπους “κανονικοποιητών” σχεδιασμένων για τη μείωση της προκατάληψης. Αυτό είχε το αντίθετο από το επιθυμητό αποτέλεσμα: κατά την προπόνηση με τους κανονικοποιητές, το σχέδιο ήταν ομοιόμορφο Πιο λιγο δικαίωμα όταν εκπαιδεύεται χωρίς τακτοποιητές. Οι ερευνητές σημειώνουν ότι ένας κανονικοποιητής, ένας “ίσος απώλεια” κανονικοποιητής, πέτυχε καλύτερη ισοτιμία μεταξύ ανδρών και γυναικών. Ωστόσο, αυτή η ισοτιμία έχει κόστος για μεγαλύτερη ανισότητα στις προβλέψεις σε όλες τις ηλικιακές ομάδες.

“Τα μοντέλα μπορούν να προσαρμόσουν εύκολα τα εκπαιδευτικά δεδομένα και έτσι να δώσουν μια ψευδή αίσθηση ορθότητας κατά τη διάρκεια της προπόνησης που δεν γενικεύεται στο σύνολο των δοκιμών”, έγραψαν οι ερευνητές. “Τα ευρήματά μας περιγράφουν ορισμένους από τους περιορισμούς των τρεχουσών παρεμβάσεων χρονοδιαγράμματος τρένων για δίκαιη μάθηση.”

Οι δύο μελέτες βασίζονται σε προηγούμενη έρευνα που δείχνει διεισδυτική προκατάληψη σε μοντέλα πρόβλεψης υγειονομικής περίθαλψης. Λόγω της απροθυμίας έκδοσης κώδικα, συνόλων δεδομένων και τεχνικών, πολλά από τα δεδομένα που χρησιμοποιήθηκαν για την εκπαίδευση αλγορίθμων για τη διάγνωση και τη θεραπεία της νόσου θα μπορούσαν να διαιωνίσουν τις ανισότητες.

Πρόσφατα, μια ομάδα Βρετανών επιστημόνων βρέθηκαν ότι σχεδόν όλα τα σύνολα δεδομένων οφθαλμικών παθήσεων προέρχονται από ασθενείς στη Βόρεια Αμερική, την Ευρώπη και την Κίνα, πράγμα που σημαίνει ότι οι αλγόριθμοι διάγνωσης των οφθαλμικών παθήσεων είναι λιγότερο πιθανό να λειτουργούν καλά για φυλετικές ομάδες σε υποεκπροσωπούμενες χώρες. Σε ένα άλλο αυτή μελετάειΟι ερευνητές του Πανεπιστημίου του Στάνφορντ δήλωσαν ότι τα περισσότερα από τα δεδομένα των ΗΠΑ για μελέτες που αφορούν ιατρικές χρήσεις της τεχνητής νοημοσύνης προέρχονται από την Καλιφόρνια, τη Νέα Υόρκη και τη Μασαχουσέτη. ΕΝΑ μελέτη αλγορίθμου της UnitedHealth Team αποφάσισε ότι θα μπορούσε να υποτιμήσει τον αριθμό των μαύρων ασθενών που χρειάζονται περισσότερη φροντίδα κατά το ήμισυ. Ερευνητές στο Πανεπιστήμιο του Τορόντο, το Vector Institute και το MIT έχουν δείξει ότι τα ευρέως χρησιμοποιούμενα σύνολα δεδομένων ακτινογραφίας στο στήθος κωδικοποιεί φυλετικές, φυλετικές και κοινωνικοοικονομικές προκαταλήψεις. Είναι στην αυξανόμενη μάζα εργασίας προτείνει ότι οι αλγόριθμοι ανίχνευσης καρκίνου του δέρματος τείνουν να είναι λιγότερο ακριβείς όταν χρησιμοποιούνται σε μαύρους ασθενείς, εν μέρει επειδή τα μοντέλα AI εκπαιδεύονται κυρίως σε εικόνες ασθενών με ανοιχτόχρωμο δέρμα.

Η προκατάληψη δεν είναι ένα εύκολο πρόβλημα να επιλυθεί, αλλά οι συν-συγγραφείς μιας πρόσφατης μελέτης συνιστούν την εφαρμογή επαγγελματιών υγείας “Αυστηρή” ανάλυση ορθότητας πριν από την ανάπτυξη ως μία λύση. Υποστηρίζουν επίσης ότι οι σαφείς αποποιήσεις σχετικά με τη διαδικασία συλλογής συνόλων δεδομένων και την προκύπτουσα πιθανή προκατάληψη θα μπορούσαν να βελτιώσουν τις αξιολογήσεις για κλινική χρήση.

VentureBeat

Η αποστολή της VentureBeat είναι να είναι ένα ψηφιακό τετράγωνο πόλης για τεχνικούς υπεύθυνους λήψης αποφάσεων για να αποκτήσουν πληροφορίες σχετικά με τη μετασχηματιστική τεχνολογία και συναλλαγές. Ο ιστότοπός μας παρέχει βασικές πληροφορίες σχετικά με τις τεχνολογίες δεδομένων και τις στρατηγικές για να σας καθοδηγήσει καθώς οδηγείτε τους οργανισμούς σας. Σας προσκαλούμε να γίνετε μέλος της κοινότητάς μας, για πρόσβαση:

  • ενημερωμένες πληροφορίες για θέματα που σας ενδιαφέρουν
  • τα ενημερωτικά δελτία μας
  • Περιεχόμενο περιφραγμένο με κορυφαία σκέψη και μειωμένη πρόσβαση στις πολύτιμες εκδηλώσεις μας, όπως το Completely transform
  • δυνατότητες δικτύωσης και άλλα

Γίνομαι μέλος



[via]

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει τα ανεπιθύμητα σχόλια. Μάθετε πώς υφίστανται επεξεργασία τα δεδομένα των σχολίων σας.