Σύνοψη

Η Google αναπτύσσει το σύστημα PHRM (Passive Heart Rate Monitoring) για συνεχή παρακολούθηση της καρδιακής λειτουργίας χωρίς τη χρήση wearable. Το σύστημα αξιοποιεί την μπροστινή κάμερα του smartphone για καταγραφή βίντεο διάρκειας 8 δευτερολέπτων, αμέσως μετά από κάθε ξεκλείδωμα της οθόνης. Λειτουργεί μέσω απομακρυσμένης φωτοπληθυσμογραφίας (rPPG), αναλύοντας τις απειροελάχιστες αλλαγές χρώματος στο πρόσωπο με τη βοήθεια βαθιάς μηχανικής μάθησης. Στις δοκιμές πραγματικών συνθηκών παρουσίασε περιθώριο σφάλματος κάτω του 10% (MAPE) σε σύγκριση με ιατρικά ηλεκτροκαρδιογραφήματα (ECG). Εκπαιδεύτηκε εντατικά πάνω στην κλίμακα Monk, εξασφαλίζοντας απόλυτη ακρίβεια και μηδενική μεροληψία για όλους τους τόνους δέρματος. Όλη η επεξεργασία των δεδομένων εκτελείται τοπικά στη συσκευή, χωρίς τα βίντεο να μεταφέρονται στο cloud.

Το σύστημα Passive Heart Rate Monitoring (PHRM) της Google χρησιμοποιεί την μπροστινή κάμερα του smartphone και αλγορίθμους βαθιάς μηχανικής μάθησης για να καταγράφει τον καρδιακό ρυθμό. Λαμβάνοντας ένα βίντεο 8 δευτερολέπτων κατά το ξεκλείδωμα της οθόνης, εντοπίζει τις μικρο-αλλαγές στο χρώμα του δέρματος προσφέροντας ακρίβεια αντίστοιχη των ηλεκτροκαρδιογραφημάτων (σφάλμα

Η τεχνολογία rPPG και η μετάβαση από το hardware στο software

Η παρακολούθηση της καρδιακής υγείας απαιτούσε μέχρι σήμερα εξειδικευμένο εξοπλισμό. Τα σύγχρονα smartwatches και τα fitness trackers ενσωματώνουν οπτικούς αισθητήρες για την καταγραφή των παλμών, όμως η Google επιχειρεί να μεταφέρει αυτή τη δυνατότητα αποκλειστικά στο επίπεδο του λογισμικού των smartphones. Ο πυρήνας αυτής της ιατρικής καινοτομίας βασίζεται στην απομακρυσμένη φωτοπληθυσμογραφία (remote Photoplethysmography – rPPG).

Η παραδοσιακή φωτοπληθυσμογραφία, όπως ακριβώς αυτή που συναντάμε στα ιατρικά οξύμετρα ή στα ρολόγια της Garmin, της Apple και της Fitbit, λειτουργεί εκπέμποντας δέσμες φωτός απευθείας στο δέρμα του καρπού ή του δακτύλου. Μετρώντας την αντανάκλαση του φωτός, οι αισθητήρες υπολογίζουν τον όγκο του αίματος που διαπερνά τα αγγεία σε κάθε χτύπο της καρδιάς. Η απομακρυσμένη φωτοπληθυσμογραφία αλλάζει εντελώς τη διαδικασία, καταργώντας την ανάγκη φυσικής επαφής με το ανθρώπινο σώμα. Η κάμερα υψηλής ανάλυσης του smartphone αναλαμβάνει να “διαβάσει” τις απειροελάχιστες, σχεδόν αόρατες στο γυμνό μάτι, χρωματικές μεταβολές στο πρόσωπο του χρήστη, οι οποίες προκαλούνται από την παλμική ροή του αίματος κάτω από την επιδερμίδα.

Η όλη διαδικασία εκτελείται αποκλειστικά στο παρασκήνιο, ελαχιστοποιώντας την απαίτηση για ενεργή συμμετοχή του χρήστη. Το εξειδικευμένο λογισμικό ενεργοποιείται αμέσως μόλις ο κάτοχος ξεκλειδώσει τη συσκευή του χρησιμοποιώντας το σύστημα αναγνώρισης προσώπου ή απλώς κοιτώντας την οθόνη του κινητού του κατά την καθημερινή χρήση. Σε αυτό ακριβώς το χρονικό “παράθυρο”, η κάμερα καταγράφει ένα αρχείο βίντεο διάρκειας μόλις 8 δευτερολέπτων. Στη συνέχεια, τα οπτικά δεδομένα περνούν από προηγμένα νευρωνικά δίκτυα για να εξάγουν τόσο τον τρέχοντα Καρδιακό Ρυθμό (Heart Rate – HR) όσο και τον Καρδιακό Ρυθμό Ηρεμίας (Resting Heart Rate – RHR).

Ιστορικά, οι οπτικοί αισθητήρες καταγραφής παλμών αντιμετώπιζαν σοβαρότατα προβλήματα ακρίβειας στα σκουρόχρωμα δέρματα. Η αυξημένη ποσότητα μελανίνης απορροφά μεγαλύτερο ποσοστό του φωτός, καθιστώντας εξαιρετικά δύσκολη την ανίχνευση της ροής του αίματος από τις συμβατικές κάμερες. Η προβληματική αυτή κατάσταση οδήγησε πρόσφατα τον Αμερικανικό Οργανισμό Φαρμάκων και Τροφίμων (FDA) να εκδώσει νέες αυστηρές κατευθυντήριες οδηγίες, επιβάλλοντας τη σωστή εκπροσώπηση όλων των τόνων δέρματος στις κλινικές δοκιμές των νέων ιατρικών συσκευών.

Για την ανάπτυξη του συστήματος PHRM, η Google προχώρησε στη δημιουργία της μεγαλύτερης και πιο ποικιλόμορφης βάσης δεδομένων που έχει υπάρξει ποτέ στον επιστημονικό τομέα της απομακρυσμένης φωτοπληθυσμογραφίας. Οι ερευνητές χρησιμοποίησαν την επίσημη κλίμακα Monk Skin Tone για να εξασφαλίσουν την απόλυτη αναλογική εκπροσώπηση στο δείγμα. Το τελικό δείγμα περιελάμβανε τουλάχιστον 25% συμμετέχοντες με ανοιχτόχρωμο δέρμα (κατηγορίες Monk 1-4), επιπλέον 25% με μεσαίο τόνο δέρματος (Monk 5-7) και πάνω από 33% με έντονα σκουρόχρωμο δέρμα (Monk 8-10).

Το μοντέλο τεχνητής νοημοσύνης εκπαιδεύτηκε εντατικά στις πιο απαιτητικές χρωματικά περιπτώσεις, προκειμένου να καταπολεμηθεί η προκατάληψη των αλγορίθμων. Τα τελικά αποτελέσματα επιβεβαίωσαν ότι το μέσο απόλυτο ποσοστιαίο σφάλμα (MAPE) παρέμεινε σταθερά κάτω από το 10% για όλες ανεξαιρέτως τις πληθυσμιακές ομάδες. Αυτό πρακτικά σημαίνει πως η απόδοση του αλγορίθμου είναι πλέον ομοιόμορφη, εξαλείφοντας τον κίνδυνο των λανθασμένων ιατρικών ενδείξεων που χαρακτήριζε τα συστήματα rPPG της προηγούμενης γενιάς.

Εργαστηριακές δοκιμές, ανάλυση Bland-Altman και πραγματική χρήση

Η τεχνική ανάπτυξη της νέας πλατφόρμας δεν περιορίστηκε αποκλειστικά σε αποστειρωμένα εργαστηριακά περιβάλλοντα, καθώς η πραγματική χρήση ενός smartphone κρύβει απρόβλεπτες μεταβλητές. Το πρώτο στάδιο περιελάμβανε δεδομένα από 365 συμμετέχοντες υπό απολύτως ελεγχόμενες συνθήκες φωτισμού, οι οποίοι ήταν συνδεδεμένοι ταυτόχρονα με μηχανήματα κλινικού ηλεκτροκαρδιογραφήματος (ECG) για την ακριβή πιστοποίηση των μετρήσεων.

Το αληθινό τεστ όμως πραγματοποιήθηκε σε συνθήκες εντελώς ελεύθερης καθημερινής χρήσης, καθιστώντας την έρευνα πρωτοποριακή. Σε μια δοκιμή 8 ημερών, 231 χρήστες εγκατέστησαν την ειδική εφαρμογή συλλογής δεδομένων στα προσωπικά τους smartphones, ενώ φορούσαν παράλληλα ένα πιστοποιημένο ηλεκτροκαρδιογράφημα θώρακα και ένα fitness tracker επιπέδου Fitbit Charge 6. Κατά μέσο όρο, καταγράφονταν περίπου 230 βίντεο των 8 δευτερολέπτων καθημερινά ανά χρήστη.

Οι μετρήσεις του συστήματος PHRM έδειξαν εντυπωσιακή ταύτιση με τον πιστοποιημένο ιατρικό εξοπλισμό. Το μέσο σφάλμα στον υπολογισμό της συχνότητας των παλμών διαμορφώθηκε μόλις στο 6,09% σε πραγματικές συνθήκες. Αναφορικά με τον Καρδιακό Ρυθμό Ηρεμίας (RHR), ένα από τα πιο κρίσιμα και μακροπρόθεσμα βιομετρικά στοιχεία για την καρδιαγγειακή υγεία, το σύστημα παρουσίασε απόκλιση μικρότερη των 5 παλμών ανά λεπτό συγκριτικά με τα δεδομένα του φορετού αισθητήρα της Fitbit. Μάλιστα, η στατιστική ανάλυση Bland-Altman που εφαρμόστηκε από τους ερευνητές έδειξε ότι το PHRM υποεκτιμούσε τον καρδιακό ρυθμό κατά μόλις 0,64 χτύπους ανά λεπτό κατά μέσο όρο, αποδεικνύοντας τον εξαιρετικά υψηλό βαθμό αξιοπιστίας των αλγορίθμων.

Παράλληλα, οι ερευνητές της Google διαπίστωσαν ότι το σύστημα ήταν σε θέση να επιβεβαιώσει υπαρκτούς καρδιαγγειακούς κινδύνους. Οι συμμετέχοντες με σταθερά υψηλότερο καρδιακό ρυθμό ηρεμίας σύμφωνα με το PHRM, παρουσίαζαν συνήθως υψηλότερο Δείκτη Μάζας Σώματος (BMI) και χαμηλότερη καρδιοαναπνευστική ικανότητα (χαμηλό VO2 max), στατιστικό που ταυτίζεται απόλυτα με τις ισχύουσες ιατρικές μελέτες για την υγεία της καρδιάς.

Τεχνικοί περιορισμοί και η σημασία της ιδιωτικότητας των δεδομένων

Παρά τα υψηλά ποσοστά επιτυχίας της έρευνας, το σύστημα καλείται να αντιμετωπίσει συγκεκριμένες πρακτικές και τεχνικές προκλήσεις. Η καταγραφή των απειροελάχιστων χρωματικών αλλαγών μέσω κάμερας ακυρώνεται πολύ εύκολα εάν ο χρήστης μιλάει, κινεί απότομα το κεφάλι του ή περπατάει κατά το ξεκλείδωμα της συσκευής. Επιπλέον, η αστάθεια της οπτικής γωνίας και ο έντονος “θόρυβος” από τις συνεχείς εναλλαγές του φωτισμού απαιτούν τη χρήση εξελιγμένων φίλτρων Kalman για την αποτελεσματική απόρριψη των πιθανών λανθασμένων ενδείξεων.

Σύμφωνα με τους αρμόδιους μηχανικούς της Google, το αμέσως επόμενο βήμα ανάπτυξης αφορά τη βελτίωση των αλγορίθμων σταθεροποίησης βίντεο και την ευρύτερη αξιοποίηση του επιταχυνσιόμετρου του smartphone. Μέσω αυτού του συνδυασμού, το λογισμικό θα αναγνωρίζει αυτόματα πότε το τηλέφωνο παραμένει απόλυτα σταθερό (για παράδειγμα, όταν ο χρήστης κάθεται στο γραφείο του και κοιτάζει την οθόνη) και θα ενεργοποιεί τη διαδικασία καταγραφής μόνο όταν πληρούνται οι ιδανικές συνθήκες μέτρησης.

Το ζήτημα της προστασίας της ιδιωτικότητας είναι φυσικά καίριας σημασίας, καθώς το hardware καλείται να τραβάει δεκάδες βίντεο του προσώπου του χρήστη σε καθημερινή βάση. Η Google ξεκαθαρίζει σε απόλυτο βαθμό ότι η αρχιτεκτονική του λογισμικού βασίζεται στην τοπική επεξεργασία. Τα βίντεο δεν αποστέλλονται ποτέ στο cloud ή σε εξωτερικούς servers, αναλύονται τη στιγμή ακριβώς της λήψης από τον κεντρικό επεξεργαστή της εκάστοτε συσκευής και διαγράφονται άμεσα, αφήνοντας πίσω τους αποκλειστικά τα κρυπτογραφημένα νούμερα του καρδιακού ρυθμού.