Η Google αναζητά βοήθεια για την ανάπτυξη μιας εφαρμογής Android που στοχεύει στην παροχή περισσότερων επιλογών επικοινωνίας για άτομα με προβλήματα ομιλίας. Το Project Relate της Google, όπως ονομάζεται τώρα η προσπάθεια και η εφαρμογή, θα παρέχει μεταγραφή και σύνθεση φωνής που θα μπορούσε να διευκολύνει τους χρήστες.

Δείτε επίσης: Η Google επιτρέπει τις εναλλακτικές in-app πληρωμές

Το έργο προέρχεται από το Project Euphonia, το οποίο ανακοινώθηκε για πρώτη φορά το 2019. Η προσπάθεια ξεκίνησε από τον ερευνητή της Google, Dimitri Kanevsky, ο οποίος ο ίδιος έχει προβλήματα ομιλίας και προσέφερε τις γνώσεις του στη λύση που βασίζεται στην τεχνητή νοημοσύνη. Τώρα, ένας από τους κύριους συνεργάτες του έργου και χρήστες της εφαρμογής είναι η Aubrie Lee, η οποία είναι στην ομάδα μάρκετινγκ και λόγω της μυϊκής δυστροφίας δυσκολεύεται να γίνει κατανοητή τόσο από άλλα άτομα όσο και από εφαρμογές. (Μπορείτε να τη δείτε στο βίντεο εδώ ή παρακάτω.)

Το δεδομένο είναι ότι οι μηχανές αναγνώρισης ομιλίας χρειάζονται πολλή ηχογραφημένη ομιλία για να μάθουν πώς να την ερμηνεύουν σωστά και ότι τα δεδομένα είναι προκατειλημμένα υπέρ κοινών μοτίβων ομιλίας. Τα άτομα με προφορά δεν εκπροσωπούνται τόσο καλά σε αυτά τα σύνολα δεδομένων, επομένως δεν είναι και κατανοητά — και ελάχιστα δεδομένα από άτομα με προβλήματα ομιλίας περιλαμβάνονται, καθιστώντας πρακτικά αδύνατο για αυτούς να χρησιμοποιούν κοινές συσκευές με φωνητική ενέργεια.

Οι νεοφυείς επιχειρήσεις και οι βελτιώσεις στη βασική τεχνολογία βελτιώνουν την κατανόηση της γλώσσας με προφορά, αλλά χρειάζεται ιδιαίτερη προσπάθεια για τη συλλογή και ανάλυση των εξαιρετικά εξατομικευμένων προτύπων ομιλίας των ατόμων με αναπηρίες. Κάθε φωνή είναι διαφορετική, αλλά τα ασυνήθιστα και μοναδικά μοτίβα που προκύπτουν από εγκεφαλικό ή τραυματισμό μπορεί να είναι δύσκολο να τα κατανοήσει ένα σύστημα machine learning.

Δείτε επίσης: Η Google καταργεί την υποστήριξη Chrome sync (Chrome 48/παλαιότερα)

Το Project Relate είναι στον πυρήνα του ένα καλύτερο εργαλείο μεταγραφής φωνής για άτομα με προβλήματα ομιλίας. Η λειτουργία “Listen” μετατρέπει την ομιλία του χρήστη απευθείας σε κείμενο, ώστε να μπορεί να επικολληθεί αλλού ή να διαβαστεί από άλλους. Το “Repeat” ακούει πρώτα και μετά επαναλαμβάνει αυτό που είπαν με μια φωνή που είναι πιο καθαρή. Ο “Assistant” ουσιαστικά προωθεί τη μεταγραμμένη ομιλία του απευθείας στον Google Assistant για συνήθεις εργασίες όπως η αναπαραγωγή μουσικής ή η ερώτηση για τον καιρό.

Η Google τεστάρει το app Project Relate για άτομα με προβλήματα ομιλίας

Δείτε επίσης: Η Google εξηγεί γιατί ο σαρωτής δακτυλικών αποτυπωμάτων του Pixel 6 είναι δυσλειτουργικός

Για να ενεργοποιηθούν αυτές οι δυνατότητες, η δουλειά της Google ήταν να συλλέξει όσο το δυνατόν περισσότερα δεδομένα και για τον σκοπό αυτό οι ερευνητές σημειώνουν ότι έχουν δημιουργήσει μια βάση δεδομένων με περισσότερα από ένα εκατομμύριο δείγματα ομιλίας από εθελοντές. Αυτό χρησιμοποιήθηκε για την εκπαίδευση αυτού που θα μπορούσε να ονομαστεί βασικό επίπεδο νοημοσύνης για την αναγνώριση ομιλίας AI. Αλλά όπως κάθε άλλο σύστημα ML, όσο περισσότερα δεδομένα – και όσο πιο συγκεκριμένα είναι αυτά τα δεδομένα για την ατομική περίπτωση χρήσης – τόσο το καλύτερο.

Η εταιρεία στρατολογεί έναν πρώτο γύρο δοκιμαστών από τον πραγματικό κόσμο για να χρησιμοποιούν την εφαρμογή τακτικά. Το πρώτο βήμα θα είναι η καταγραφή ενός συνόλου φράσεων, οι οποίες θα ενσωματωθούν στο μοντέλο ομιλίας για να ανταποκρίνονται καλύτερα στα μοτίβα ομιλίας τους. Εάν πιστεύετε ότι αυτό θα μπορούσε να είναι χρήσιμο στην καθημερινή σας ζωή, μη διστάσετε να εγγραφείτε ως δυνητικός εθελοντής και ίσως βοηθήσετε να γίνει η εφαρμογή καλύτερη για όλους.

Πηγή πληροφοριών: techcrunch.com