Οι συνθετικές φωνές που δημιουργούνται από τεχνητή νοημοσύνη βρίσκονται πλέον παντού: σε συστήματα πλοήγησης, ψηφιακούς βοηθούς και αυτοματοποιημένες τηλεφωνικές υπηρεσίες.

Παρότι η τεχνολογία έχει εξελιχθεί εντυπωσιακά, μια νέα έρευνα δείχνει ότι οι άνθρωποι εξακολουθούν να μπορούν να ξεχωρίζουν μια ανθρώπινη φωνή από μια τεχνητά παραγόμενη - και μάλιστα όχι μόνο από τον τρόπο που ακούγεται, αλλά και από το τι λέγεται και αν ο ακροατής κατανοεί τη γλώσσα.

Η μελέτη πραγματοποιήθηκε από το Ινστιτούτο Max-Planck για την εμπειρική αισθητικά στη Φρανκφούρτη και δημοσιεύθηκε στο επιστημονικό περιοδικό "Speech Communication".

Οι ερευνητές δημιούργησαν 16 σύντομες γερμανικές προτάσεις, όπως "Το αγόρι χάρισε στον πατέρα του ένα καπέλο". Στη συνέχεια τροποποίησαν τις προτάσεις αλλάζοντας τη σειρά των λέξεων ή αντικαθιστώντας τις με ψευδολέξεις που ακούγονταν παρόμοιες.

Κάθε εκδοχή ηχογραφήθηκε τόσο από ανθρώπους ομιλητές όσο και από συστήματα συνθετικής ομιλίας (Text-to-Speech).

Στο πρώτο πείραμα, 40 γερμανόφωνοι συμμετέχοντες κλήθηκαν να αξιολογήσουν πόσο "ανθρώπινες" ακούγονταν οι φωνές. Τα αποτελέσματα έδειξαν ότι οι τεχνητές φωνές θεωρήθηκαν συνολικά λιγότερο ανθρώπινες.

Παράλληλα, η ακουστική ανάλυση αποκάλυψε αντικειμενικές διαφορές στον τόνο, τη χροιά και την προσωδία ανάμεσα στις ανθρώπινες και τις συνθετικές φωνές.

Όπως ανέφερε η επικεφαλής της έρευνας Γιάνικ Βέστερ, οι διαφορές αυτές στην ηχητική ποιότητα και στον επιτονισμό επηρεάζουν σημαντικά τον τρόπο με τον οποίο αντιλαμβανόμαστε την "ανθρωπινότητα" μιας φωνής.

Η έρευνα έδειξε επίσης ότι σημαντικό ρόλο παίζει και το περιεχόμενο του λόγου. Οι αλλοιωμένες προτάσεις ακούγονταν λιγότερο ανθρώπινες, είτε εκφωνούνταν από άνθρωπο είτε από τεχνητή φωνή. Ωστόσο, αυτό συνέβαινε μόνο όταν οι ακροατές κατανοούσαν τη γλώσσα.

Στο δεύτερο πείραμα συμμετείχαν γερμανόφωνοι, ισπανόφωνοι και τουρκόφωνοι ακροατές. Όσοι δεν γνώριζαν γερμανικά δεν επηρεάζονταν από το νόημα των προτάσεων κατά την αξιολόγηση των φωνών. Παρ’ όλα αυτά, μπορούσαν και αυτοί να διακρίνουν σε γενικές γραμμές τις ανθρώπινες από τις συνθετικές φωνές.

Ένα ακόμη ενδιαφέρον εύρημα αφορά την ηλικία των ακροατών. Σύμφωνα με τη συντονίστρια της έρευνας Πολίν Λαρουί-Μαεστρί, οι μεγαλύτεροι σε ηλικία άνθρωποι τείνουν να αντιλαμβάνονται τις συνθετικές φωνές ως πιο ανθρώπινες σε σύγκριση με τους νεότερους.

Η ερευνητική ομάδα σχεδιάζει ήδη νέα μελέτη με συμμετέχοντες διαφορετικών ηλικιακών ομάδων, προκειμένου να κατανοήσει καλύτερα γιατί οι μεγαλύτεροι άνθρωποι είναι πιο δεκτικοί στις φωνές που παράγει η τεχνητή νοημοσύνη.

Προσθέστε το iatronet.gr στο Discover

Ειδήσεις υγείας σήμερα
Καρκίνος μαστού: Εξέταση αίματος εντοπίζει πρώιμα σημάδια υποτροπής [μελέτη]
Το ''Καρκινάκι’’ σχεδιάζει το Ψηφιακό Σχολείο του Μέλλοντος για  μικρούς υπερήρωες
Αυγά και γιαούρτι: Πώς συγκρίνονται σαν πρωινό