Een paar weken geleden hebben wij op Instagram een quiz geplaatst met een aantal vragen over spraakassistenten. In die quiz zaten ook vragen over interacties tussen doven & slechthorenden en spraakassistenten. Voor veel van ons is het gebruiken van Siri, Google Assistant of Amazon Alexa – als je je over de privacyzorgen heen kan zetten – namelijk de normaalste zaak van de wereld, maar dat geldt niet voor iedereen.
Hoe mooi spraakassistenten namelijk ook mogen zijn, ze zijn nog niet perfect. Een groep die dat meer merkt dan misschien wel elk ander, zijn mensen met een gehoorbeperking. Om meer te weten te komen over de problemen die deze groep ervaart bij het gebruik van spraakassistenten spraken wij Ardalan Aziz, ICT-medewerker bij het Instituut Gebaren, Taal & Dovenstudies van de HU. Aziz is zelf doof, maar hij gebruikt wél spraakassistenten. Met hulp van zijn collega Christiaan Plug als vertaler, interviewden wij Aziz over waar hij zelf tegenaan loopt en hoe het hem toch lukt om spraakassistenten te integreren in zijn interacties met technologie.
Toegankelijkheid
Spraakassistenten zijn niet voldoende toegankelijk voor doven volgens Aziz: “Wanneer ik iets vraag, dan is het antwoord mij niet altijd duidelijk, omdat ik het niet kan horen. Ook als ik typ, begrijpt de spraakassistent niet altijd wat ik bedoel. Het is dus niet betrouwbaar.” Als je de quiz die wij hier plaatsten hebt gedaan heb je dit al gehoord, maar wist je dat de frequentie van de standaard (vrouwelijke, hoge) stem van voice assistants lastig te horen is voor mensen met een gehoorbeperking? Terwijl deze stem juist is gekozen omdat zij als prettig wordt ervaren door de meeste gebruikers, is ze voor doven & slechthorenden een ramp.
De oplossing voor het probleem van ontoegankelijke technologie is niet eenduidig. Je zou misschien denken dat de meest voor de hand liggende optie zou zijn om alle antwoorden ook in tekstvorm te laten zien. Als je het antwoord dan niet kan horen, dan kun je in ieder geval meelezen. Maar in de meeste landen is maar liefst 75 procent van de doven & slechthorenden analfabeet. “Voor hen zou gebarentaal dus misschien een betere optie zijn”, zegt Christiaan.
Dat is ook een grote uitdaging. Er is namelijk geen universele gebarentaal. Verreweg de grootste is American Sign Language, afgekort ASL. Maar in totaal worden er wereldwijd 300 verschillende gebarentalen gebruikt door wereldwijd 70 miljoen doven. Siri, de spraakassistent die de meeste verschillende gesproken talen ondersteunt, kent er maar 21. En voor een spraakassistent is het eigenlijk net zo’n grote uitdaging als taalherkenning, maar met nog een laag: het is namelijk geen audiodata, maar visuele data.
Toch zijn er onderzoekers en bedrijven die oplossingen proberen te vinden. Dat doen zij bijvoorbeeld door afzonderlijke commando’s ‘in te programmeren’ op basis van individuele voorbeelden. Christiaan Plug legt uit: “Dat werkt eigenlijk net als vroeger, toen je je computer moest trainen om stemcommando’s te herkennen. Dat deed je dan door prompts voor te lezen, zodat hij jouw manier van praten snapte.”
Momenteel wordt diezelfde techniek toegepast om stemassistenten op individueel niveau aan te passen op gebarentaal. De gebruiker gebaart een zin, die vervolgens wordt vertaald naar de tekst-input voor de spraakassistent. Daar dan komt dan op de ‘normale’ manier, dus in audio, een reactie uit. Maar zoals we eerder al begrepen van Aziz: die reactie is niet altijd goed te begrijpen, als je een gehoorbeperking hebt. Daarnaast, zegt Aziz, blijft het omslachtig. “Persoonlijk typ ik liever. Dat ben ik gewend.”
Creatieve oplossingen
Aziz en Plug vertellen dat de problemen die doven en slechthorenden nu ondervinden met
spraakassistenten, niet uniek zijn. In de eerste iteratie van een nieuwe technologie wordt er vaak nog niet bij stil gestaan welke problemen gebruikers met een beperking zouden kunnen ondervinden. Toch vinden doven en slechthorenden zoals Ardalan Aziz zelf vaak creatieve toepassingen: “Ik gebruik mijn mobieltje vaak om te luisteren wat mensen zeggen. Door spraakherkenning kan wat zij vertellen dan om worden gezet in tekst. Dat is met name in het openbaar handig, waar bijvoorbeeld een conducteur of winkelier niet altijd weet wat ze moeten doen als ze tegenover iemand staan die niet kan horen.”
“Waar de technologie wél heel goed in is, is menselijk contact ondersteunen” meent Christiaan Plug. Dat is onder meer het resultaat van de steeds beter wordende spraakherkenningstechnologie. Het resultaat zie je bijvoorbeeld in het nieuwe project dat Google recent heeft getoond: een prototype van een bril met ingebouwde microfoons, die op je scherm vertaalt wat mensen zeggen, en dat zelfs nog van andere talen kan vertalen naar jouw moedertaal. “Telefoneren bijvoorbeeld is onmogelijk voor doven, en wat dat betreft is beeldbellen echt een uitkomst” legt Plug uit “Soms is Ardalan elders in het gebouw of niet aanwezig. Dan kan ik hem beeldbellen, en in gebarentaal communiceren.” Ook de KPN-tolk – een dienst waar doven & slechthorenden kunnen gebaren of chatten met een tolk, die voor hen telefoongesprekken met bijvoorbeeld klantenservices voert – is een goede optie wie niet goed kan horen. Daarnaast kan de gebruiker de stem van de spraakassistent inmiddels zelf kiezen en bijvoorbeeld wisselen naar een stem die makkelijker te horen is.
Christiaan de Plug herkent deze positieve ontwikkelingen: “Sinds smartphones bestaan, gaat de wereld echt open voor doven. Je zet je telefoon neer, opent Facetime en kunt met mensen communiceren die heel ergens anders zijn, allemaal met een apparaat dat je in je broekzak draagt.” Echter, vaak worden toepassingen voor mensen met een beperking echter pas later aan technologische ontwikkelingen toegevoegd. Er zou daarom nog veel meer gebruik gemaakt kunnen worden van de ervaring die er al is bij de mensen die deze technologie ook daadwerkelijk gebruiken, aldus Aziz: “Doven en slechthorenden begrijpen de problemen die mensen met die beperking ervaren het allerbeste. Zij kunnen input geven over hoe in het verleden misschien een vergelijkbaar probleem al is opgelost. Daarom is het zo belangrijk dat mensen die de technologie daadwerkelijk gebruiken al eerder worden betrokken in het ontwerpproces dan nu vaak het geval is.”
Heb jij zelf vragen over spraakassistenten? Of wil je op de hoogte blijven van onze nieuwste video’s, podcasts en artikelen? Volg ons dan op LinkedIn en YouTube!
Heb je iets van deze missie gemist? Kijk hieronder alle onderzoeken rondom Missie 5: ‘Dear Human, can I actually help you?’ snel en handig terug!
- Hey Alexa, wat zijn voice interfaces?!
- Spraakassistenten onder de loep: Wat is de kritiek op de huidige spraaktechnologie?
- Quiz: Wat weet jij van spraakassistenten?
De producties voor deze missie worden ondersteund door redacteur Sander van Velze.