Teknologia

Voice control

Katso myös: Dragon NaturallySpeaking, Voice Control, Windows Speech Recognition, VoiceAccess

Avustavan teknologian luokka, joka mahdollistaa tietokoneen käytön puhekomennoin. Dragon NaturallySpeaking (Windows), macOS/iOS Voice Control, Windows Speech Recognition — kaikki edellyttävät, että saavutettavat nimet vastaavat puhuttua komentoa.

Voice control on avustavan teknologian luokka, jonka avulla käyttäjät voivat käyttää tietokonetta puhekomennoin. Tärkeimmät järjestelmät ovat Dragon NaturallySpeaking (Windows, pitkäaikainen markkinajohtaja), macOS Voice Control ja iOS Voice Control (Applen sisäänrakennettu, ilmainen käyttöjärjestelmän mukana), Windows Speech Recognition (Microsoftin sisäänrakennettu) ja Google Voice Access (Android).

Voice control palvelee käyttäjiä, joilla on motorinen vamma, joka tekee näppäimistön, hiiren tai kosketusnäytön käytön vaikeaksi tai mahdottomaksi — RSI, nivelrikko, vapina, halvaus eri tasoilla. Sitä käytetään laajalti myös työn tehokkuuden yhteydessä (lakimiehet ja kliinisessä työssä muistiinpanoja saneleville), joilla ei ole dokumentoitua vammaa mutta jotka hyötyvät kädetön käytöstä.

Miten voice control tulkitsee komennot

Voice control -järjestelmä kuuntelee kahdenlaisia komentoja:

  1. Sanelu — käyttäjä puhuu tekstiä syötettäväksi kohdistettuun kenttään. Järjestelmä litteroi puheen.
  2. Komennot — käyttäjä nimeää toiminnon tai ohjaimen. Järjestelmä vertaa puhuttua lausumaa käytettävissä olevien komentojen ja näkyvien ohjainten saavutettavien nimien rekisteriin.

Jälkimmäinen on kohtauspiste verkkosaavutettavuuden kanssa: kun käyttäjä sanoo “Napsauta Lähetä”, voice control -ohjelmisto etsii elementin, jonka saavutettava nimi on “Lähetä” (tai lähellä olevaa vastaavuutta), ja lähettää sille napsautustapahtuman. Jos Lähetä-painikkeella ei ole saavutettavaa nimeä — koska se on merkitsemätön <button>, mukautettu <div> tai vain kuvakkeella merkitty painike — voice control -käyttäjä ei pysty käyttämään sitä.

Mitä tämä tarkoittaa verkkokehittäjille

Tärkein voice control -saavutettavuussääntö:

Jokaisella interaktiivisella elementillä on oltava tekstipohjainen saavutettava nimi, joka vastaa sen näkyvää merkintää.

Käytännössä:

  • Painikkeissa on oltava näkyvä teksti. <button>Lähetä</button> toimii. Vain kuvakkeella merkityissä painikkeissa on oltava aria-label, joka vastaa mitä käyttäjä todennäköisesti sanoo — aria-label="Haku" mieluummin kuin aria-label="Suurennuslasi".
  • Näkyvän merkinnän ja saavutettavan nimen on vastattava toisiaan. Jos painikkeen näkyvä teksti on “Lähetä” mutta sen aria-label on “Lähetä lomake”, voice control ei välttämättä löydä sitä kun käyttäjä sanoo “Napsauta Lähetä.” WCAG 2.5.3 Label in Name (taso A) edellyttää, että saavutettava nimi sisältää näkyvän merkinnän tekstin.
  • Mukautetut ohjaimet paljastavat roolinsa ja nimensä. <div role="button" aria-label="Lähetä"> toimii. <div onclick> ilman roolia tai nimeä ei toimi.
  • Ei haamuohjaimia. Voice control -päällekkäisnäkymät (numeroidut päällekkäisnäkymät, jotka näyttävät jokaisen kohdistettavissa olevan elementin numerolla) toimivat paremmin, kun kohdistettavissa olevien elementtien määrä on hallittavissa. Piilotetut mutta silti kohdistettavissa olevat elementit sotkevat päällekkäisnäkymää.

Missä voice control ja ruudunlukuohjelman saavutettavuus kohtaavat

Sama saavutettavan nimen ja semanttisen HTML:n kurinalaisuus, joka tekee sivustosta ruudunlukuohjelmalla saavutettavan, tekee siitä myös voice controlilla saavutettavan. Molemmat teknologiat kulkevat saavutettavuuspuun kautta ja riippuvat siitä, että saavutettavat nimet ovat paikallaan ja oikein.

Tärkein poikkeus: voice control ei tarvitse ARIA-live-alueita (se ei ole ruudunlukuohjelma), mutta se tarvitsee numeroituja päällekkäisnäkymiä paljastaakseen ohjaimet ilman tekstimerkintöjä — minkä vuoksi tekstimerkinnät ovat suhteettoman tärkeitä puheenkäyttäjille.

Mikä menee erityisesti pieleen voice controlin kanssa

  • Näkyvät vain kuvake -merkinnät. Sydänpainike (suosikki) ilman näkyvää tekstiä. Käyttäjä sanoo “Napsauta suosikki”, mutta saavutettava nimi on “Tallenna” tai puuttuu kokonaan. Yhteensopimattomuus.
  • Kaksi ohjainta samalla saavutettavalla nimellä. Kaksi “Lue lisää” -linkkiä sivulla. Käyttäjä sanoo “Napsauta Lue lisää”; voice control -järjestelmä näyttää numeroitua yksilöintipäällekkäisnäkymää. Tämä ei ole rikki, vain hidas.
  • Yhteensopimattomat lokalisoidut merkinnät. Puhuttu englanniksi, mutta sivu on suomeksi. Käyttäjän voice control -ohjelmiston on tunnistettava elementin nimelle oikea kieli. lang-attribuutin oikea asettaminen HTML:ssä auttaa.

Nopein manuaalinen auditointi: ota käyttöön macOS Voice Control tai Windows Speech Recognition ja yritä käyttää sivustoasi äänellä. Aktivoimattomat ohjaimet paljastuvat viidessä minuutissa.