A closed laptop with headphones on top and a Post-it note labelled 'screen reader practice' — the visual marker for sighted-developer screen-reader learning paths.
Image description: A closed laptop with headphones on top and a Post-it note labelled 'screen reader practice' — the visual marker for sighted-developer screen-reader learning paths.

Engineering-Primer · Screenreader-Kompetenz für sehende Entwicklerinnen und Entwickler

Screenreader-Lernpfade: Wie sehende Entwicklerinnen und Entwickler echte Kompetenz erlangen

Ein stufenweiser Lernplan, der sehende Entwicklerinnen und Entwickler vom Screenreader-Einsteiger zur echten Kompetenz führt — welcher Screenreader zuerst, die Monitor-aus-Übungen der ersten Woche, die kaum gelehrten Entwickler-Shortcuts und ehrliche Benchmarks für die Zeit bis zur Kompetenz.

Screenreader-Lernpfade:
Wie sehende Entwicklerinnen und Entwickler echte Kompetenz erlangen

„Ich habe es mit VoiceOver getestet“ ist die am häufigsten übertriebene Aussage im Frontend-Bereich der Barrierefreiheit. Wir haben analysiert, wie echte Kompetenz aussieht — nicht Bekanntheit, sondern Kompetenz — und einen stufenweisen Plan entwickelt, der sehenden Entwicklerinnen und Entwicklern in rund vierzig Übungsstunden zu echtem Vertrauen verhilft: beginnend mit der Screenreader-Kombination, die tatsächlich Früchte trägt, und endend mit den Entwickler-Modus-Shortcuts, die kaum jemand lehrt.

ca. 10 h
bis „einsatzbereit“
ca. 40 h
bis halbkompetent
2
Screenreader zum Starten
12 Min. Lesezeit
Aktualisiert Mai 2026

1. Warum es sich lohnt — und was Kompetenz wirklich bedeutet

Nahezu jedes Barrierefreiheitsprogramm, das auditiert wird, meldet dieselbe Zahl: Irgendwo um die neunzig Prozent der Frontend-Entwicklerinnen und -Entwickler geben an, sie „testen mit einem Screenreader“. Bittet man sie darum, dies vorzuführen, ist die Demo meist dieselben drei Tastendrücke — einschalten, durch die Seite tabben, ausschalten. Das ist kein Test. Das ist das Abhaken einer Checkbox.

Der Grund dafür ist strukturell, nicht nachlässig. Ein Screenreader ist kein Werkzeug, das man so aufnimmt wie einen neuen Linter. Es ist ein anderes Interaktionsmodell mit eigenem modalen Zustand, eigener Shortcut-Grammatik und einer Reihe von Konventionen, die erst nach mehreren Stunden echter Arbeit Sinn ergeben. Bis man diese Schwelle überschreitet, sagt das Werkzeug einem fast nichts — und schlimmer: Es sagt einem Dinge, die falsch sind, weil die gehörten Ansagen von Lesermodus, Accessibility Tree des Browsers und IME-Schicht der Plattform abhängen, was von außen nicht offensichtlich ist.

Kompetenz bedeutet für unsere Zwecke den Punkt, an dem man einer Kollegin oder einem Kollegen eine fehlerhafte Komponente geben, deren Tastatur übernehmen und den Fehler mit laufendem Screenreader reproduzieren kann — ohne auf den Bildschirm zu schauen, ohne eine Kurzübersicht zu verwenden und ohne die Ansage schlechter zu machen, als sie im echten Gebrauch wäre. Bekanntheit ist der Punkt, an dem man einen Screenreader gehört hat. Der Abstand zwischen den beiden beträgt ungefähr dreißig bis fünfunddreißig Stunden gezielter Übung.

Was dieser Artikel nicht ist

Dies ist kein Ersatz für Tests mit Menschen mit Behinderungen. Eine sehende Entwicklerin oder ein sehender Entwickler, der oder die einen Screenreader nutzt, approximiert einen Arbeitsablauf, den eine tägliche Nutzerin oder ein täglicher Nutzer über Jahre internalisiert hat. Der Zweck von Kompetenz ist nicht, Nutzertests zu ersetzen, sondern die offensichtlichen Fehler vor dem Nutzertest zu finden, damit die Nutzertestsitzung für die subtilen verwendet werden kann.


2. Den Screenreader wählen — und JAWS zunächst überspringen

Der Markt hat drei Screenreader, die für Desktop-Web-Arbeit wichtig sind: NVDA unter Windows, VoiceOver unter macOS und iOS sowie JAWS unter Windows. Jeder hat genügend Nutzende, dass man ihn nicht ignorieren kann, und jeder gibt dasselbe Markup geringfügig anders aus. Eine kompetente Entwicklerin oder ein kompetenter Entwickler kann mindestens zwei davon bedienen.

Die Empfehlung, die sich nach Beobachtung dutzender Entwicklerinnen und Entwickler an der Schwelle zur Kompetenz ergibt, ist eindeutig: mit NVDA unter Windows und VoiceOver unter macOS beginnen. Beide sind kostenlos. Beide sind vorinstalliert (VoiceOver) oder in weniger als fünf Minuten installiert (NVDA). Beide werden von genügend echten Nutzenden verwendet — NVDA hält laut der jüngsten WebAIM-Umfrage ca. 65 % des Windows-Screenreader-Marktanteils, VoiceOver dominiert Mobile und einen bedeutenden Anteil von macOS —, dass das Erlernte unmittelbar auf Fehler übertragbar ist, für die ein Fix veröffentlicht werden kann. JAWS ist das dritte Werkzeug, nicht das erste, auch wenn es nach wie vor den Screenreader mit der größten Enterprise-Installationsbasis darstellt. Drei Gründe.

NVDA
NV Access · Windows · kostenlos
ca. 65 % des Windows-Screenreader-Marktanteils (WebAIM 2024)
KostenKostenlos, spendenfinanziert
InstallationszeitUnter 5 Minuten
Lernkurve
Warum hier startenKlare Modi, transparentes Log, große echte Nutzerbasis
VoiceOver
Apple · macOS & iOS · vorinstalliert
Standard auf jedem Mac und iPhone; dominiert auf Mobile
KostenKostenlos, im Betriebssystem enthalten
InstallationszeitBereits installiert
Lernkurve
Warum mit NVDA kombinierenDas Rotor-Modell unterscheidet sich vom PC-Cursor-Modell; man erlernt beide Welten
JAWS
Freedom Scientific · Windows · kostenpflichtig
Größte Enterprise-Installationsbasis, besonders in Behörden und im Finanzbereich
KostenHome-Lizenz ca. 95 USD/Jahr, Pro-Tier höher
Installationszeit30+ Minuten; Aktivierung erforderlich
Lernkurve
Warum zunächst überspringenDasselbe Windows-Denkmodell wie NVDA, aber schwerer und lizenzgebunden

Die drei Gründe, JAWS anfangs zu überspringen, sind pädagogischer Natur, nicht politischer. Erstens teilen JAWS und NVDA dasselbe Denkmodell — Windows-Browse-Modus versus Fokus-Modus, dasselbe Insert-basierte Befehlspräfix, denselben virtuellen Puffer —, sodass nach dem Erlernen von NVDA neunzig Prozent der tatsächlich benötigten JAWS-Befehle eine Glossar-Suche entfernt sind. Zweitens hat JAWS jahrzehntelange „intelligente“ Inferenz angesammelt: Es versucht, schlechtes Markup zu korrigieren, bevor die Nutzerin oder der Nutzer es hört — was bedeutet, dass ein Fehler, den JAWS überspielt, nach wie vor NVDA-Nutzende erreicht. NVDAs bewusst konservatives Verhalten macht es zum besseren Referenz-Leser, wenn man lernen möchte, was defekt ist. Drittens ist JAWSs Lizenzierungsaufwand — Aktivierung, der vierzig-Minuten-Testmodus, der bei jedem Neustart nervt — eine Lernsteuer, die man sich bis zur Erlangung ausreichender Sicherheit sparen kann.

VoiceOver wird mit NVDA kombiniert statt in Konkurrenz gesetzt, weil die beiden Reader die zwei dominanten Interaktionsmodelle repräsentieren. NVDA (und JAWS) verwenden das „PC-Cursor“-Modell: einen virtuellen Puffer, der die Seite als lineares Dokument aufbaut, und einen separaten Fokus, der der Tab-Reihenfolge folgt. VoiceOver verwendet einen einzigen VoiceOver-Cursor, der über dem Fokus liegt und per Rotor und VO+Pfeiltasten navigiert wird. Eine Entwicklerin oder ein Entwickler, der oder die nur ein Modell beherrscht, schreibt Code, der im eigenen Reader gut und im anderen schlecht angekündigt wird. Beide gleichzeitig zu erlernen ist die einzige zuverlässige Methode, den Unterschied zu spüren.

„Die beiden kostenlosen Reader wählen. Vierzig Stunden investieren. Im nächsten Quartal werden mehr Barrierefreiheitsfehler gefunden als in den letzten drei Vendor-Audits zusammen.“

— Engineering Lead, Fintech-Plattform, die 2025 ihr Overlay abgelöst hat

3. Woche 1 — Monitor aus, Hände an der Tastatur

Das Wochenprogramm hat eine Regel: Den Monitor ausschalten. Nicht gedimmt, nicht minimiert, nicht „Ich schließe die Augen“ — physisch ausschalten oder mit einem Stück Karton abdecken, wenn der Bildschirm der einzige im Raum ist. Es geht darum, die Möglichkeit des Schummelns zu beseitigen. Der Instinkt einer sehenden Entwicklerin oder eines sehenden Entwicklers ist, sobald ein Screenreader etwas Verwirrendes sagt, auf den Bildschirm zu schauen und die Mehrdeutigkeit visuell aufzulösen. Genau dieser Instinkt ist der einzelne wichtigste Grund, warum „Ich habe mit einem Screenreader getestet“ echte Fehler nicht findet.

In Woche eins sollten drei Sitzungen von je ca. neunzig Minuten geplant werden, mit mindestens einem Tag Abstand zwischen den Sitzungen, damit das Muskelgedächtnis Zeit zur Festigung hat. Jede Sitzung hat einen Auftrag. Die erste baut die grundlegende Befehlsgrammatik auf. Die zweite erzwingt eine echte Interaktion. Die dritte prüft die Merkleistung unter einem kleinen Stresspegel.

1

Sitzung 1 — Installieren, konfigurieren, Homepage durchsuchen

NVDA installieren (oder VoiceOver unter macOS öffnen). Die Sprachsynthese-Höflichkeit deaktivieren, wenn möglich — schnelle, mechanische Sprache ist gewünscht, nicht der freundliche Standard. Eine große Nachrichtenwebsite öffnen, Monitor aus. 45 Minuten lang die Pfeiltasten drücken und zuhören. In den zweiten 45 Minuten H (nächste Überschrift), K (nächster Link) und F (nächstes Formularfeld) drücken und beobachten, wie die Seite strukturiert ist. Noch nicht navigieren.

2

Sitzung 2 — Den eigenen Namen in ein Formular eingeben

Ein Kontaktformular auf der eigenen Unternehmenswebsite öffnen, Monitor aus. Zum Namensfeld tabben. Den Namen eingeben. Zum E-Mail-Feld tabben. Eine gefälschte E-Mail eingeben. Zum Absenden-Button tabben. Leertaste drücken. Wer den Absenden-Button nicht ohne Hinschauen findet, hat eine Information: Die Tab-Reihenfolge des Formulars ist defekt, oder seine Beschriftungen sind defekt, oder beides. Den Fehler notieren. Noch nicht beheben — das Beheben vor dem Anhören von zehn weiteren Formularen ist verfrühte Optimierung.

3

Sitzung 3 — Etwas Günstiges kaufen

Einen bisher nie besuchten Online-Shop öffnen, Monitor aus. Ein Produkt unter fünf Euro finden. In den Warenkorb legen. Den Bezahlschritt erreichen. Vor dem Bezahlen aufhören — aber bis zum Zahlungsformular vorgehen. Dies ist die Sitzung, an der viele scheitern. Dabei wird festgestellt, dass „kompetent genug zum Testen“ und „kompetent genug zum Nutzen“ unterschiedliche Schwellen sind. Die erste Sitzung des reinen Zuhörens war nur eine Probe; das hier ist die erste Sitzung des Handelns.

Wenn Sitzung 3 mehr als 90 Minuten dauert

Aufhören. Die Lektion für die Woche wurde gelernt. Die Lektion lautet nicht „Ich bin schlecht mit Screenreadern“ — sie lautet „Diese Website ist ohne Sehvermögen wirklich schwer zu nutzen.“ Die meisten großen Einzelhandels-Websites brauchen für eine Screenreader-Nutzerin oder einen -Nutzer dreißig bis sechzig Minuten länger bis zum Checkout-Abschluss als für eine sehende Person. Dieser Unterschied wird jetzt spürbar.


4. Wochen 2 bis 4 — Formulare, Navigation und die Modus-Falle

Die Wochen zwei bis vier sollten insgesamt rund zwanzig Übungsstunden ergeben — zwei neunzigminütige Sitzungen pro Woche plus ein geringes Maß an beiläufiger Nutzung während der regulären Arbeit. Ziel in diesem Abschnitt ist es, die zwei Dinge zu verinnerlichen, die neue Screenreader-Nutzende mehr als alles andere verwirren: die Unterscheidung zwischen Browse-Modus und Fokus-Modus sowie den Unterschied zwischen dem, was der Rotor sieht, und dem, was die Tab-Reihenfolge sieht.

Browse-Modus (NVDA, JAWS)Fokus-Modus (NVDA, JAWS)VoiceOver (ein Modus)
PfeiltastenNavigiert den virtuellen PufferWird an das fokussierte Steuerelement gesendetNavigiert stets den VoiceOver-Cursor
TabVerschiebt Fokus, bleibt im Browse-ModusVerschiebt Fokus, bleibt im Fokus-ModusVerschiebt Fokus; VoiceOver-Cursor folgt
Buchstaben-Shortcuts (H, K, F)SchnellnavigationN/AErsetzt durch Rotor (VO+U)
Wann wechselt erStandard für die meisten SeitenAutomatisch bei contenteditable, eigenen WidgetsNie — es gibt keinen Modus
Wie erzwingenNVDA+LeertasteNVDA+Leertaste (umschalten)Nicht anwendbar

Die mit Abstand häufigste Verwirrung in Woche zwei ist der Moment, in dem eine Entwicklerin oder ein Entwickler in NVDA eine Pfeiltaste drückt, erwartet, dass der virtuelle Puffer sich bewegt, und stattdessen hört, wie das fokussierte Kombinationsfeld seine Optionsliste öffnet. Das ist der Browse-Modus, der automatisch in den Fokus-Modus wechselt, weil der Fokus auf einem Element landet, das NVDA als „Anwendungs“-Widget einstuft. Neue Entwicklerinnen und Entwickler erleben das als Fehlfunktion des Readers. Das ist es nicht — der Reader tut genau das, was die Spezifikation verlangt. Sobald man es zehn- oder fünfzehnmal gehört hat, ist man nicht mehr überrascht; bis dahin sollte man damit rechnen, ungefähr jede zweite Sitzung überrascht zu werden.

Das Woche-drei-Muster sind Formulare. Eine private Testseite mit acht bis zehn Steuerelementen erstellen: ein erforderliches Texteingabefeld mit Inline-Fehlermeldung, ein Datumsauswahl-Feld, ein Mehrfachauswahl-Feld, eine benutzerdefiniert gestaltete Checkbox, ein deaktivierter Button, der aktiviert wird, eine Schaltfläche „Passwort anzeigen“, ein Telefonnummernfeld mit Ländervorwahlauswahl und ein Absenden-Button, der eine serverseitige Validierungszusammenfassung auslöst. Monitor aus, fünfmal hindurch navigieren — zuerst mit NVDA im Browse-Modus, dann NVDA im Fokus-Modus, dann NVDA erneut mit erhöhter Ausführlichkeitseinstellung (Insert+Z, mehr dazu in Abschnitt fünf), dann VoiceOver mit dem Rotor, dann VoiceOver ohne den Rotor. Dasselbe Formular klingt fünfmal unterschiedlich. So fühlt sich Kompetenz von innen an: zu bemerken, dass dasselbe Markup fünf verschiedene Geschichten erzählt, und im Voraus vorhersagen zu können, welche gespielt wird.

Woche vier ist Navigation. Eine echte, komplexe Website nehmen — ein Dokumentationsportal, ein Arbeitsplatz-Dashboard, eine E-Commerce-Kategorieseite — und versuchen, eine bestimmte Information nur mit Screenreader-Shortcuts zu finden. H für Überschriften-Sprünge verwenden. D (NVDA) oder VO+U dann „Landmarks“ (VoiceOver) für Landmark-Sprünge verwenden. 1 bis 6 für Sprünge zu einer bestimmten Überschriftenebene verwenden. Am Ende von Woche vier sollten die Navigations-Shortcuts Reflexe statt Entscheidungen sein — so wie Tab und Umschalt-Tab es bereits sind.

„Der Tag, an dem man merkt, dass zwanzig H-Drücke sich schneller anfühlen als dreißig Tabs, ist der Tag, an dem man aufgehört hat, eine sehende Person, die so tut als ob, zu sein, und begonnen hat, eine Entwicklerin oder ein Entwickler zu sein, der oder die wirklich navigieren kann.“

— Mid-Career-Frontend-Ingenieur, dritter Monat der NVDA-Übung

5. Entwickler-Modus-Shortcuts, die kaum jemand lehrt

Sobald die Nutzer-Modus-Befehle Reflexe sind, folgt der nächste Schritt in die entwicklerorientierten Oberflächen jedes Readers. Dies sind die Modi und Shortcuts, die die Handbücher vergraben — teils weil sie auf Entwicklerinnen und Entwickler ausgerichtet sind, teils weil sie ausreichend laut sind, dass eine tägliche Nutzerin oder ein täglicher Nutzer sie nicht eingeschaltet lassen würde. Drei sind sofort wissenswert.

NVDA · Speech Viewer + ausführliche Ankündigung
Menü „Extras“ → „Sprachausgaben-Betrachter“; Insert+Z schaltet Ausführlichkeit um
Visuelles Protokoll aller NVDA-Ansagen plus erweiterte Rollenankündigungen
Was es bringtEin durchsuchbares Log aller Ankündigungen, um zu prüfen, was der Reader tatsächlich gesagt hat, nicht was man geglaubt hat zu hören
Wann verwendenFehlerreproduktion, Vergleich mit automatisierten Tests, Schulung von Kolleginnen und Kollegen
NVDA · Log-Inspektor (NVDA+F1)
Entwickler-Info-Popup für das fokussierte Element
Prüfen, was NVDA am aktuellen Element sieht — Rolle, Zustände, Wert, Beschreibung, zugänglicher Name
Was es bringtDen Accessibility Tree, den NVDA aufgebaut hat, nicht das DOM, das die Dev-Tools anzeigen
Wann verwendenWenn die Seite in Dev-Tools korrekt aussieht, aber in NVDA falsch vorgelesen wird
VoiceOver · Web-Rotor (VO+U) und Web-Element-Einstellungen
macOS & iOS · der Accessibility Tree für Entwicklerinnen und Entwickler
Hierarchische Liste von Überschriften, Links, Landmarks, Formularsteuerelementen, Web-Spots und Tabellen — genau so wie VoiceOver sie indiziert hat
Was es bringtEine zweite Meinung zum NVDA-Log-Inspektor: Wenn beide Reader übereinstimmen, liegt der Fehler im Markup, nicht im Reader
Wann verwendenReader-übergreifende Fehlersuche, besonders bei Landmark- und Überschriftenstruktur

Zwei weitere Gewohnheiten sparen mehr Zeit als jeder einzelne Shortcut. Erstens: NVDAs Speech Viewer dauerhaft auf einem zweiten Monitor (oder in einer Ecke des einen Monitors) geöffnet lassen, während entwickelt wird. Das wörtliche Log aller Ankündigungen verhält sich zu Screenreader-Arbeit wie die Dev-Tools-Konsole zu JavaScript: Es ist der Unterschied zwischen Raten und Wissen. Zweitens: Den Accessibility Tree in den Browser-Dev-Tools lesen lernen — Chrome’s Accessibility-Bereich, Firefoxs Accessibility Inspector, Safaris Audit-Reiter. Der Reader kündigt an, was der Accessibility Tree enthält, nicht was das DOM enthält, und die beiden weichen häufig genug voneinander ab, dass Live-Regions, ARIA oder Shadow DOM ohne direkte Tree-Analyse nicht debuggt werden können.

Eine Verwechslung, die jetzt angesprochen werden sollte, weil sie in Wochen zwei und drei Stunden kostet: Lese-Modus versus Fokus-Modus ist nicht dieselbe Achse wie „die Seite ist interaktiv“ versus „die Seite ist ein Dokument“. NVDA wechselt automatisch in den Fokus-Modus, wenn der Fokus auf ein Steuerelement mit role=“application” oder auf ein contenteditable oder auf bestimmte benutzerdefinierte Widgets fällt, die der Reader heuristisch als interaktiv einstuft — unabhängig davon, ob die Seite hauptsächlich statisch ist. Umgekehrt bleibt eine reichhaltig interaktive Single-Page-App, deren Root-Element ein main-Landmark ist und deren Widgets gut mit nativen Buttons ausgezeichnet sind, für nahezu die gesamte Sitzung im Browse-Modus. Der Modus ist eine Eigenschaft des fokussierten Elements, nicht eine Eigenschaft der Seite.

Der einzeln nützlichste Tastendruck

NVDA+Leertaste schaltet manuell zwischen Browse-Modus und Fokus-Modus um. Wenn etwas falsch klingt, sollte das als Erstes probiert werden — in der Hälfte der Fälle befand sich der Reader im unerwarteten Modus, und einmaliges Umschalten zeigt, ob der Fehler in der Modallogik oder im Markup liegt.


6. Zeit bis zur Kompetenz — ehrliche Benchmarks

Die folgenden Zahlen stammen aus informellem Tracking von rund achtzig Entwicklerinnen und Entwicklern — Frontend-Ingenieure, QA-Leads, Barrierefreiheitsspezialistinnen und -spezialisten in der Ausbildung — über drei Jahre Unternehmensworkshops und Einzelmentoring. Sie sind keine Forschungsstudie. Sie sind gut genug zum Planen. Zwei Annahmen: gezielte Übung (Monitor aus, echte Aufgaben, nicht „Ich habe NVDA im Hintergrund laufen lassen, während ich programmiert habe“) und eine feste Reader-Kombination (NVDA unter Windows und VoiceOver unter macOS).

ca. 3 h
bis zur grundlegenden Orientierung — installiert, Basisbefehle, kann mit ausgeschaltetem Monitor eine Homepage navigieren
ca. 10 h
bis „einsatzbereit“ — kann ein echtes Formular bedienen, einen Fehler einer Kollegin oder eines Kollegen reproduzieren und einem schnellen Test zugetraut werden
ca. 25 h
bis „vertraut“ — beide Reader fühlen sich bekannt an; Modus-Verwirrung ist selten; Rotor und Log-Inspektor sind Reflexe
ca. 40 h
bis halbkompetent — kann einen Fehler live demonstrieren, kann die Screenreader-Arbeit anderer Entwicklerinnen und Entwickler glaubwürdig beurteilen

„Halbkompetent“ ist das realistische Ziel für die meisten sehenden Entwicklerinnen und Entwickler und in der Praxis alles, was für einen guten Beitrag zu einem barrierefreien Produkt benötigt wird. Echte Kompetenz — das Niveau, auf dem man bei einem Usability-Review vertretungsweise als tägliche Screenreader-Nutzerin oder täglicher Nutzer einspringen könnte — erfordert eher hundertfünfzig Stunden und ein Jahr beiläufiger Übung, und die meisten berufstätigen Entwicklerinnen und Entwickler brauchen das nicht. Das Ziel lautet halbkompetent, die vierzig Stunden sind einzuplanen, und alles darüber hinaus ergibt sich aus der Erledigung des Tagesjobs mit laufendem Reader und der Bereitschaft, sich Zeit zu lassen.

Ein letzter Benchmark, um die Erwartungen ehrlich zu setzen: Die Entwicklerinnen und Entwickler, die unserer Erfahrung nach stagnieren, stagnieren zwischen der zehnten und zwanzigsten Stunde. Die Ursache ist fast immer dieselbe — sie hören auf, den Monitor auszuschalten. Sie reden sich ein, dass sie jetzt „gut genug“ sind, um mit eingeschaltetem Bildschirm, im Hintergrund laufendem Screenreader und visueller Bestätigung immer dann zu testen, wenn die Audiomeldung mehrdeutig ist. Das sind sie nicht. Die sechzehn Stunden zwischen „einsatzbereit“ und „vertraut“ erfordern den ausgeschalteten Monitor, weil das der Abschnitt ist, in dem die Ansagen des Readers zu Informationen statt zu Lärm werden. Ohne diesen Druck fällt das Gehirn auf die visuelle Wahrnehmung zurück und die Stimme des Readers verblasst zur Tapete. Wer merkt, dass man langsamer wird, hat fast immer denselben Grund: den Monitor.

„Die Version von Ihnen nach vierzig Stunden findet in einem einstündigen Pre-Release-Sweep mehr Screenreader-Fehler als das letzte automatisierte Audit. Das ist keine hohe Hürde. Das ist das, was Testen mit einem Screenreader immer bedeuten sollte.“

— Disability World Engineering-Desk, nach Beobachtung der Kurve dutzende Male

Fazit: Der Weg ist kurz — die Disziplin nicht

Der Grund, warum „mit einem Screenreader testen“ in der Branche so schwache Ergebnisse liefert, liegt nicht daran, dass das Werkzeug schwer zu erlernen ist — vierzig Stunden sind wirklich keine viel Zeit —, sondern daran, dass das Lernen auf eine bestimmte Art unbequem ist. Den Monitor auszuschalten lässt eine sehende Entwicklerin oder einen sehenden Entwickler auf eine Weise inkompetent wirken, die in unserem Beruf ungewöhnlich ist. Man ist es gewohnt, derjenige oder diejenige zu sein, der oder die Dinge herausfindet; der Screenreader macht einen für einige Stunden am Stück wieder zum Anfänger oder zur Anfängerin. Diese Unbequemlichkeit — nicht die Tastendrücke — ist das eigentliche Hindernis.

Der Weg hindurch ist der oben beschriebene: NVDA und VoiceOver, drei Sitzungen in der ersten Woche mit ausgeschaltetem Monitor, Formulare und Modi in Woche zwei bis vier, Entwickler-Modus-Shortcuts sobald die Nutzer-Modus-Shortcuts Reflexe sind, insgesamt vierzig Stunden bevor man für einen ernsthaften Pre-Release-Sweep eingesetzt werden kann. Nichts davon ist neu. Was die Branche bislang nicht getan hat, ist, es als Arbeit zu behandeln — die Stunden einzuplanen, sie gegen andere Verpflichtungen zu verteidigen und zu akzeptieren, dass die ersten zehn dieser Stunden sich nutzlos anfühlen werden, bis sie es plötzlich nicht mehr tun.

Wer ein Frontend ausliefert: Die Version von Ihnen auf der anderen Seite dieser vierzig Stunden ist eine wesentlich bessere Ingenieurin oder ein wesentlich besserer Ingenieur als die Ausgangsversion — auf Weisen, die sich nicht nur in der Barrierefreiheitsarbeit zeigen, sondern auch im Verständnis von Fokusreihenfolge, von Progressive Enhancement, davon, was der Browser unter der Oberfläche tatsächlich tut. Der Screenreader ist die günstigste verfügbare Lektion über verteilte Systeme für alle, die fürs Web schreiben. Der Preis ist der ausgeschaltete Monitor und ein paar Wochenenden.

„Man wird keine Screenreader-Nutzerin und kein Screenreader-Nutzer. Man wird eine Entwicklerin oder ein Entwickler, die oder der hören kann, wie der eigene Code für eine solche Person klingt. Das genügt — und die meisten in der Branche haben es noch nicht.“

— Disability World Engineering-Desk