A developer's testing bench with three staggered devices — Windows laptop, MacBook and iPhone — each running a different assistive-tech overlay, headphones uncoiled beside them, a red active indicator on the centre laptop. The screen-reader testing matrix as a working scene.
Image description: A developer's testing bench with three staggered devices — Windows laptop, MacBook and iPhone — each running a different assistive-tech overlay, headphones uncoiled beside them, a red active indicator on the centre laptop. The screen-reader testing matrix as a working scene.

Tooling-Leitfaden · Testing

Screenreader-Testwerkzeuge — NVDA, JAWS, VoiceOver im Vergleich (2026)

Screenreader-Testwerkzeuge im Vergleich — NVDA, JAWS, VoiceOver, TalkBack, Narrator — plus Automatisierungstreiber (Playwright AT-driver, AccTree). Der Testworkflow 2026.

Screenreader-Testwerkzeuge — NVDA, JAWS, VoiceOver im Vergleich (2026)

Jeder Barrierefreiheits-Scanner kann feststellen, ob ein alt-Attribut vorhanden ist. Nur ein Screenreader kann feststellen, ob der Alternativtext tatsächlich nützlich ist. Dasselbe gilt für ARIA-Labels, die das Falsche ankündigen, Formular-Labels, die als Kauderwelsch vorgelesen werden, eine springende Fokusreihenfolge und dynamische Inhalte, die sich lautlos aktualisieren, während sich die sichtbare Oberfläche ändert. Dies ist die Testebene, auf der Automatisierung an ihre Grenzen stößt und die menschliche Überprüfung mit der tatsächlichen assistiven Technologie beginnt.

5
wichtige Screenreader
~70 %
der mobilen Nutzenden mit VoiceOver
12-Punkte-
Einstiegscheckliste
10 Min. Lesezeit
Aktualisiert Mai 2026

Warum Screenreader-Tests noch immer nicht automatisiert werden können

Im Jahr 2026 umfasst das Feld fünf wichtige Screenreader — NVDA, JAWS, VoiceOver, TalkBack und Narrator — sowie eine ausgereifte Ebene von Automatisierungstreibern (Playwright AT-driver, AccTree-basierte Inspektoren, Cloud-Aufzeichnungsdienste), die es ermöglicht, einen Teil dieser Arbeit in CI zu verlagern. Keiner davon ersetzt den Einsatz der echten Software gegen das eigene Produkt. Sie ermöglichen es jedoch, offensichtliche Regressionen abzufangen, bevor sie einen menschlichen Tester erreichen.

Dieser Leitfaden behandelt die fünf Screenreader, gegen die getestet werden sollte, eine minimalviable Testmatrix, worauf zu achten ist, die lohnenswerte Automatisierungsebene und eine Einstiegscheckliste für den Release-Prozess.


1. Die fünf Screenreader, gegen die tatsächlich getestet werden muss

Fünf Produkte dominieren den Screenreader-Markt im Jahr 2026 — zwei auf dem Windows-Desktop, eines plattformübergreifend bei Apple, eines unter Android und Microsofts integrierter Rückfall. Der ungefähre Marktanteil, das Kostenniveau und die Testtreue jedes einzelnen sind in den Karten unten zusammengefasst; der Text unter jeder Karte ergänzt die Stärken und Besonderheiten.

NVDA
NV Access · Windows, kostenlos, Open Source
~35–40 % WebAIM-Primärnutzung
Kosten
Marktanteil
Testtreue
JAWS
Freedom Scientific · Windows, kommerziell
Enterprise + US-Bundesbehörden-Standard
Kosten
Marktanteil
Testtreue
VoiceOver
Apple · macOS + iOS, integriert
~70 % der mobilen Screenreader-Nutzenden
Kosten
Marktanteil
Testtreue
TalkBack
Google · Android, integriert
Größte mobile Installationsbasis
Kosten
Marktanteil
Testtreue
Narrator
Microsoft · Windows, integriert
Unter 1 % WebAIM-Primärnutzung
Kosten
Marktanteil
Testtreue

NVDA — Windows, kostenlos, Open Source. Gepflegt von NV Access. Rund 35–40 % der WebAIM-Umfrageteilnehmer nutzen ihn als primären Screenreader, was ihn zum einzelnen Werkzeug mit dem höchsten Hebel macht. Kostenlos, Open Source, schlanker, lässt sich sauber mit Firefox und Chrome kombinieren. Stärke: strenge ARIA-Unterstützung und ein schneller Entwicklungszyklus. Besonderheit: Die Konfigurationsstandards unterscheiden sich zwischen Versionen; daher sollte die genaue Version und Einstellung, gegen die das Team testet, dokumentiert werden.

JAWS — Windows, kommerziell. Das Flaggschiff von Freedom Scientific. Die Privatlizenz kostet rund 95 $ pro Jahr; Unternehmenslizenzen sind erheblich teurer. Historisch der Enterprise- und US-Bundesbehördenstandard, nach wie vor fest verankert in Behörden, Finanzen und Gesundheitswesen. Stärke: umfangreicher Funktionsumfang und eine lange Kompatibilitäts-Geschichte mit älteren Enterprise-Anwendungen. Besonderheit: Lizenzkosten und die Tendenz, Markup-Fehler zu verbergen, die NVDA aufdeckt.

VoiceOver — macOS und iOS, integriert. Wird mit jedem Apple-Gerät ausgeliefert. Auf Mobilgeräten repräsentiert VoiceOver rund 70 % der weltweiten Screenreader-Nutzenden, was es mit weitem Abstand zum wichtigsten mobilen Testziel macht. Stärke: keine Installation erforderlich, tiefe Betriebssystemintegration, das Gestenmodell ist die de-facto-Konvention für Mobilgeräte. Besonderheit: macOS-VoiceOver und iOS-VoiceOver verhalten sich unterschiedlich; Tests auf einem System decken das andere nicht ab.

TalkBack — Android, integriert. Googles integrierter Android-Screenreader. Die größte mobile Screenreader-Installationsbasis in absoluten Zahlen, obwohl ein beachtlicher Anteil der Android-Nutzenden ihn deaktiviert. Stärke: überall vorinstalliert; lässt sich mit Chrome kombinieren. Besonderheit: Das Verhalten variiert je nach Android-Variante (Samsung One UI, Pixel, MIUI), und die Parität mit VoiceOver ist unvollständig.

Narrator — Windows, integriert. Microsofts mitgelieferter Screenreader. Bei echten Nutzenden ein deutlicher Fünftplatzierter (WebAIM gibt unter 1 % als primäres Werkzeug an), aber er ist in IT-gesperrten Unternehmensumgebungen relevant, in denen NVDA nicht installiert werden kann. Stärke: keine Installation unter Windows erforderlich. Besonderheit: geringere Treue als NVDA oder JAWS; die meisten Nutzenden, die auf einen Screenreader angewiesen sind, haben ihn verlassen.


2. Minimalviable Testmatrix

Die ehrliche Antwort auf „Gegen welche Screenreader sollte getestet werden?“ lautet: gegen so viele, wie das eigene Publikum tatsächlich nutzt, nicht mehr. Die meisten Teams setzen das Budget zu niedrig an und testen am Ende zwei Screenreader schlecht statt einen gut.

SetupPlattformBrowserReaderPublikumspriorität
Desktop primärWindowsFirefoxNVDAKostenlos, größte für Entwicklung zugängliche Kombination
Desktop sekundärmacOSSafariVoiceOverKostenlos wenn das Team einen Mac hat, deckt Apple-Nutzende ab
Enterprise-PrüfungWindowsChromeJAWSWenn Zielgruppe in Behörden, Finanzen oder Gesundheitswesen
Mobil primäriOSSafariVoiceOverDeckt rund 70 % der mobilen Screenreader-Nutzenden ab
Mobil sekundärAndroidChromeTalkBackDeckt den Rest ab, mit schlechterer Parität
RandfallWindowsEdgeNarratorNur wenn IT-gesperrte Unternehmensumgebung ein relevanter Anteil ist

Eine Zwei-Zeilen-Baseline (NVDA + Firefox unter Windows, VoiceOver + Safari auf iOS) erfasst die Mehrheit der realen Probleme für ein typisches Verbraucherprodukt. JAWS sollte hinzugefügt werden, sobald eine regulierte Branche ins Spiel kommt. TalkBack sollte ergänzt werden, wenn der Android-Anteil nicht zu vernachlässigen ist. Narrator ist als jährliche Plausibilitätsprüfung zu behandeln, nicht als Gating-Werkzeug. Die gewählte Matrix sollte in die Release-Checkliste aufgenommen werden, damit sie nicht stillschweigend übergangen werden kann.


3. Worauf bei einem Screenreader-Test tatsächlich zu achten ist

Über „Wird es vorgelesen?“ hinaus ist der eigentliche Test struktureller Natur. Wenn mit NVDA oder VoiceOver gearbeitet wird, prüft man die Seite auf denselben Achsen wie eine blinde Nutzerin oder ein blinder Nutzer:

  • Seitenstruktur — Kündigt der Screenreader Überschriften in einer sinnvollen Hierarchie an? Ist die Navigation per Überschriften-Shortcuts (H-Taste in NVDA, Rotor in VoiceOver) möglich, und landet man an den richtigen Stellen? Funktioniert der Skip-Link — Tab, hören, Enter, Fokus springt in den Hauptinhalt?
  • Formular-Labels — Jedes Eingabefeld kündigt einen Namen an. Pflichtfelder kündigen „Pflichtfeld“ an. Feldtypen sind korrekt (E-Mail, Telefon, Zahl). Fehlermeldungen sind über aria-describedby verknüpft und werden bei einem Validierungsfehler angekündigt, statt still oberhalb des Formulars zu erscheinen.
  • Dynamische Inhalte — Wenn ein Panel umgeschaltet, ein Formular abgeschickt oder ein Filter angewendet wird: Wird ein aria-live-Bereich aktualisiert? Oder sagt der Screenreader nichts, während sich die sichtbare Oberfläche ändert? Lautlose Aktualisierungen sind der häufigste Fehler bei dynamischen Inhalten.
  • Fokusverwaltung — Wenn ein Modal geöffnet wird, springt der Fokus hinein und bleibt dort gefangen? Wenn es geschlossen wird, kehrt der Fokus zum auslösenden Element zurück? Die meisten vorgefertigten barrierefreien Komponentenbibliotheken handhaben dies; hausgemachte Komponenten häufig nicht.
  • Lesereihenfolge — Wird der Inhalt in der Reihenfolge gelesen, in der er visuell erscheint? Oder hinterlässt CSS order, absolute Positionierung oder Flex-Umsortierung das DOM in einer anderen Reihenfolge als das visuelle Layout?
  • Qualität des Alternativtexts — Ist der Alternativtext tatsächlich nützlich, oder lautet er Image_47.png? Sind dekorative Bilder stumm (alt="")? Beschreibt der Alternativtext, was das Bild im Kontext kommuniziert?
  • Linktext — „Hier klicken“ und „Mehr lesen“ klingen außerhalb des Kontexts schrecklich. Screenreader-Nutzende navigieren häufig über eine Liste aller Links; wenn jeder Link „Mehr lesen“ heißt, ist diese Liste nutzlos.

Diese Punkte entsprechen WCAG-2.2-Erfolgskriterien — insbesondere 1.3.1, 2.4.3, 3.3.1 und 4.1.3 —, doch der Test ist schneller und ehrlicher mit laufendem Screenreader als mit einer Checkliste allein.

Vorhandensein vs. Qualität des Alternativtexts

Ein automatisierter Scanner kann bestätigen, dass das alt-Attribut vorhanden ist. Nur ein Mensch, der einem Screenreader zuhört, kann entscheiden, ob Image_47.png im Kontext nützlich ist. Dasselbe gilt für ARIA-Labels, Formularnamen und Linktext — die Maschine sieht, dass das Markup vorhanden ist; die Nutzerin oder der Nutzer hört, ob es einen Sinn ergibt. Das Testbudget sollte um diesen Unterschied herum gestaltet werden.


4. Automatisierungstreiber 2026 — was in CI verlagert werden kann

Automatisierte Screenreader-ähnliche Tests haben sich in den letzten zwei Jahren deutlich verbessert. Sie ersetzen noch immer nicht einen Menschen, der NVDA zuhört, aber sie erfassen einen echten Anteil von Regressionen, bevor sie ausgeliefert werden. Drei Ansätze sind es wert, bekannt zu sein.

AT-driver
Playwright / Selenium ChromeDriver „force-text“
Erfasst Name-, Rolle- und Zustandsregressionen
EbeneCI-Smoke-Suite
StärkeDurchläuft den AT-Baum wie ein Reader
EinschränkungKein Ersatz für echtes NVDA gegen die Seite
AccTree-Inspektoren
axe DevTools · axe Linter · eslint-plugin-jsx-a11y
Bodenebene: statische + DOM-Analyse
EbeneJeder Commit / PR
StärkeErfasst fehlende Labels, ungültiges ARIA, Kontrast
EinschränkungZeigt, was kaputt ist, nicht was subtil falsch ist
Cloud-Screenreader
Assistiv Labs · BrowserStack Accessibility
Echte NVDA / JAWS / VoiceOver-Sitzungen, remote
EbeneStichproben + Stakeholder-Präsentationen
StärkeAm nächsten an der Realität ohne eigene Hardware
EinschränkungKosten pro Sitzung, Netzwerklatenz

Playwright AT-driver und Selenium ChromeDriver „force-text“. Sowohl Playwright als auch Selenium können nun einen Browser steuern und auf Ebene des Barrierefreiheitsbaums prüfen, was angekündigt würde — Name, Rolle, Zustand, Wert. Dies ist stärker als getByRole/getByLabel: Diese Locators lesen den AT-Baum, um ein Element zu finden, aber force-text durchläuft den Baum so, wie es ein Screenreader täte. Es entspricht nicht dem Ausführen von NVDA gegen die eigene Seite, erfasst aber Name-, Rolle- und Zustandsregressionen kostengünstig und deterministisch. Die meisten großen Produktteams haben mittlerweile mindestens eine Smoke-Suite von AT-driver-Tests auf kritischen Seiten — Registrierung, Checkout, Kontoeinstellungen.

AccTree-basierte Inspektoren — axe DevTools, axe Linter, eslint-plugin-jsx-a11y. Statische Analyse von Code und DOM. Erfasst fehlende Labels, ungültiges ARIA, Fehlübereinstimmungen bei Label-Inhalten, Kontrastfehler und strukturelle Probleme. Kostengünstig bei jedem Commit ausführbar. Der kostenlose Barrierefreiheits-Scanner auf dieser Website verwendet dieselbe Regelsammlung. Bodenebene: zeigt an, wenn etwas definitiv kaputt ist, nicht wenn etwas subtil falsch ist.

Live-Screenreader-Aufzeichnung — Assistiv Labs, BrowserStack Accessibility. Cloud-Dienste, die echte NVDA-, JAWS- oder VoiceOver-Sitzungen gegen die eigene URL ausführen und das Ansehen und Anhören ermöglichen, ohne lokale Installation. Am nächsten an „Tests auf dem echten Gerät“ ohne eigene Hardware. Nützlich für Stichproben, für Teams mit dem falschen Betriebssystem und für das Teilen von Aufzeichnungen mit Stakeholdern, die sonst nie hören würden, wie eine fehlerhafte Seite klingt.

Das Muster, auf das sich die meisten Teams bis 2026 eingependelt haben: AccTree-basiertes Linting bei jedem PR, AT-driver-Tests auf einem repräsentativen Seitensatz in CI, echte Screenreader-Tests manuell in Sprint-Takt und ein manuelles Audit durch Tester mit Behinderungen quartalsweise oder jährlich. Die Automatisierungsebene ist der Mindeststandard; die manuelle Ebene ist der Ort, an dem die tatsächliche Nutzungserfahrung gemessen wird.


5. Einstiegscheckliste

Diese Checkliste kann in die Release-Checkliste oder das QA-Template eingefügt werden:

Überschriften werden in Reihenfolge vorgelesen (H1 → H2 → H3, keine übersprungenen Ebenen)
Skip-Link funktioniert (einmal Tab, hören, Enter, Fokus springt zum Hauptinhalt)
Alle Formularfelder haben zugehörige Labels, die vom Screenreader angekündigt werden
Pflichtfelder kündigen „Pflichtfeld“ an
Fehlermeldungen werden bei Validierungsfehlern angekündigt
Modal-Dialoge erhalten beim Öffnen den Fokus und halten ihn fest
Beim Schließen eines Modals kehrt der Fokus zum auslösenden Element zurück
Live-Regionen kündigen dynamische Änderungen an (Warenkorb-Aktualisierungen, Suchergebnisse, Toasts)
Alternativtext von Bildern wird als nützlicher Satz vorgelesen, nicht als Dateiname
Dekorative Bilder sind stumm (alt="")
Seitentitel ist aussagekräftig (wird beim Laden zuerst vom Screenreader gelesen)
Linktext ist außerhalb des Kontexts verständlich (kein bloßes „Hier klicken“ oder „Mehr lesen“)

6. Häufig gestellte Fragen

Was ist der beste kostenlose Screenreader für Tests?

NVDA unter Windows. Er ist kostenlos, Open Source, wird von NV Access aktiv gepflegt und wird von rund 35–40 % der WebAIM-Umfrageteilnehmer als primärer Screenreader genutzt. Wer nur ein Hilfstechnologieprodukt zum Testen installiert, sollte NVDA mit Firefox oder Chrome auf einem Windows-Rechner oder einer VM wählen.

Mit wie vielen Screenreadern muss getestet werden?

Zwei gründlich getestete Screenreader sind besser als fünf schlecht getestete. Das realistische Minimum ist NVDA unter Windows für den Desktop und VoiceOver auf iOS für Mobilgeräte — zusammen decken sie den größten Anteil echter Nutzende ab. JAWS sollte hinzugefügt werden, wenn die Zielgruppe im Behörden-, Finanz- oder Gesundheitsbereich liegt, und TalkBack auf Android, wenn der mobile Datenverkehr schwerpunktmäßig Android-Geräte betrifft.

Können automatisierte Werkzeuge Screenreader-Tests ersetzen?

Nein. Automatisierte Werkzeuge erfassen rund 30–40 % der WCAG-Probleme — fehlende alt-Attribute, ungültiges ARIA, fehlende Labels. Sie können nicht beurteilen, ob Alternativtext nützlich ist, ob dynamische Inhalte tatsächlich angekündigt werden oder ob die Fokusverwaltung sich richtig anfühlt. Automatisierung ist als Mindeststandard zu nutzen, nicht als Obergrenze, und sollte mit regelmäßigen manuellen Tests am echten Screenreader kombiniert werden.

Wird ein Mac benötigt, um VoiceOver zu testen?

Für lokale Tests ja — VoiceOver läuft nur auf macOS und iOS. Wenn das Team ausschließlich Windows nutzt, bieten Cloud-Dienste wie Assistiv Labs und BrowserStack Accessibility Remote-VoiceOver-Sitzungen gegen die eigene URL an. Für gelegentliche Überprüfungen ist das ausreichend; für ernsthafte iOS-Arbeit empfiehlt sich ein Mac oder ein iPhone.

Was ist der Unterschied zwischen NVDA und JAWS?

Beide sind Windows-Screenreader und funktionieren mit allen gängigen Browsern. NVDA ist kostenlos, Open Source, schlanker und tendenziell etwas strenger hinsichtlich ARIA-Konformität. JAWS ist kommerziell (rund 95 $ pro Jahr für eine Privatlizenz), funktionsreicher, hat eine längere Geschichte in Unternehmens- und US-Bundesbehörden-Einsätzen und ist manchmal nachsichtiger gegenüber unvollständigem Markup. Wenn eine Seite in NVDA funktioniert, funktioniert sie in der Regel auch in JAWS — das Umgekehrte gilt nicht immer.

Wie häufig sollten Screenreader-Tests durchgeführt werden?

Automatisierungsprüfungen (axe, eslint-plugin-jsx-a11y, AT-driver-Tests) sollten bei jedem Pull Request ausgeführt werden. Manuelle Screenreader-Durchläufe auf wichtigen Nutzungspfaden gehören in die Release-Checkliste — typischerweise jeden Sprint oder jedes Release. Ein vollständiges manuelles Audit durch Tester mit Behinderungen ist je nach Produktveränderungsrate quartalsweise oder jährlich sinnvoll.


Fazit

Wer noch keinen automatisierten Durchlauf durchgeführt hat, sollte mit dem kostenlosen Barrierefreiheits-Scanner beginnen — er gibt in Sekunden statt Stunden Aufschluss über die offensichtlichen Probleme, die ein Screenreader ebenfalls finden würde. Sobald dieser Mindeststandard gesetzt ist, empfiehlt sich die Planung eines manuellen Audits durch Tester mit Behinderungen für die für das Unternehmen wichtigsten Nutzungspfade. Und wenn Barrierefreiheit ein kontinuierliches Problem statt eines einmaligen Projekts ist, vergleicht der Monitoring-Käuferratgeber die Werkzeuge, die die Produktion zwischen manuellen Audits auf Regressionen überwachen.

„Zwei gründlich getestete Reader sind besser als fünf schlecht getestete. Das gewählte Paar gehört vor allen anderen in die Release-Checkliste, nicht danach.“

— disability-world Redaktion