Bildbeschreibung: Eine blinde Testerin mit Kopfhörern führt JAWS auf einem Laptop aus, während ein Kollege mit einer Bildschirmvergrößerung dieselbe Seite auf einem zweiten Bildschirm prüft — zwei Testende mit Behinderungen führen nebeneinander ein manuelles Barrierefreiheits-Audit durch.

Lesedauer: 12 Minuten

Automatisierte Barrierefreiheitsscanner erkennen auf einer typischen Seite zwischen 57% und 70% der WCAG-Verstöße. Die verbleibenden 30 bis 40% sind der Bereich, in dem Klagen, Beschwerden und echte Nutzerreibungspunkte liegen. Tastaturfallen, die erst beim dritten Tab-Zyklus ausgelöst werden. Fokusreihenfolgen, die visuell von oben nach unten verlaufen, aber in der DOM-Reihenfolge zur Fußzeile springen. ARIA-Live-Regionen, die beim Laden der Seite auslösen, anstatt wenn sich Inhalte ändern. Alternativtexte, die die Prüfung „Alt-Attribut vorhanden“ bestehen, aber einem Screenreader „Image 47.png“ vorlesen. Nichts davon ist durch statische Analyse erkennbar.

Ein manuelles Barrierefreiheits-Audit schließt diese Lücke. Ein manuelles Audit, das von Menschen mit Behinderungen durchgeführt wird, geht weiter — es testet, ob die gelieferten Korrekturen tatsächlich für die Nutzenden funktionieren, denen sie helfen sollten. Für Organisationen im Geltungsbereich des European Accessibility Act oder des ADA Title III ist es der einzige Weg, gelebte Nutzbarkeit zu verifizieren. Vor der Beauftragung empfiehlt sich eine schnelle Baseline-Messung mit unserem kostenlosen Barrierefreiheits-Scanner.

Warum manuelle Audits wichtig sind — die Grenzen automatisierter Scans

Automatisierte Scanner sind hervorragend in dem, was sie tun, und was sie tun, ist begrenzt. Sie führen Regelengines — axe-core, Lighthouse, WAVE — gegen ein gepartes DOM aus und markieren fehlende alt-Attribute, Kontrastverhältnisse, Formular-Labels, Landmark-Fehler und fehlerhafte ARIA-Referenzen. Die WebAIM-Million-2024-Analyse ergab, dass Scanner ca. 57% der axe-Regel-Verstöße erkennen — eine Zahl, die mit den internen Daten der meisten Barrierefreiheits-Ingenieure übereinstimmt.

Nun ist zu bedenken, was sie nicht erkennen können.

Eine Seite kann auf jedem Bild alt="Diagramm zeigt vierteljährliche Einnahmen" haben und für einen Screenreader-Nutzenden dennoch unbrauchbar sein, weil das Diagramm tatsächlich die Mitarbeiterzahl zeigt. Der Scanner sieht eine nicht leere Alt-Zeichenkette und fährt fort.

Ein Formular kann jedes Label korrekt verknüpft haben, perfekten Kontrast und saubere Semantik, und dennoch einen Tastaturnutzenden einfangen, wenn der Datumsauswahl-Dialog öffnet und nie den Fokus erhält. Die statische Analyse sieht einen gültigen Komponentenbaum; erst eine Person, die Tab drückt, entdeckt die Falle.

Eine Single-Page-App kann nichts ankündigen, wenn Inhalte aktualisiert werden, weil die aria-live-Region zur Build-Zeit hinzugefügt wurde und das Framework sie bei jeder Navigation neu rendert. Der Scanner sieht das Attribut. Der Screenreader hört Stille.

Fokusreihenfolge ist ein bekanntes Problemfeld. CSS order, flex-direction: row-reverse und absolut positionierte Elemente entkoppeln visuelle Reihenfolge von der DOM-Reihenfolge. Eine Seite kann korrekt aussehen und sich wie ein Puzzle lesen lassen.

Diese Kategorien — sinnvoller Alternativtext, Fokusreihenfolge, Tastaturnutzbarkeit komplexer Widgets, Screenreader-Narrativqualität, Ankündigungen dynamischer Inhalte, Fehlerbeherungs-Flows — bilden die 30 bis 40%-Lücke, die nur eine menschliche Prüfende schließen kann. Unter den menschlichen Prüfenden finden die meisten jene, die diese Technologie täglich nutzen.

Warum Testende mit Behinderungen, konkret

Es ist hilfreich, drei Audit-Modi zu unterscheiden, da Anbieter die Sprache verwischen.

Automatisierter Scan. Was ein axe-core-basierter Scanner erkennen kann — ca. 60 bis 70% der WCAG-testbaren Probleme, zu nahezu null Grenzkosten. Die Ausgangsbasis, nicht das Audit.

Manuelles Audit durch eine sehende Barrierefreiheits-Spezialistin oder einen sehenden Spezialisten. Eine ausgebildete Prüfende geht durch die Website, übt jede interaktive Komponente mit Tastatur und Screenreader, bewertet den Kontrast im Kontext und begründet ARIA-Semantik. Schließt den größten Teil der technischen Lücke — Fokusreihenfolge, Tastaturfallen, ARIA-Missbrauch, Konformität gemäß den WCAG 2.2-Erfolgskriterien.

Manuelles Audit durch Menschen mit Behinderungen (PWD-Testing). Die Spezialistenabdeckung plus eine Dimension, die die ersten beiden Modi strukturell nicht erzeugen können: gelebte Erfahrung. Ist der Alternativtext tatsächlich nützlich? Liest der Screenreader das Formular in einer Reihenfolge vor, die das Ausfüllen ermöglicht? Fühlt sich die Tastaturnavigation nach 50 Tab-Drücken nutzbar an? Ist die vergrößerte Version bei 400% Zoom lesbar?

Der dritte Modus entdeckt Nutzbarkeits-Fehler, die als Konformitätspässe verkleidet sind. Eine Schaltfläche mit der Aufschrift „Hier klicken“ besteht 2.4.4 mit ausreichendem Kontext, aber ein Screenreader-Nutzender, der anhand der Link-Liste navigiert, hört „Hier klicken, hier klicken, hier klicken“ und gibt auf.

„Nichts über uns ohne uns“ ist in der Barrierefreiheitsarbeit kein Slogan — es ist eine methodologische Position. Die Menschen, die die Barrieren erleben, sind die einzigen, die definitiv sagen können, ob eine Korrektur sie beseitigt hat.

Was ein manuelles Audit tatsächlich liefert

Ein manuelles Audit ist ein definierter Liefergegenstand, kein offenes Beratungs-Engagement. Vor der Unterzeichnung eines Leistungsverzeichnisses sollte jeder der folgenden Punkte erwartet werden.

Eine definierte Seiten-Menge. Es werden 20 bis 50 repräsentative Seiten, Nutzerreisen oder Bildschirme mit dem Input der Prüfenden ausgewählt. Die Prüfende crawlt nicht die gesamte Website. Wenn ein Unternehmen anbietet, „die gesamte Website“ für einen Festpreis bei einer 10.000-seitigen Property zu auditieren, ist das Marketing, keine Methodik.

WCAG 2.2 AA-Konformitätsbefunde. Ein Register, das jedes Problem einem spezifischen Erfolgskriterium zuordnet. Bei einer mäßig reifen Website sind bei einem mittelgroßen Audit 80 bis 200 Befunde zu erwarten.

Schweregradbewertung pro Befund. Blocker / Kritisch / Gering. Der Schweregrad ist es, was eine 200-Zeilen-Tabelle in ein handlungsfähiges Rückstand-Register verwandelt.

Nutzerwirkungs-Beschreibung. Nicht „1.4.3 Kontrast-Fehler bei #888 auf #fff“, sondern „Screenreader-Nutzende können Pflichtfelder nicht von optionalen Feldern unterscheiden, weil das Sternchen hellgrau und niedrig kontrastiert ist und nicht angesagt wird.“ Nutzerwirkungs-Formulierungen sind es, was Tickets priorisiert werden lässt.

Empfohlene Behebung. Spezifisch genug zum Handeln. „aria-required='true' hinzufügen und ‘Pflichtfeld’ in das sichtbare Label aufnehmen“ übertrifft „Kontrastproblem beheben.“

Zusammenfassung für die Geschäftsleitung. Ein zwei-bis-drei-seitiges Dokument, das eine leitende Person in fünfzehn Minuten erfassen kann: Konformitätsbefund, Top-5-Risiken, Aufwandsschätzung für die Behebung.

Optional: Veröffentlichte Erklärung zur Barrierefreiheit. Wenn das Audit in eine öffentlichkeitsbezogene Erklärung einfließt, finden sich in unserem Leitfaden zum Audit von Barrierefreiheitserklärungen Beispiele für gute Erklärungen.

Nachprüfungszyklus. Eine geplante Nachprüfung 3 bis 6 Monate nach der Lieferung, um zu verifizieren, dass die Korrekturen die Probleme tatsächlich beheben. Ohne diesen Schritt wurde eine Momentaufnahme gekauft, kein Programm.

Was manuelle Audits kosten — ehrliche Bandbreiten

Anbieter sind mit öffentlichen Preisen zurückhaltend, weil jedes Engagement per Kundenprojekt umfangs-bestimmt wird. Die folgenden Bandbreiten sind realistische 2026-Anhaltspunkte auf Basis von Gesprächen mit Käufern und beobachteten Vertragswerten.

Kleines Audit — 5 bis 10 Seiten, Single-Product-SPA, 1 bis 2 Wochen Bearbeitungszeit, eine einzelne Testende oder ein kleines Team ohne PDF- oder Mobile-Umfang: 5.000 bis 15.000 €.

Mittleres Audit — 20 bis 50 Seiten, mehrere Nutzerreisen, 4 bis 6 Wochen, ein Multi-Behinderungs-Tester-Panel, schriftlicher Bericht, eine Runde Behebungs-Q&A: 15.000 bis 50.000 €.

Enterprise-Audit — 100+ Seiten, native mobile Apps (iOS und Android), mehrere authentifizierte Flows, mehrsprachiger Umfang, 8 bis 12 Wochen, Multi-Tester-Panel, formeller Bericht, Briefing für die Geschäftsleitung: 50.000 bis 250.000 € oder mehr.

Nachprüfung — nach der Behebung, auf denselben Seiten-Umfang beschränkt: in der Regel 30 bis 40% der ursprünglichen Kosten.

Faktoren, die den Preis erhöhen: PDF-Barrierefreiheits-Umfang (arbeitsintensiv, oft separat angeboten), native mobile Apps, SPAs mit authentifizierten Flows, mehrsprachige Websites, dringende rechtliche Verteidigungsrahmung und jede Anforderung für Sachverständigenaussagen.

Faktoren, die den Preis senken: eine stabile statische Website, enger Umfang, vorhandene automatisierte Scan-Ausgabe, die die Prüfenden verwenden können, und eine Mehrfach-Engagement-Beziehung.

Transparente Menüpreise sind nicht zu erwarten. Jeder Anbieter bestimmt den Umfang pro Engagement. Ein pauschaler Seitenpreis, der ohne Einsicht in das Produkt angeboten wird, ist ein Warnsignal, kein Vorteil.

Wie man ein Audit-Unternehmen wählt — Kaufkriterien

Diese Punkte sollten als Vorauswahl-Filter verwendet werden, wenn eine Ausschreibung an drei oder vier Unternehmen herausgegeben wird.

Tester-Zusammensetzung. Nicht verhandelbar. Nach dem Behinderungsprofil der Testenden für das eigene Engagement sollte gefragt werden — Screenreader, Seheinschränkung, motorische Beeinträchtigung, kognitiv und gehörlos oder schwerhörend. Wenn das Unternehmen nicht antworten kann, ist es das falsche Unternehmen.

WCAG-Version. WCAG 2.2 sollte 2026 die Untergrenze sein. Manche Unternehmen verwenden noch 2.1 als Standard — es sollte WCAG 2.2 AA explizit im Leistungsverzeichnis eingefordert werden.

Audit-Rahmenwerk. Verwendet das Unternehmen eine etablierte Methodik — WCAG-EM, Trusted Tester oder ein veröffentlichtes hauseigenes Äquivalent — oder wird sie pro Engagement neu erfunden? Eine veröffentlichte Methodik signalisiert betriebliche Reife.

Stichproben-Methodologie. Das Leistungsverzeichnis sollte angeben, wie Seiten ausgewählt wurden und was im Umfang enthalten und was ausgeschlossen ist.

Nachprüfungsrichtlinie. Als fester Liefergegenstand enthalten oder separat berechnet? Sechs Monate ist angemessen; „unbegrenzt“ ist Marketing.

Mobile und PDF-Umfang. Normalerweise als Zusatzleistungen angeboten. Es empfiehlt sich, sie von Anfang an in den Umfang aufzunehmen — später hinzugefügt kostet es mehr.

Berichtsformat. Entwicklerseitige JIRA-Importe, Führungs-PDF, rechtssichere Sachverständigen-Protokolle — verschiedene Zielgruppen, verschiedene Formate. Im Voraus fragen.

Manuelle Audit-Übergabe. Übergibt das Unternehmen die Befunde in eine Monitoring-Plattform, oder übergibt es ein statisches PDF, das in einem SharePoint-Ordner veraltet? Die Integration ist echtes Geld wert.

Geografische und sprachliche Abdeckung. Es sollte nicht angenommen werden, dass ein US-Unternehmen EAA-Expertise hat, oder dass ein europäisches Unternehmen an der ADA-Title-III-Verteidigung gearbeitet hat.

Referenzen von Peer-Organisationen. Drei Referenzen aus der eigenen Branche sollten angefragt werden. Branchenexpertise braucht Jahre zum Aufbau.

Eine faire Vorauswahl von vier Unternehmen, bei denen es sich lohnt, Angebote anzufordern, sowie ein Spezialist, der bekannt sein sollte.

Qualibooth kombiniert automatisiertes Scanning, kontinuierliches Monitoring und manuelle Audits durch Testende mit Behinderungen in einer integrierten Plattform. Der Workflow läuft von Scan → Triage → manuelle Verifizierung → veröffentlichte Erklärung zur Barrierefreiheit, wobei Befunde in einem Dashboard verbleiben statt in einem statischen Bericht. Dies ist die klarste Wahl, wenn ein einziger Anbieter sowohl für laufendes Monitoring als auch für geplante manuelle Audits gewünscht wird und es keine zwei Werkzeuge zusammenstückeln möchte. Einschränkung: eine jüngere Plattform als die langjährigen US-Spezialisten, sodass längere Enterprise-Referenzen noch im Aufbau sind. Qualibooth.

Deque (axe DevTools und Deque Systems-Audits) ist ingenieursgeführt, mit der tiefsten Barrierefreiheits-Ingenieurbank am Markt und der stärksten Tooling-Integrationsgeschichte — axe ist die de-facto-Regelengine in der gesamten Branche. Beste Wahl, wenn Prüfende benötigt werden, die mit eigenen Ingenieuren zusammensitzen und gemeinsam Korrekturen programmieren können. Einschränkung: Preise spiegeln die Marke wider, und die tooling-first-Kultur kann sich für manche weniger PWD-zentriert anfühlen als bei einigen Mitbewerbern.

Level Access ist ein langjährig etabliertes Spezialunternehmen mit starker Enterprise-Positionierung, breiter Jurisdiktionsabdeckung und gut etablierter US-Rechtsverfolgungserfahrung. Beste Wahl, wenn das ADA-Title-III-Klagerisiko der primäre Treiber ist und ein Unternehmen benötigt wird, das bereits als Sachverständige aufgetreten ist. Einschränkung: Großunternehmenspreisniveau und eine Prozessorientierung, die manche kleineren Käufer als schwerfällig empfinden.

TPGi (früher The Paciello Group) hat tiefe Wurzeln in der WCAG-Arbeit bis zu den frühesten Entwürfen des Standards, JAWS-Integration über das Mutterunternehmen Vispero und ungewöhnlich starke Expertise bei assistiven Technologien. Beste Wahl, wenn das Screenreader-Verhalten das zentrale Anliegen ist. Einschränkung: kleinerer Umfang als Deque oder Level Access für globale Mobile-App-Engagements.

Fable ist spezialisiert auf Remote-Nutzertests durch Menschen mit Behinderungen — Nutzbarkeitsforschung, keine WCAG-Konformitätsaudits. Beste Wahl als Ergänzung zu einem Konformitätsaudit, wenn Rückmeldungen aus gelebter Erfahrung zu einem Flow gewünscht werden, ohne dass ein 200-Befunde-Konformitätsregister benötigt wird. Einschränkung: kein Ersatz für ein WCAG-Audit; ergänzend dazu.

In der Praxis stellen die meisten reifen Käufer drei dieser Unternehmen in die engere Wahl, definieren den Umfang eng und wählen auf Basis der Tester-Zusammensetzung und des Fit statt des Preises.

Häufige Fallstricke beim Kauf eines Audits

Das Audit als Konformitätszertifikat behandeln. Es ist eine Momentaufnahme eines definierten Umfangs zu einem Zeitpunkt. Es reduziert das Risiko und erzeugt einen Nachweis. Es ist keine Lizenz.

Zu eng scopen. Ein 10-seitiges Audit bei einer 10.000-seitigen Website ist eine kleine Stichprobe. Es sollte ein Umfang budgetiert werden, der die tatsächliche Produktfläche repräsentiert.

Kein Budget für die Behebung einplanen. Das Audit zeigt die Kosten der Barrierefreiheitsschuld auf — in der Regel das Fünf- bis Zwanzigfache des Audit-Honorars. Ohne Behebungsbudget wurde ein Regalblatt-Dokument gekauft.

Die Nachprüfung überspringen. Ohne Verifizierung ist nicht bekannt, ob die Korrekturen funktioniert haben. Einige haben es getan, einige nicht, einige haben neue Probleme eingeführt.

Ein Unternehmen beauftragen, das keine Testenden mit Behinderungen hat. Der häufigste Fehlerfall. Nach der Tester-Zusammensetzung für das spezifische Engagement sollte gefragt werden, nicht nach den Marketing-Seiten-Durchschnittswerten des Unternehmens.

Automatisierte-Scan-as-a-Service mit einem manuellen Audit verwechseln. Mehrere Anbieter verkaufen Scan-Ausgaben, die als Audits verpackt sind. Wenn es innerhalb von 48 Stunden geliefert wurde und unter 3.000 € kostet, ist es ein Scan-Bericht.

Das Audit kaufen, aber den Prozess nicht ändern. Die Befunde werden beim nächsten Release wiederkehren, wenn Design, Engineering und QA keine eingebaute Barrierefreiheit haben. Das Audit ist eine Diagnose; die Kur ist ein Prozess.

Häufig gestellte Fragen

Was kostet ein Barrierefreiheits-Audit?
Realistische Bandbreiten für 2026: Ein kleines Audit mit 5–10 Seiten einer einzelnen SPA kostet ca. 5.000–15.000 €; ein mittleres Audit mit 20–50 Seiten und mehreren Nutzerreisen liegt bei 15.000–50.000 €; und ein Enterprise-Engagement mit 100+ Seiten, mobilen Apps und mehreren Flows kann von 50.000 bis 250.000 € oder mehr reichen. Nachprüfungen nach der Behebung kosten in der Regel 30–40% des ursprünglichen Preises.

Wie lange dauert ein manuelles Barrierefreiheits-Audit?
Die meisten Engagements laufen 2–6 Wochen für kleine bis mittlere Umfänge und 8–12 Wochen für Enterprise-Audits, die mobile Apps, PDFs oder mehrere Sprachvarianten umfassen. Die eigentliche Feldarbeit ist selten der Engpass — die Terminplanung der Testenden mit den richtigen Profilen für assistive Technologien und das Schreiben des Berichts nehmen den größten Teil der Kalenderzeit in Anspruch.

Was ist der Unterschied zwischen automatisierten und manuellen Barrierefreiheits-Audits?
Automatisierte Scanner erkennen ca. 57–70% der programmatisch testbaren WCAG-Verstöße — fehlende Alternativtexte, niedriger Farbkontrast, Formular-Labels, Landmark-Struktur. Manuelle Audits decken die verbleibenden 30–40% ab: Fokusreihenfolge, Tastaturfallen, Qualität sinnvoller Alternativtexte, Screenreader-Lesbarkeit, Ankündigungen dynamischer Inhalte und andere Probleme, die menschliches Urteilsvermögen erfordern. Manuelle Audits durch Testende mit Behinderungen fügen eine dritte Ebene hinzu — gelebte Nutzbarkeit, nicht nur technische Konformität.

Beschäftigen alle Barrierefreiheits-Audit-Unternehmen Testende mit Behinderungen?
Nein. Viele Unternehmen führen Audits ausschließlich mit sehenden Barrierefreiheits-Spezialisten durch, die assistive Technologien emulieren. Seriöse behindertengeleitete Audits umfassen Testende, die täglich Screenreader, Vergrößerung, Schaltersteuerung oder Sprachsteuerung über ein breites Spektrum von Behinderungen hinweg nutzen. Es sollte jeder potenzielle Anbieter nach der Zusammensetzung seiner Testenden gefragt werden, bevor ein Vertrag unterzeichnet wird.

Wie oft sollte eine Nachprüfung durchgeführt werden?
Ein vollständiges manuelles Audit ist in der Regel 12 Monate für ein stabiles Produkt gültig, oder bis eine Hauptversion die auditierten Flows ändert. Die meisten reifen Teams kombinieren ein jährliches manuelles Audit mit kontinuierlichem automatisierten Monitoring zwischen den Audits und führen eine gezielte Nachprüfung 3–6 Monate nach der Behebung durch, um die Korrekturen zu verifizieren.

Kann ein manuelles Audit ADA- oder EAA-Konformität garantieren?
Kein seriöses Audit-Unternehmen bietet eine Konformitätsgarantie. Ein Audit ist eine Momentaufnahme der Konformität mit einem Standard wie WCAG 2.2 AA für einen definierten Umfang zu einem Zeitpunkt. Es reduziert das rechtliche Risiko und erzeugt einen Nachweis, aber weder die ADA noch der EAA erkennt eine private Zertifizierung als verbindlich an.

Welche Liefergegenstände enthält ein manuelles Audit?
Ein typisches Engagement liefert: eine definierte Seiten-Menge, ein Befunde-Register gegen WCAG 2.2 AA mit Schweregradbewertungen, Nutzerwirkungs-Beschreibungen pro Befund, empfohlene Behebungsmaßnahmen, eine Zusammenfassung für die Geschäftsleitung, eine optionale veröffentlichte Erklärung zur Barrierefreiheit und einen Nachprüfungszyklus 3–6 Monate nach Lieferung. Einige Anbieter übergeben Befunde auch in eine Monitoring-Plattform; andere liefern ein statisches PDF.

Nächste Schritte

Für eine schnelle Baseline-Messung vor dem Briefing eines Anbieters empfiehlt sich, den kostenlosen Barrierefreiheits-Scanner auf den Seiten mit dem höchsten Datenverkehr auszuführen — die Ausgabe liefert die offensichtlichen 60%, bevor eine Prüfende beginnt. Für laufende Beobachtung zwischen Audits vergleicht unser Monitoring-Kaufleitfaden die Plattformen, die die kontinuierliche Hälfte des Problems abdecken.

Und vor der Verpflichtung gegenüber einem einzigen Unternehmen sollten umfangsbeschränkte Angebote von mindestens zwei oder drei der Audit-Anbieter auf der obigen Liste angefordert werden — die Preise variieren mehr als die Marketing-Seiten suggerieren, und die Tester-Zusammensetzung variiert noch mehr.