图片说明:一位佩戴耳机的盲人测试人员在笔记本电脑上运行JAWS,旁边一位使用屏幕放大镜的同事在第二块显示器上查看同一页面——两位残障测试人员并肩开展人工无障碍审计。

阅读时间:12分钟

自动化无障碍扫描器能发现典型页面上57%至70%的WCAG违规问题。剩余的30%至40%,才是诉讼、投诉和真实用户摩擦的来源。只有在第三次Tab循环时才触发的键盘陷阱。视觉上从上到下排列,但在DOM顺序中跳转到页脚的焦点顺序。在页面加载时触发而非内容变化时触发的ARIA实时区域。通过了”alt属性存在”检查,但被屏幕阅读器读作”Image 47.png”的替代文本。这些都无法通过静态分析检测到。

人工无障碍审计填补了这一空白。由残障人士开展的人工审计更进一步——它检验所发布的修复方案是否真正对本应受益的用户有效。对于属于欧洲无障碍法案(EAA)或ADA第三章适用范围的机构,这是验证真实使用体验的唯一途径。在委托审计前,建议先使用免费无障碍扫描器建立快速基线。

为何人工审计至关重要——自动化扫描的局限性

自动化扫描器在其能力范围内表现出色,而其能力范围是有边界的。它们对解析后的DOM运行规则引擎——axe-core、Lighthouse、WAVE——标记缺失的alt属性、对比度比值、表单标签、地标错误和损坏的ARIA引用。WebAIM Million 2024分析发现,扫描器能检测约57%的axe规则违规,这与大多数无障碍工程师从内部数据中报告的数字相符。

接下来考虑它们无法检测的内容。

一个页面可以在每张图片上都有alt="显示季度收入的图表",但对屏幕阅读器用户来说仍然无法使用,因为图表实际上显示的是人员编制。扫描器看到非空的alt字符串,继续扫描下一项。

一个表单可以拥有正确关联的每个标签、完美的对比度和干净的语义,但当日期选择器打开一个永远不会获得焦点的模态框时,仍然会困住键盘用户。静态分析看到的是有效的组件树;只有人工按下Tab键才能发现陷阱。

一个单页应用在内容更新时可能什么都不通告,因为aria-live区域是在构建时添加的,但框架在每次导航时都会重新渲染它。扫描器看到了该属性,屏幕阅读器听到的是沉默。

焦点顺序是一个众所周知的问题领域。CSS的orderflex-direction: row-reverse和绝对定位元素会将视觉顺序与DOM顺序解耦。一个页面看起来正确,但阅读起来像拼图。

这些类别——有意义的替代文本、焦点顺序、复杂部件的键盘可用性、屏幕阅读器叙事质量、动态内容通告、错误恢复流程——构成了只有人工审核员才能填补的30%至40%差距。在人工审核员中,发现问题最多的是每天使用这些技术的人。

为何特别需要残障测试人员

区分三种审计模式很有帮助,因为供应商在用语上往往含混不清。

自动化扫描。基于axe-core的扫描器能检测的内容——约60%至70%的WCAG可测试问题,边际成本接近零。这是基线,而不是审计。

由视力正常的无障碍专家开展的人工审计。经过培训的审核员遍历网站,用键盘和屏幕阅读器操作每个交互组件,在上下文中判断对比度,推理ARIA语义。填补了大部分技术差距——焦点顺序、键盘陷阱、ARIA误用,以及对照WCAG 2.2成功准则的书面符合性。

由残障人士(PWD测试)开展的人工审计。专家覆盖的范围,加上前两种模式在结构上无法产生的维度:真实使用体验。替代文本真的有用吗?屏幕阅读器按能让用户完成表单的顺序阅读了吗?在按了50次Tab键之后,键盘导航还顺手吗?放大到400%缩放时,放大版本仍然清晰易读吗?

第三种模式能发现伪装成符合性通过的可用性失败。一个标注为”点击此处”的按钮在有足够上下文的情况下可通过2.4.4,但按链接列表导航的屏幕阅读器用户会不断听到”点击此处,点击此处,点击此处”而选择放弃。

“无关我们,不谈我们”在无障碍工作中不是一句口号——而是一种方法论立场。经历这些障碍的人是唯一能够确定修复是否消除了障碍的人。

人工审计实际交付的内容

人工审计是定义明确的可交付成果,而非开放式咨询项目。在签署工作说明书之前,应预期获得以下每项内容。

确定范围的页面集。在审计方的建议下,选定20至50个具有代表性的页面、用户旅程或屏幕。审计方不会爬取整个网站。如果一家公司以固定价格对一个拥有10,000个页面的网站提供”审计全站”的服务,那是营销话术,不是方法论。

WCAG 2.2 AA符合性发现。将每个问题映射至特定成功准则的记录。对于成熟度适中的网站,中型审计预计会发现80至200个问题。

每项发现的严重程度评级。阻断/主要/次要。严重程度是将200行电子表格转化为可操作待办事项的关键。

用户影响叙述。不是”1.4.3对比度失败:#888于#fff上”,而是”屏幕阅读器用户无法区分必填表单字段,因为星号是低对比度灰色且未被通告。“用户影响措辞才能使工单获得优先处理。

修复建议。具体到可执行的程度。“添加aria-required='true'并在可见标签中包含’必填‘“优于”修复对比度问题”。

行政摘要。高层读者能在十五分钟内读完的两至三页文件:符合性结论、五大风险、修复工作量估算。

可选项:发布无障碍声明。如果审计结果需要支撑公开声明,请参阅无障碍声明审计,了解优质声明示例。

复审周期。在交付后3至6个月进行预定复审,以验证修复实际上解决了问题。没有这一环节,购买的只是一份快照,而非一套体系。

人工审计的费用——诚实的报价区间

供应商在公开定价上通常含糊其辞,因为每个项目都是按客户定制范围的。以下区间是基于与买方的对话和观察到的合同价值得出的2026年现实参考。

小型审计——5至10个页面、单产品单页面应用、1至2周交付、单个测试人员或无PDF及移动端范围的小团队:$5,000至$15,000

中型审计——20至50个页面、多个用户旅程、4至6周、多残障类型测试人员小组、书面报告、一轮修复答疑:$15,000至$50,000

企业级审计——100个页面以上、移动原生应用(iOS和Android)、多个已认证流程、多语言范围、8至12周、多测试人员小组、正式报告、高管简报:$50,000至$250,000以上

复审——修复后,范围与原始审计相同:通常为原始费用的30%至40%。

推高价格的因素:PDF无障碍范围(劳动密集型,通常单独报价)、移动原生应用、含已认证流程的单页面应用、多语言网站、紧急法律辩护背景,以及任何需要专家证词的要求。

压低价格的因素:稳定的静态网站、范围紧凑、审计方可使用的既有自动化扫描结果,以及多次合作关系。

不要期望看到公开的菜单定价。每家供应商都按项目定制范围。在未查看产品的情况下给出的固定页面单价是一个警示信号,而非优点。

如何选择审计公司——采购标准

向三至四家公司发出提案邀请时,可将以下标准作为候选名单筛选条件。

测试人员构成。不可谈判。询问项目中测试人员的残障类型构成——屏幕阅读器、低视力、运动障碍、认知障碍以及聋人或听障测试人员。如果公司无法回答,则不适合。

WCAG版本。2026年WCAG 2.2应为最低标准。部分公司仍然默认采用2.1——在工作说明书中明确要求2.2 AA。

审计框架。该公司是否采用成熟的方法论——WCAG-EM、Trusted Tester或已发布的内部等效方法——还是每个项目都临时制定?已发布的方法论标志着运营成熟度。

抽样方法论。工作说明书应说明页面的选择方式以及范围内外的内容。

复审政策。作为固定交付物包含在内,还是单独收费?六个月是合理期限;“无限期”是营销话术。

移动端和PDF范围。通常作为附加项目报价。从一开始就将其纳入范围——后期附加会增加成本。

报告格式。面向开发人员的JIRA导入、行政PDF、法律辩护就绪的宣誓书——不同受众需要不同格式。提前确认。

人工审计移交。该公司是否将发现结果整合到监测平台,还是交给一份在SharePoint文件夹中老化的静态PDF?整合具有真实的货币价值。

地理和语言覆盖。不要假设美国公司具有EAA专业知识,也不要假设欧洲公司有ADA第三章辩护经验。

同类机构的参考案例。询问所在行业的三个参考案例。行业专业知识需要多年积累。

值得发出提案邀请的四家公司,以及一家值得了解的专业机构。

Qualibooth将自动化扫描、持续监测和残障测试人员开展的人工审计整合在单一平台中。工作流程从扫描→分类→人工验证→发布无障碍声明,发现结果持久保存在仪表板中而非静态报告里。当需要单一供应商同时满足持续监测和定期人工审计需求,且不希望将两个工具拼凑在一起时,这是最清晰的选择。注意事项:比美国老牌专业机构更年轻,较长的企业参考案例仍在积累中。Qualibooth

Deque(axe DevTools及Deque Systems审计)以工程为导向,在市场上拥有最深厚的无障碍工程团队和最强的工具整合能力——axe是整个行业事实上的规则引擎。最适合希望审计人员与工程师并肩工作并配对修复的场景。注意事项:定价反映品牌溢价,工具优先的文化有时不如部分竞争对手以残障人士为中心。

Level Access是历史悠久的专业机构,企业定位强,司法管辖覆盖广,美国法律辩护经验丰富。最适合ADA第三章诉讼风险是主要驱动因素,且需要曾经出庭作证的公司的场景。注意事项:大型机构定价,以及部分小型买方觉得繁琐的流程导向。

TPGi(前身为The Paciello Group)在WCAG工作方面有深厚渊源,可追溯至该标准最早的草案,通过母公司Vispero与JAWS深度整合,并拥有异常强大的辅助技术专业知识。最适合屏幕阅读器行为是核心关注点的场景。注意事项:对于全球移动应用项目,规模小于Deque或Level Access。

Fable专注于残障人士远程用户测试——可用性研究,而非WCAG符合性审计。最适合作为符合性审计的补充,当需要对某个流程获得真实使用反馈但不需要200条发现的符合性记录时。注意事项:不能替代WCAG审计,而是其补充。

实践中,大多数成熟买家会从上述机构中入围三家,严格界定工作范围,并根据测试人员构成和契合度而非价格做出选择。

采购审计的常见误区

将审计视为合规证书。它是特定范围在某一时刻的快照,能降低风险并产生证据记录,但不是许可证。

范围过于狭窄。对一个10,000页网站进行10页审计是小样本。应预算足以代表真实产品范围的审计规模。

未预算修复费用。审计揭示的是无障碍债务的成本——通常是审计费用的五至二十倍。没有修复预算,购买的只是一份束之高阁的文件。

跳过复审。没有验证,就无法知道修复是否有效。有些修复成功了,有些没有,有些还引入了新问题。

聘用没有残障测试人员的公司。这是最常见的失败模式。应询问具体项目的测试人员构成,而非公司营销页面上的平均数据。

将自动化扫描即服务与人工审计混淆。部分供应商将扫描输出包装成审计产品。如果48小时内到达且费用低于$3,000,那是一份扫描报告。

购买了审计但没有改变流程。如果设计、工程和质量保证没有内嵌无障碍,发现的问题将在下一次发布时重现。审计是诊断,治疗是流程改变。

常见问题解答

无障碍审计费用是多少?
2026年的现实报价区间:针对单页面应用5至10个页面的小型审计约需$5,000至$15,000;涵盖20至50个页面及多个用户旅程的中型审计约需$15,000至$50,000;覆盖100个页面以上、移动应用及多个流程的企业级审计可能从$50,000至$250,000或更高不等。修复后的复审通常为原始费用的30%至40%。

人工无障碍审计需要多长时间?
大多数中小型审计项目需要2至6周,包含移动应用、PDF或多语言版本的企业级审计需要8至12周。现场测试本身很少是瓶颈——安排具备合适辅助技术配置的测试人员以及撰写报告,才是占用日历时间最多的环节。

自动化与人工无障碍审计有何区别?
自动化扫描器能发现约57%至70%的可程序化检测WCAG违规问题——缺失的替代文本、低颜色对比度、表单标签、地标结构。人工审计覆盖剩余的30%至40%:焦点顺序、键盘陷阱、替代文本质量、屏幕阅读器可读性、动态内容通告,以及其他需要人工判断的问题。由残障测试人员开展的人工审计还增加了第三层——真实使用体验,而非仅仅是技术符合性。

所有无障碍审计公司都聘用残障测试人员吗?
并非如此。许多公司仅由视力正常的无障碍专家模拟辅助技术进行审计。信誉良好的残障主导型审计包含每天使用屏幕阅读器、放大镜、开关输入或语音控制的测试人员,涵盖多种残障类型。在签署合同前,应向任何候选供应商询问其测试人员构成情况。

应该多久重新审计一次?
对于稳定产品,完整人工审计通常有效期为12个月,或直至重大版本更新改变了被审计的流程。大多数成熟团队将年度人工审计与审计间期的持续自动化监测相结合,并在修复后3至6个月内进行专项复审以验证修复效果。

人工审计能保证ADA或EAA合规吗?
没有信誉良好的审计公司会提供合规保证。审计是在特定范围内、特定时间点,针对WCAG 2.2 AA等标准进行的符合性快照。它可以降低法律风险并产生证据记录,但ADA和EAA均不承认私人认证具有约束力。

人工审计会交付哪些成果?
典型项目交付内容包括:确定的页面范围、针对WCAG 2.2 AA的发现记录(含严重程度评级)、每项发现的用户影响叙述、修复建议、行政摘要、可选的公开无障碍声明,以及3至6个月后的复审周期。部分供应商将发现结果移交至监测平台,其他供应商则交付静态PDF。

下一步行动

在向任何供应商简报前,先用免费无障碍扫描器对流量最高的页面进行扫描——输出结果将在审计开始前提供显而易见的60%问题。若需在审计间期进行持续观察,监测工具购买指南对处理持续监测部分的平台进行了比较。

在确定单一供应商之前,至少向上述列表中的两至三家审计供应商索取有范围的提案——定价差异远比营销页面显示的更大,测试人员构成的差异则更为悬殊。