图片描述:一台电子阅读器放在一叠实体书上,顶部放着一副耳机,屏幕显示一页无障碍文字——这是 EPUB3 必须发挥作用的日常场景。

阅读时长:12 分钟

EPUB3 是出版商在《欧洲无障碍法》正式执行后将被衡量的格式标准。它也是世界知识产权组织《马拉喀什条约》和无障碍图书协会在跨境传播无障碍书籍时所使用的格式,是屏幕阅读器用户、低视力读者和印刷障碍学生购买电子书时所期待的格式。与 PDF 不同,EPUB3 天生具有可回流性、语义性和无障碍性——但前提是出版商确实交付了规格要求的元数据、标记和导航结构。一个带有 .epub 扩展名的文件,并不等同于一本无障碍 EPUB。

本文面向出版商、编辑技术团队以及电子书零售商内部的无障碍负责人。文章将介绍 EPUB3.3 规格的要求、schema.org 和 EPUB 无障碍性 1.1 规格期望填写的无障碍元数据字段、2026 年实际能良好渲染 EPUB3 的阅读系统、EAA 合规压力对零售商的影响程度,以及《马拉喀什条约》生态系统如何完善整体图景。本文刻意保持具体性:读完之后,您将清楚地知道应向转换供应商索取什么、在元数据中填写什么,以及上传至零售商之前应测试什么。

EPUB3 的要求

EPUB3 是一项 W3C 建议书。当前稳定版本为 EPUB 3.3,于 2023 年 5 月以 W3C 建议书形式发布——此前该格式从 IDPF 过渡至 W3C。EPUB 3.3 整合了一系列渐进修订,将无障碍性提升为一等要求而非可选伴随文档,并收紧了 EPUB 与更广泛开放网络平台之间的关系。从本质上说,EPUB 是一个打包的 ZIP 压缩文件,包含 HTML、CSS、SVG 及相关资源,由 OPF(开放打包格式)清单和导航文档管理。

为使文件本身具备无障碍性,EPUB 3.3 要求出版商在全书中使用语义化 HTML。这意味着按文档顺序使用真实标题(h1h6)、真实列表(uloldl)、针对表格数据使用带有正确 theadtbodyth 作用域的真实表格,以及使用 EPUB 专用结构语义词汇(epub:type)标记章节、小节、脚注、页码列表条目、词汇表条目以及规格所识别的其他数十种出版角色。一本章节标题以视觉样式化段落而非标题元素表示的书,是不具备无障碍性的——屏幕阅读器无法跳转至下一章,可刷新盲文显示器无法提示章节中断,回流引擎也无法动态生成目录。

语言标签不可省略。每本 EPUB 必须在 OPF 包文档中声明主要语言,而任何使用不同语言的内嵌内容,必须用适当的 langxml:lang 属性标注。文字转语音引擎和屏幕阅读器依据这些标签切换语音配置;一段英文书中未标注语言的法文段落,将以英文语音朗读,结果可以预见地令人啼笑皆非,且具有排斥性。同样的规则适用于混合从左到右和从右到左内容的方向(dir)属性。

每本 EPUB 必须附带导航文档——一个从 OPF 引用的单一 XHTML 文件,至少包含目录(nav epub:type=“toc”),理想情况下还包含将印刷页码映射至书中位置的页码列表(nav epub:type=“page-list”),以及标注封面、正文、索引和其他可发现界面的地标列表(nav epub:type=“landmarks”)。页码列表是使使用无障碍电子书的学生能够在不脱离同班同学阅读纸质版进度的情况下,跟随印刷版教学大纲中页面引用的功能。

每张传达内容的图片都需要 alt 文字描述。装饰性图片使用 alt="",如适当可加 aria-hidden=“true”;但内容图片——图表、摄影书中的照片、地图、儿童读物中的插图——需要真实描述。科学图表等复杂图片需要长描述,可通过 aria-describedby 指向描述元素,或使用 epub:type=“describedFootnote” 模式。涉及数学的任何书籍(超出随意提及的程度),均应将数学内容编码为 MathML,而非光栅化为 PNG 截图。MathML 是唯一能让屏幕阅读器朗读公式、让可刷新盲文显示器以 Nemeth 或统一英语盲文渲染公式、并让读者在不产生像素化的情况下调整公式大小的编码方式。

EPUB3 还支持媒体叠加——在 SMIL 文件中定义的同步文字与预录音频旁白,将每个文字片段映射至音频中的时间范围。带有媒体叠加的 EPUB,可让识字能力较低的读者、认知障碍读者,或仅是通勤者在人声朗读时跟随高亮文字。SMIL 方案早于现代高质量 TTS 的兴起,但两种技术是互补的:媒体叠加仍是儿童读物、语言学习类书籍和无障碍资助转换项目的黄金标准,而 TTS 则处理长尾需求。

无障碍元数据:schema.org / A11y-meta 层

一个具备无障碍性却未宣传自身无障碍性的文件,对需要它的读者来说是不可见的。与 EPUB 3.3 同步发布的 W3C 建议书《EPUB 无障碍性 1.1》规格,要求在 OPF 包文档中填写一组元数据字段。这些字段采用 schema.org 无障碍词汇——与 Bookshare、DAISY 协会、Benetech、无障碍图书协会以及主要零售商数据源所使用的词汇相同。

必填及强烈推荐的属性包括:

  • schema:accessMode——内容使用的感知模式(textualvisualauditory)。小说为 textual;有插图的儿童读物为 textual,visual;媒体叠加音频文字书为 textual,visual,auditory
  • schema:accessModeSufficient——能够独立消费内容的感知模式组合。小说通常将 textual 列为充分(因为所有重要信息均在文字中)。没有 alt 文字描述的图像小说,不能诚实地声称单独 textual 即为充分。
  • schema:accessibilityFeature——来自受控词汇的具体功能:structuralNavigation(结构导航)、alternativeText(替代文字)、longDescription(长描述)、tableOfContents(目录)、readingOrder(阅读顺序)、printPageNumbers(印刷页码)、mathMLsynchronizedAudioText(同步音频文字)、highContrastDisplay(高对比度显示)、displayTransformability(显示可变性)、captions(字幕)、transcript(文字稿)等。
  • schema:accessibilityHazard——披露任何可能引发癫痫发作、晕动症或其他反应的内容:flashing(闪烁)、noFlashingHazard(无闪烁危害)、motionSimulation(运动模拟)、noMotionSimulationHazard(无运动模拟危害)、sound(声音)、noSoundHazard(无声音危害)。如书籍无危害,请明确声明。
  • schema:accessibilitySummary——为最终读者以通俗语言撰写的出版物无障碍性可读摘要,例如:“本出版物符合 WCAG 2.1 AA 级。所有图片均有替代文字。数学公式以 MathML 编码。页码与印刷版一致。“
  • a11y:certifiedBya11y:certifierCredentiala11y:certifierReport——若第三方已针对 EPUB 无障碍性 1.1 对文件进行认证,则填写认证方身份、其持有的证书,以及已发布认证报告的链接。
  • dcterms:conformsTo——出版物符合的合规配置文件,以指向 EPUB 无障碍性 1.1 合规标准的 URL 表示(WCAG 2.1 AA 级,或更新文件中声明的 AAA 级)。

这些字段不是繁文缛节。它们流入零售商目录、无障碍图书协会的全球无障碍图书数据库、Bookshare 的发现系统、学校采购目录,以及零售商现在必须维护的 EAA 报告模板。欧洲标准 EN 17161——通过”全民设计”实现无障碍性——引用了这一元数据层,DAISY 协会维护的 ACE 无障碍检查器所使用的功能性无障碍评估标准同样如此。

阅读系统:2026 年实际能渲染 EPUB3 的软件

出版商无障碍团队中引用最多的抱怨,是同一 EPUB 在不同阅读系统上呈现不同。这个抱怨属实,而且差距至关重要。一个在 DAISY ACE 检查器上得分完美的文件,在某款主流消费阅读器上可能仍无法显示其导航文档,或在主流 iOS 应用上无法朗读其 MathML。规格定义与阅读系统实现之间的差距,是出版商无障碍工作流程必须包含真实设备测试而非仅依赖文件级验证的原因。

Thorium Reader,由 EDRLab 联盟维护,是 2026 年无障碍 EPUB3 的参考免费桌面阅读器。它全面实现了 EPUB 3.3 和 EPUB 无障碍性 1.1,能显示导航文档、页码列表和地标列表,渲染 MathML,支持媒体叠加,并与操作系统文字转语音引擎及主要屏幕阅读器集成(Windows 上的 NVDA、macOS 上的 VoiceOver、Linux 上的 Orca)。许多出版商将 Thorium 作为无障碍验收阅读器:如果一个文件在 Thorium 上正常运行,则说明其格式规范且合规。

VoiceDream Reader(现为 2022 年被收购的 Voice Dream 系列产品之一),仍是印刷障碍读者中希望获得优质 TTS 语音和精细语音参数控制的 iOS 应用领导者。它能可靠地打开 EPUB3,尊重语言标签进行语音切换,支持自定义字体和阅读障碍友好排版,并与 Bookshare 和 Learning Ally 目录集成。对于有阅读障碍、低视力或失明的学生和成年读者,VoiceDream 通常是默认应用。

VoiceOver Books——苹果在 Books 应用内置的有声书体验,与 iOS VoiceOver 配合——是大多数失明 iOS 用户实际使用的路径。它能良好处理 EPUB3,向 VoiceOver 显示导航文档,朗读 alt 文字,根据语言标签切换语音,并显示媒体叠加。Apple Books 目前仍存在不足的地方是:在复杂 STEM 书籍中渲染 MathML,以及当用户通过印刷页码引用导航时,一致显示页码列表方面的问题。

Apple Books 在 macOS、iPadOS 和 iOS 上,是西方市场最广泛的 EPUB3 消费阅读系统,能够较为完善地渲染大多数无障碍功能。其局限性在于长尾部分:某些媒体叠加边缘情形、某些罕见的 MathML 构造,以及超大页码列表时行为不一致。

2026 年最显著的例外仍是 Amazon Kindle。Amazon 在 Kindle 生态系统内并不原生支持 EPUB3;而是在上传时将 EPUB 转换为其专有的 KF8 / KFX 格式。转换保留了文字、基本结构和许多图片,但不保留所有无障碍元数据,不能可靠地渲染 MathML,完全丢弃媒体叠加,并且历史上未向在 Kindle 目录中搜索的用户显示 schema.org 无障碍元数据字段。面向 Amazon 发布的出版商通常维护并行的 KF8/KFX 无障碍工作流,但实际效果是:出版商能够生产的最无障碍 EPUB3,一旦进入最大英语电子书零售商,就会部分降级。下一节描述的 EAA 压力,是能够推动这一局面改变的首个监管杠杆。

EAA 对电子书零售商的压力

《欧洲无障碍法》(Directive (EU) 2019/882)于 2025 年 6 月 28 日正式适用,电子书明确在其范围之内。该指令第 4 条要求经济经营者确保其在欧盟市场投放的产品和服务符合附录 I 规定的无障碍要求。对于电子书及其专用软件,附录 I 要求包括:确保电子书(及访问电子书所需的软件)支持文字转语音,允许用户调整呈现方式(字号、对比度、行距),向辅助技术公开内容导航所需的元数据,在存在同步音频和文字时提供支持,为非文字内容提供替代说明,并防止电子书保护措施阻碍无障碍功能。

实际上,附录 I 的清单几乎与 EPUB 无障碍性 1.1 合规标准一一对应。发布符合 EPUB 无障碍性 1.1 的 EPUB3 文件——正确填写 schema.org 元数据并附有认证声明——的出版商,对附录 I 义务享有强有力的符合性推定。发布无结构 PDF 或阻断屏幕阅读器的 DRM 锁定格式的出版商,则明显处于不合规状态。

合规压力不仅落在出版商身上,同样落在零售商身上——该指令将零售商视为独立的经济经营者。国家市场监管机构于 2025 年下半年至 2026 年开始第一轮 EAA 合规检查,电子书零售商是早期重点,因为目录是公开的,元数据可机器读取,不合规情况易于取证。在欧盟运营的零售商现在普遍要求出版商提交符合 EPUB 无障碍性 1.1 的文件、填写 schema.org 元数据字段并提供认证声明;部分平台已开始在上传时拒绝不合规文件。对于有重大专有格式依赖的平台——尤其是 Amazon Kindle——EAA 已迫使其公开承诺向更紧密的 EPUB3 保真度靠拢,尽管具体工程工作仍在推进中。

对出版商而言,操作层面的结论毫无模糊之处:电子书无障碍元数据现在是出版要求,而非可选项。此前将无障碍性作为独立下游转换流程运行的制作团队,现在必须将其纳入源头工作流。

《马拉喀什条约》与无障碍图书协会生态系统

EPUB3 处于一个更广泛的条约和基础设施生态系统之中,出版商应当了解这一生态系统,因为它改变了”无障碍书籍”在规模上的含义。《马拉喀什条约》——世界知识产权组织《马拉喀什条约——促进盲人、视力障碍者及其他印刷障碍者获取已出版作品》,2013 年通过,目前已在包括欧盟和美国在内的 100 余个缔约方生效——创设了著作权例外,允许授权实体为受益人的利益,在无需就每笔交易获得权利人许可的情况下,制作、发行和跨境交换已出版作品的无障碍格式副本。

该条约在欧盟法中通过《指令 (EU) 2017/1564》和《法规 (EU) 2017/1563》予以实施,在美国通过 2018 年《马拉喀什条约实施法》(修订第 17 章)实施。运营基础设施由无障碍图书协会(ABC)负责——这是一个由世界知识产权组织牵头的联盟,汇集了代表视障人士、为其服务的图书馆、出版商和标准机构的组织。ABC 运营全球图书服务,这是一个跨境借阅和交换平台,通过该平台,授权实体——通常是各国盲人图书馆、美国 Bookshare、英国 RNIB 等组织,以及欧洲和全球南方的同等国家机构——共享无障碍文件。

这些交换的首选格式是带有完整无障碍元数据的 EPUB3,以及 EPUB3 实际上所继承的旧版 DAISY 2.02 和 DAISY 3 格式。一本法国出版商制作为 EPUB 无障碍性 1.1 合规书目的书,原则上可通过 ABC 全球图书服务与肯尼亚、印度、阿根廷或任何其他缔约方的印刷障碍读者共享,无需重新谈判。该条约不改变出版商的商业立场——它专门针对无障碍副本,专为受益人群体服务——但它极大地扩展了出版商所发行的任何格式规范无障碍电子书的读者群。

对出版商而言,EAA 层面与《马拉喀什条约》层面之间的实际联结,是同一块元数据。您为 EAA 合规而生成的 schema.org 无障碍属性、EPUB 无障碍性 1.1 合规声明和认证报告,与允许您的文件流入 ABC 全球图书服务及更广泛授权实体网络的工件完全相同。一次性以正确格式、正确元数据发布文件,同一工件即可同时服务于欧盟合规体系和全球无障碍阅读公众。

出版商的实用工作流程

制作团队在尘埃落定后所形成的实施模式,建立在四个支柱之上。源头无障碍性:源稿在转换之前已具备结构化(真实标题、真实列表、真实表格、语言标注),从而使 EPUB 转换能保留结构,而非事后逆向工程。转换至 EPUB 3.3:转换工具——无论是内部工具、供应商流水线,还是 DAISY 协会工具链等开源工具链——产出带有语义标记的 EPUB 3.3,包含导航文档,在书目有印刷对应版本时附有页码列表,所有内容图片有 alt 文字,涉及数学时有 MathML,以及在编辑摘要要求时有媒体叠加。

元数据填写:每个文件在离开制作时,均附有完整的 schema.org 无障碍元数据块——accessMode、accessModeSufficient、accessibilityFeature、accessibilityHazard、accessibilitySummary、conformsTo——以及在书目已获认证的情况下,a11y:certifiedBy/Credential/Report 字段针对认证记录方(通常是 Benetech 认证项目、DAISY 协会或各国同等机构)填写完毕。验证与真实设备测试:每个文件通过 EPUBCheck 和 DAISY ACE 无障碍检查器验证,并在 Thorium、Apple Books、VoiceDream 以及书目将在其中销售的零售商专用阅读系统上对代表性样本进行测试。

这样做的成本是真实存在的,但随着实践积累和工具完善会迅速下降。不这样做的代价——EAA 不合规罚款、零售商在上传时拒绝文件、错失《马拉喀什条约》网络中的读者,以及发布残障读者无法使用的电子书所带来的更广泛声誉代价——现在已明显更高。EPUB3 无障碍性不再是制作流水线末端的专业子学科,而是规格本身的要求。