Saavutettavat PDF-tiedostot alusta loppuun:
tekijyydestä remediaatioon
PDF-saavutettavuus ei ole yksittäinen kytkin, jonka kääntää Acrobatissa lopussa. Se on päätösketju, joka alkaa InDesignista tai Wordista, kulkee tunnistepuun kautta, saavuttaa PDF/UA-vaatimustenmukaisuuden, todennetaan PAC:ssa ja lopulta kohtaa neljä ruudunlukuohjelmaa, jotka lukevat saman tiedoston hieman eri tavoin. Tämä opas käy ketjun läpi siinä järjestyksessä, jossa insinöörit tosiasiassa työskentelevät.
1. Tekijyys: valitse ylävirran työkalu, jonka kanssa voit todella elää
Yksittäinen päätös, joka muovaa jokaista myöhempää vaihetta, on tekijyysympäristö. PDF, joka on generoitu asianmukaisesti rakennetusta InDesign-dokumentista Make Accessible -toiminnon kanssa, kantaa 80 prosenttia saavutettavuusmetadatastaan ennen kuin kukaan avaa Acrobatin. PDF, joka on viety Word-dokumentista, jossa otsikot on tehty lihavoinnilla ja suuremmalla tekstillä, kantaa lähes mitään, eikä mikään jälkikäteinen remediaatio pysty täysin pelastamaan sitä. Tekijyystyökalun valinta ei siis ole esteettinen. Se on rakenteellinen.
Kolme tuotantopolkua hallitsee institutionaalista julkaisemista vuonna 2026. Adobe InDesign Make Accessible -toiminnolla on standardi ladotuille dokumenteille — vuosiraporteille, oppikirjoille, sääntelyhakemuksille — joissa asettelu on kiinteä ja tiedosto lähtee suunnittelutiimistä vain kerran. Microsoft Word Tallenna saavutettavaksi PDF:ksi -toiminnolla on toimistoasiakirjojen — käytäntöjen, sopimusten, kirjeiden — työkalu, jossa lähdettä muokataan jatkuvasti ja PDF on renderöinti eikä kohde. LibreOffice PDF Accessibility Checker -luovutuksella on avoimen lähdekoodin polku, jota käyttävät hallitukset ja yliopistot, joilla on poliittisia syitä välttää Microsoftin ja Adoben teknologiapinoja.
InDesignin ja Wordin tuottamat tunnistepuut ovat rakenteellisesti johdettu kappaleasetuksista. Remediaatiotyökalujen tuottamat tunnistepuut ovat väitetty jälkikäteen. Ensimmäinen on tarkistettavissa lähteen perusteella; toinen on tarkistettavissa vain itsensä perusteella. Auditoijat pyytävät yhä useammin näkemään lähteen, ei pelkkää PDF:ää.
2. Tunnistepuu: mitä jokainen saavutettava PDF todella sisältää
Jokaisen saavutettavan PDF:n alla on rinnakkainen looginen rakenne — tunnistepuu — jolla ei ole mitään tekemistä visuaalisen asettelun kanssa. Näkyvä PDF on koordinaattiosoitteinen maaliohjejoukko. Tunnistepuu on erillinen hierarkkinen dokumentin oliorakenne, joka sanoo tämä maalausoperaatio on ensimmäinen otsikko, tuo on toisen listan kolmas luetelmakohta, tämä kuva on koristeellinen, tuolla kuvalla on alt-teksti “Neljännesvuosittainen liikevaihto segmenteittäin, TP24”. Ruudunlukuohjelma lukee tunnistepuun, ei maalin.
Kuusi tunnistekategoriaa kantaa suurimman osan merkityksestä todellisissa dokumenteissa: otsikot (H1–H6) muodostavat navigoitavan jäsennyksen; kappaleet (P) ovat proosakohdat; listat (L, LI, Lbl, LBody) ovat järjestetyt tai järjestämättömät luettelot; taulukot (Table, TR, TH, TD) ovat dataruudukot, joissa sarake- ja rivi-otsikot on esitetty Scope-attribuutin kautta; kuvat (Figure) kantavat alt-tekstin Alt- tai ActualText-attribuutissaan; ja lukemisjärjestys, joka on puun syvyys-ensin-läpikäynti, sanelee järjestyksen, jossa ruudunlukuohjelma puhuu dokumentin. Sivu, joka näyttää oikealta kahdessa sarakkeessa, voi lukeutua väärässä järjestyksessä, jos tunnistepuu laittaa oikean sarakkeen ennen vasenta.
Kaksi lisäattribuuttia on tärkeä jokaisessa tunnistessa oikein tuotetussa tiedostossa. Kieliattribuutti (Lang) kertoo ruudunlukuohjelmalle, mitä ääntämyssanakirjaa käyttää — englanninkieliseen kappaleeseen lainattu ranska tarvitsee oman Lang-attribuutin Span-tunnisteessa, tai se luetaan englantilaisilla foneemeilla. Ja artefaktimerkki erottaa koristeellisen sisällön rakenteellisesta; ylätunnisteet, alatunnisteet, sivunumerot ja koristeelliset viivat on merkittävä artefakteiksi, jotta ruudunlukuohjelma ohittaa ne.
Sect → H1 (sivun otsikko) → P (kansi) → H2 (vasemman sarakkeen otsikko) → P, P, L/LI × 3 → H2 (oikean sarakkeen otsikko) → P, P → Figure Alt-tekstillä → Table TH(Scope=Col)- ja TH(Scope=Row)-elementeillä. Lukemisjärjestys seuraa puuta. Sivun ylätunniste merkitty artefaktiksi.
Yksi tasainen Sect, jossa kaikki sisältö tyypittömänä P-tunnisteina. Otsikot ovat P-tunnisteita suuremmalla fontilla. Listat ovat P-tunnisteita, joissa on luetelmamerkit proosan sisällä. Kuvilla ei ole Alt-tekstiä. Lukemisjärjestys vaihtelee sarakkeiden välillä rivi riviltä, koska tunnistepuu peilaa sarakkeiden maalaamisjärjestystä, ei loogista järjestystä.
Acrobatin lukemisjärjestystyökalu näyttää numeroidut peitteet visuaalisella sivulla, jotka vastaavat tunnistepuun läpikäyntiä. Insinöörit, jotka tarkastavat vain visuaalisen asettelun perusteella, jäävät huomaamatta lukemisjärjestysvirheet, koska visuaalinen asettelu voi olla oikein, vaikka tunnistepuun läpikäynti on sekavaa. Tarkista aina sekä Tunnisteet-paneeli auki että ruudunlukuohjelmalla.
3. PDF/UA-vaatimustenmukaisuus: mitä ISO 14289-1 todella edellyttää
PDF/UA on kansainvälinen standardi saavutettaville PDF-tiedostoille, julkaistu nimellä ISO 14289-1 vuonna 2014 ja päivitetty vuonna 2024. Siinä missä WCAG on teknologianeutraali ja alustandriippumaton, PDF/UA on PDF-spesifinen — se on sopimus dokumentin tuottajaohjelmiston, dokumentin kuluttajaohjelmiston ja avustavan teknologian välillä, joka sanoo tämän tiedoston tunnistepuu, metatiedot ja rakenne ovat todennettavien ehtojen mukaisia, joten vaatimustenmukaisella lukijalla on niihin luottaminen.
Standardi toteutetaan Matterhorn-protokollan kautta, jota ylläpitää PDF Association ja joka hajottaa PDF/UA:n 31 numeroiduksi virheehdoksi, joissa on sekä koneellisesti tarkistettavia että ihmisen tarkistettavia variantteja. Koneellisesti tarkistettavat virheet sisältävät dokumentin otsikon puuttumisen metadatasta, kuvien Alt- tai ActualText-attribuutin puuttumisen, L/LI-tunnisteiden ulkopuolella rakennetut listat sekä puuttuvat kieliattribuutit dokumentissa tai kielenvaihdoissa. Ihmisen tarkistamat virheet kattavat asiat, joita ohjelmisto ei voi itsenäisesti tarkistaa — onko Figure-elementin alt-teksti oikea, vastaako lukemisjärjestys loogista järjestystä, ovatko otsikot loogisesti sisäkkäisiä eikä tasoja ohiteta.
Vuoden 2024 päivitys sovitti PDF/UA:n WCAG 2.2 -onnistumiskriteereihin ja selkeytti digitaalisten allekirjoitusten ja lomakkeiden käsittelyä — saavutettavissa PDF-lomakkeissa on esitettävä kenttätunnisteet, kenttätyökaluvihjeet ja välilehtijärjestys, ja allekirjoitetuissa PDF-tiedostoissa ei saa estää ruudunlukuohjelman pääsyä taustalla olevaan tunnistepuuhun allekirjoituksen jälkeen.
”PDF/UA-vaatimustenmukaisuus on lattia, ei katto. Tiedosto voi läpäistä kaikki 31 Matterhorn-ehtoa ja olla silti huono lukukokemus, jos alt-teksti on geneerinen tai lukemisjärjestys on teknisesti pätevä mutta semanttisesti väärä.”
4. Remediaatiotyökalut: neljä tuotetta, joista insinöörit tosiasiassa valitsevat
Kun PDF saapuu ilman käyttökelpoista tunnistepuuta — ja useimmat vanhat PDF-tiedostot saapuvat ilman — insinöörin valinta kaventuu neljään remediaatioympäristöön. Jokaisella on erilainen yhdistelmä vahvuuksia tunnistepuun muokkauksessa, OCR:ssä skannatuille alkuperäisille, eräkäsittelyssä ja PDF/UA-raportoinnissa. Alla oleva matriisi kartoittaa kyvykkyyden työkalua vastaan.
| PAC 2024 | Adobe Acrobat Pro | Foxit PDF Editor | ABBYY FineReader 16 | |
|---|---|---|---|---|
| PDF/UA:n täysraportti | Kyllä (kanoninen) | Osittain (esitarkistus) | Osittain (oma tarkistin) | Rajoitetusti |
| Tunnistepuun muokkaus sovelluksessa | E/V (vain luku) | Kyllä | Kyllä | Kyllä |
| OCR skannatuille PDF:ille | E/V | Kyllä | Kyllä | Kyllä (paras luokassaan) |
| Lukemisjärjestyksen peite | Vain luku | Kyllä (Touch Up Reading Order) | Kyllä | Rajoitetusti |
| Eräkäsittely / skriptattu remediaatio | E/V | Kyllä (Actions) | Kyllä (Actions) | Kyllä (Hot Folder) |
| Matterhorn-linjattu tuloste | Kyllä | Likimääräinen | Likimääräinen | Rajoitetusti |
| Hintakaista | Ilmainen | Tilaus | Pysyvä tai tilaus | Pysyvä |
PAC on ainoa laajasti luotettu PDF/UA-tarkistin alalla, mutta se ei muokkaa. Useimmat tuotantotiimit yhdistävät PAC:n Acrobat Pron kanssa (oletus) tai Foxitin kanssa (kun lisenssivaatimukset edellyttävät vaihtoehdon) ja turvautuvat ABBYY:n vain kun lähde on skannattu vain kuvia sisältävä PDF, joka tarvitsee OCR:n ennen kuin mitään tunnistepuuta voidaan rakentaa.
5. Miten neljä ruudunlukuohjelmaa käsittelee merkittyä PDF:ää
Oikein merkitty PDF on vain tuottajan puoli ketjusta. Toinen puoli on ruudunlukuohjelma, ja neljä ohjelmaa, joita käyttäjät tosiasiassa käyttävät, käsittelevät samaa tiedostoa hienovaraisesti eri tavoin. Erot ovat merkittäviä, koska dokumentti, joka luetaan sujuvasti JAWSissa, voi kompastua NVDAssa, ja tiedosto, joka toimii VoiceOverissa macOS:ssa, saattaa käyttäytyä eri tavalla, kun sama tiedosto avataan ChromeVoxilla Chromen sisäisessä PDF-katseluohjelmassa.
JAWS tarjoaa syvimmän ja vanhimman PDF-tuen mistään kaupallisesta ruudunlukuohjelmasta. Sen PDF-tila renderöi merkityt PDF-tiedostot Acrobatin tai Acrobat Readerin kautta ja paljastaa tunnistepuun suoraan — otsikoiden lista (Insert+F6), lomakkeiden lista (Insert+F5), taulukkosolunavigaatio vakio-JAWS-taulukonäppäimillä. Kun PDF:stä puuttuvat tunnisteet, JAWS tarjoutuu päättelemään rakenteen, mutta päätelty tulos on epäluotettava; insinöörien ei pidä validoida JAWS-päätellyin lukemisiin.
NVDA lukee merkittyjä PDF-tiedostoja myös Acrobatin tai Acrobat Readerin kautta selausmoodin navigoinnilla, joka peilaa sen verkkosivumallia — H otsikkojen välillä hyppäämiseen, K linkkien välillä hyppäämiseen, T taulukoiden välillä hyppäämiseen. NVDA:n PDF-tuki on parantunut merkittävästi vuodesta 2022, mutta jää silti jälkeen JAWSista monimutkaisissa taulukoissa ja lomakekentissä. NVDA antaa rehellisempää palautetta dokumenteista, joissa on muodoltaan virheellisiä tunnisteita: siinä missä JAWS saattaa jatkaa, NVDA taipuu vaikenemaan, mikä on diagnostisesti hyödyllistä.
VoiceOver macOS:ssa lukee PDF-tiedostoja Previev’n ja Safarin kautta roottorin navigoinnilla (VO + U) otsikoiden, linkkien, taulukoiden ja lomakekenttien yli. VoiceOver on sallivin neljästä — se rekonstruoi lukemisjärjestyksen jopa huonosti merkityille tiedostoille — mutta sen anteeksianto voi peittää todellisia virheitä. Dokumentti, joka luetaan hyväksyttävästi VoiceOverissa, on silti tarkistettava JAWSia tai NVDAa vastaan, ei toisinpäin.
ChromeVox ChromeOS:ssa, ja laajemmin minkä tahansa ruudunlukuohjelman käyttäytyminen vuorovaikutuksessa Chromen sisäisen PDF-katseluohjelman kanssa, kuuluu eri kategoriaan. Chromen PDF-katseluohjelma rasterisoi ja uudelleenpoimii tekstin sen sijaan, että renderöisi alkuperäistä tunnistepuuta, joten puhtaan tunnistepuun omaava PDF voi menettää suuren osan rakenteestaan, kun se avataan suoraan Chromessa. Kiertotie saavutettavuuskriittisissä yhteyksissä on pakottaa tiedosto lataamaan ja avaamaan Acrobat Readerissa tai tarjota HTML-vaihtoehto.
| JAWS · Acrobat | NVDA · Acrobat | VoiceOver · Preview | ChromeVox · Chrome-katselin | |
|---|---|---|---|---|
| Tunnistepuun uskollisuus | Korkea | Keskisuuri-korkea | Keskeinen | Matala (uudelleenpoimuttu) |
| Otsikoiden navigointi | Kyllä (Insert+F6) | Kyllä (H-näppäin) | Kyllä (roottori) | Rajoitetusti |
| Taulukot TH-laajuudella | Kyllä | Kyllä (parantunut 2022+) | Kyllä (roottori) | Usein tasattu |
| Lomakekentät | Kyllä | Kyllä | Kyllä | Rajoitetusti |
| Kielenvaihto | Kyllä (Lang-attribuutti) | Kyllä | Kyllä | Epäjohdonmukainen |
| Käyttäytyminen virheellisillä tunnisteilla | Jatkaa | Taipuu vaikenemaan | Rekonstruoi | Uudelleenpoimii |
Jos sinulla on aikaa testata vain kahta yhdistelmää, valitse JAWS+Acrobat (institutionaalinen standardi säännellyillä aloilla) ja NVDA+Acrobat (ilmainen avoimen lähdekoodin perustaso). Yhdessä ne kattavat suunnilleen saman alueen kuin neljän ohjelman läpikäynti, lukuun ottamatta ChromeVox-spesifisiä reunatapauksia.
6. Koko ketjun työnkulku siinä järjestyksessä kuin se tosiasiassa suoritetaan
Ketjun kokoaminen yhteen: yksi saavutettava PDF kulkee kuuden konkreettisen vaiheen läpi. Ne ovat peräkkäisiä — minkä tahansa vaiheen ohittaminen tuottaa tiedoston, joka epäonnistuu jossakin myöhemmistä vaiheista tai käyttäjän käsissä.
Kirjoita tunnisteymmärtävässä työkalussa ja kartoita kappaleasetukset
Joko InDesign kappaleasetuksilla kartoitettuna Export Tags -tunnisteihin, Word sisäänrakennetuilla Tyylit-asetuksilla sovellettuna (ei tekaistuja otsikoita), tai LibreOffice Otsikko- ja Lista-tyyleillä sovellettuna. Tunnistepuu generoidaan näistä tyylimäärityksistä.
Vie saavutettavuustoiminto käytössä
InDesign: Tiedosto → Vie → PDF, valitse Tagged PDF ja suorita Make Accessible -toiminto. Word: Tiedosto → Tallenna Adobe PDF:nä tai Tallenna PDF:nä valinnalla Document structure tags for accessibility. LibreOffice: Tiedosto → Vie PDF:nä, valitse Tagged PDF ja Use reference XObjects.
Tarkista tunnistepuu Acrobatissa tai Foxitissa
Avaa Tunnisteet-paneeli, kävele puu läpi, varmista otsikkojen looginen sisäkkäisyys, listojen L/LI/Lbl/LBody-rakenne, taulukoiden TH Scope-attribuutilla, kuvien Alt tai ActualText sekä koristeellisten elementtien merkitseminen artefakteiksi. Suorita Työkalut → Saavutettavuus → Lukemisjärjestys lukemisjärjestyksen numeeriseen tarkistamiseen.
Suorita PAC kanoniselle PDF/UA-raportille
PAC tuottaa Matterhorn-protokollaraportin koneellisesti tarkistettavan osuuden. Ratkaise jokainen punainen lippu. Huomaa, että PAC:n vihreä lippu kattaa vain 31 koneellisesti tarkistettavaa ehtoa; ihmisen tarkistamat ehdot (kuten se, onko alt-teksti merkityksellinen) edellyttävät edelleen ihmistä.
Testaa vähintään kahdella ruudunlukuohjelmalla
JAWS+Acrobat ja NVDA+Acrobat vähintään, plus VoiceOver jos yleisösi sisältää macOS-käyttäjiä. Navigoi otsikoiden, taulukoiden ja lomakekenttien mukaan. Varmista, että kielenvaihdot luetaan oikealla äänellä. Varmista, että lukemisjärjestys vastaa loogista järjestystä.
Toimita ja versionhallinnoi lähde
Toimitettava on PDF, mutta ylläpidettävä artefakti on lähde-dokumentti kappaleasetuskarttoineen. Tallenna molemmat. Kun dokumenttia on päivitettävä, vie ja tarkista uudelleen lähteestä — älä muokkaa toimitetun PDF:n tunnistepuuta suoraan, ellei lähde ole palautumattomasti kadonnut.
Yhteenveto: saavutettavan PDF:n tuotanto on ketju, ei valintaruutu
Tiimit, jotka käsittelevät PDF-saavutettavuutta loppuvaiheen remediaatio-ongelmana, päätyvät maksamaan laskun kahdesti — kerran remedioidakseen tiedoston, joka on tuotettu ilman rakenteellista tarkoitusta, ja uudelleen joka kerta, kun tiedostoa päivitetään. Tiimit, jotka käsittelevät sitä tekijyysongelmana, rakentavat tunnistepuun lähteessä, generoivat sen puhtaasti jokaisessa versiossa ja käyttävät PAC:ia ja ruudunlukuohjelmaa tarkistamiseen eikä korjaamiseen. Kustannusero näiden kahden lähestymistavan välillä on suuri; saavutettavuusero on suurempi.
Yllä dokumentoitu ketju on tarkoituksella työkaluneutraali jokaisessa lenkissä. Olipa ylävirran työkalu InDesign tai LibreOffice, muokkaaja Acrobat tai Foxit, tarkistin PAC ja ruudunlukuohjelma JAWS tai NVDA, rakenteellinen logiikka on sama: kappaleasetukset kartoitetaan tunnisteisiin, tunnisteet ovat PDF/UA:n mukaisia, PDF/UA tarkistetaan PAC:lla ja ruudunlukuohjelmat lukevat tuloksen. Työkalut muuttuvat; ketju ei.
Hankinta- ja vaatimustenmukaisuustiimeille operatiivinen johtopäätös on, että PDF-saavutettavuusselosteet pitäisi viitata tuotantoketjuun — tekijyystyökaluun, vientitoimintoon, tarkistimeen — eikä pelkästään Acrobatin tarkistustulokseen. Suunnittelutiimeille johtopäätös on, että tunnistepuu on totuuden lähde ja tunnistepuu rakennetaan ylävirran kohteeksi käyttäjän koskaan näkemästä PDF:stä. Käytännön tuotantolaboratorion opasta, joka täydentää tätä primeria, katso PDF-saavutettavuuden vaiheittainen peliopas.
”Saavutettava PDF on se, jonka tunnistepuu on kirjoitettu, ei se, jonka tunnistepuu on paikattu.”