Office Open XML

Drupal Suomen wiki

Loikkaa: valikkoon, hakuun
Tämä artikkeli on parhaillaan työn alla. Voit käydä artikkelin keskustelusivulla antamassa palautetta.
Tämä artikkeli tai osio on tietosisällöltään liian yksipuolinen (esim. pelkästään etuihin tai puutteisiin keskittyvä).

Sisällysluettelo

[muokkaa] Yleistä

Office Open XML on sarja XML-rakennekuvauksia toimistosovellusten käyttämien dokumenttien tallennusmuodoksi. Open XML -määritykset laadittiin Microsoft Office 2007:n tuotekehityksen yhteydessä. Microsoft haluaa luoda Open XML:stä markkinoiden standardiratkaisun sovellusten yhteiseksi tietorakenteeksi.

Nimestä käytetään myös lyhyempää muotoa Open XML ja lyhennettä OOXML.

Open XML on hyväksytty Ecma-järjestön standardiksi ECMA-376[1]. Ecma on ehdottanut Open XML:ää ISO/IEC-järjestöille standardoitavaksi. Käsittely ISO/IEC:ssä on kesken.

[muokkaa] Standardin sisältö

Open XML määrittelee kolme XML-pohjaista merkkauskieltä:

  • WordprocessingML
  • SpreadsheetML
  • PresentationML

Kielet on tarkoitettu nimiensä mukaisesti tekstinkäsittelyn, taulukkolaskennan ja esitysgrafiikan merkkaamiseen. Jokainen Open XML -dokumentti sisältää vähintään yhtä näistä kielistä.

Standardi määrittelee lisäksi merkkauskielet matemaattisille yhtälöille, lähdeviittauksille ja vektorigrafiikalle.

Open XML -tiedostot ovat ZIP-paketteja, jotka sisältävät XML-tiedostoja ja tarvittaessa esimerkiksi kuvatiedostoja. Mukana on XML-pohjainen kuvaus dokumentin eri osien suhteista. Esimerkiksi loppuviittaukset sijoitetaan paketin sisällä eri tiedostoon kuin varsinainen teksti.

[muokkaa] Rinnakkaiset standardit

Open XML perustuu Microsoftilla Officen historian aikana kehitettyihin teknologihin. Se käyttää omia määrittelyjä monesta sellaisesta asiasta, johon on olemassa valmis standardi. Lisäksi osa Open XML:n määrittelyistä on suoranaisessa ristiriidassa valmiiden standardien kanssa.

Open XML Julkiset standardit Kommentteja
Open XML Open Document Format (ISO/IEC 26300) Toimistotiedostoille on jo olemassa ISO-hyväksytty standardi[2], jota käytetään mm. Open Officessa.
Päiväysten käsittely Gregoriaaninen kalenteri, ISO 8601 yms. Open XML määrittelee kalenterin uudelleen siten, että Excelin viat ovat oikein ja almanakka väärässä. Päiväykset alkavat vuodesta 1900 (tai 1904), tätä aiemmat vuodet eivät ole sallittuja.
DrawingML, VML W3C SVG Kaksi uutta vektorigrafiikkamuotoa. Open XML sisältää koko VML:n, mutta samalla sitä kehtotetaan olemaan käyttämättä.
Matemaattiset merkinnät W3C MathML, TeX Matemaattisten yhtälöiden merkintään ei käytä standardoitua MathML:ää tai de facto -standardia TeXiä.
Kryptografia ISO 10118-3, SHA yms. Kryptografiaan voi käyttää ainoastaan Microsoftin omia funktioita, joiden turvallisuudesta ei ole tietoa.
Mittayksiköt SI-järjestelmä yms. Open XML sisältää omia mittayksiköitä kuten "English Metric Unit", jotka määritellään ohimennen.

[muokkaa] Kritiikki

[muokkaa] Office-keskeisyys

Open XML:n tärkeimpänä ilmoitettuna suunnittelutavoitteena oli yhteensopivuus olemassa olevien Office-tiedostojen kanssa. Se on käytännössä XML-muotoon käännetty ja dokumentoitu versio Officen aiemmista tiedostomuodoista. Toisin kuin Open Document Format, sitä ei ole suunniteltu yleiskäyttöisyyttä ja kolmansia osapuolia painottaen.

Open XML sisältää monia elementtejä, joiden tarkoitus on taata yhteensopivuus vanhojen Office-versioiden kanssa. Tällaisia ovat mm:

  • autoSpaceLikeWord95
  • lineWrapLikeWord6

Näitä ei ole määritelty tarkasti, vaan toteuttajan täytyy tuntea vanhojen sovellusten toimintatavat. Nämä elementit ovat valinnaisia, mutta tämä ei poista niiden valmistajakeskeisyyttä.

Monet Officen rajoitukset on sisällytetty tarpeettomasti Open XML:ään. Standardiehdotus sisältää lukuisia listauksia eri muuttujien sallituista arvoista. Esimerkiksi paperin kokoa ei voi määrittää ilmoittamalla sivujen pituudet, vaan se määritetään kokonaisluvulla, joka vastaa tiettyä Windowsin rekisterin arvoa.

Office-keskeisten muuttujien määrittely on ajoittain erittäin pikkutarkkaa. Open XML määrittelee mm. 50 sivun verran clipart-leikekuvia, jotka toimitetaan Microsoft Officen mukana. Tällainen paisuttaa standardia, ja koska lista on tyhjentävä, rajoittaa se muiden toteuttajien valinnanvaraa.

[muokkaa] Tekniset heikkoudet

Open XML rikkoo XML:n keskeisiä periaatteita, kuten hierarkkisuutta.

[muokkaa] Lomittaisuus

XML perustuu sisäkkäisiin elementteihin, mutta Open XML käyttää lomittaisia ja muita epähierarkkisia elementtejä. Ne kirjoitetaan XML-elementtien sisälle siten, että tiedosto on edelleen validia XML:ää. Tämä tekee Open XML:stä kaksitasoisen tiedostomuodon, jossa sisempi epähierarkkinen muoto on kuorrutettu XML:llä.

Lomittaisen kaksitasoisen sisällön vuoksi Open XML:stä on vaikea tehdä muunnoksia toisiin tiedostomuotoihin esimerkiksi XSLT-muunnoskielellä, joka ei käytännössä kykene käsittelemään lomittaisuutta.

[muokkaa] Sekasisältöisyyden puuttuminen

Open XML ei ole sekasisältöistä (mixed content) toisin kuin esimerkiksi XHTML, DocBook ja ODF. Sekasisältöisyys tarkoittaa, että tekstin välissä saa olla muita elementtejä. Muunnokset sekasisältöisten kielten välillä ovat huomattavasti helpompia kuin ei-sekasisältöisten kanssa.

[muokkaa] Esimerkki yksinkertaisen tekstifragmentin kuvaamisesta OOXML:llä, vertailua ODF:ään

OOXML:n keskeisen rakenneheikkouden havainnoimiseksi seuraavassa on esitetty lyhyen lauseen "Tämä on hyvin tärkeää" kuvaaminen ODF:llä ja OOXML:llä.

ODF:

<text:p text:style­name="Standard"> 
  Tämä on
  <text:span text:style­name="T1"> 
    hyvin 
  </text:span> 
  tärkeää
</text:p> 

Open XML:

<w:p> 
  <w:r> 
    <w:t> 
      Tämä on  
    </w:t> 
  </w:r> 
  <w:r> 
    <w:rPr> 
      <w:i/> 
    </w:rPr> 
    <w:t> 
      hyvin 
    </w:t> 
  </w:r>
  <w:r>
    <w:t>
      tärkeää
    </w:t>
  </w:r>
</w:p> 

Open XML -esimerkissä lauseen korostetut ja korostamattomat sanat ovat rinnakkaisia elementtejä. Lisäksi kursivoinnin elementti <w:i/> sijaitsee syvemmällä hierarkiassa kuin varsinainen teksti, johon se vaikuttaa.

[muokkaa] Vaikeudet muunnoksissa

XML-pohjaisen asiakirjamuodon tarkoitus ei ole vain asiakirjojen avaaminen toimisto-ohjelmistossa, vaan myös helppo muunnettavuus eri tietojärjestelmien vaatimiin muotoihin, sekä muun muassa erilainen metatietojen poiminta ja indeksointi.

Open XML ei ole pohjimmiltaan XML-henkinen, ja sen integrointi eri järjestelmien välillä on hankalaa.

Muotoilut pirstovat tekstin erillisiksi merkkijonoiksi esimerkiksi vietäessä Open XML -tekstiä käännösjärjestelmään. Tällaiset muunnosongelmat on mahdollista ratkaista, mutta se kasvattaa järjestelmien teknistä vaativuutta ja kustannuksia huomattavasti.

[muokkaa] Puutteellisuus

Open XML sisältää pituudestaan huolimatta puutteita ja ylimalkaisuuksia.

Pahimmat puutteet koskevat viittauksia Microsoftin suljettuihin teknologioihin kuten VBA-makrot ja Windows Metafiles. Standardia on mahdotonta toteuttaa kokonaan tuntematta näitä teknologioita. Microsoftin myöntämässä patenttilisenssissä myös erikseen mainitaan, että lisenssi ei kosketa tällaisia ohimennen mainittuja tekniikoita.

Open XML sisältää lisäksi kohtia, joissa erilaiset visuaaliset tyylit listataan nimeltä, mutta niitä ei tarkemmin määritetä. Tällaisia ovat mm. diaesitysten siirtymät ja graafiset kehykset. Pelkän Open XML:n pohjalta on mahdotonta valmistaa sovellusta, joka näyttäisi nämä tyylit samalla tavalla kuin Office-sovellukset.

[muokkaa] Huolimattomuus

Standardiehdotus on huomattavasti pidempi kuin tekniset standardit yleensä, ja se sisältää paljon osia jotka tavallisesti eristettäisiin omiksi standardeikseen. Se on myös valmisteltu moninkertaisella nopeudella tavallisiin standardeihin verrattuna, mikä näkyy laadussa.

  • Yli kymmenes esimerkeistä ei ole validia XML:ää.
  • Elementtien nimeämiskäytännöt vaihtelevat. Nimiä typistetään mielivaltaisesti.
  • Erilaisten yksiköiden merkintätavat vaihtelevat tapauskohtaisesti.

[muokkaa] Avoimet kysymykset

  • Onko Open XML:lle tehty kattavaa esteettömyystutkimusta (accessibility review)?
  • Julkaistaanko Open XML:lle validaattori, jolla dokumenttien standardinmukaisuus voidaan vahvistaa?
  • Julkaistaanko Open XML:lle testisarja, jolla toteutusten standardinmukaisuutta voidaan arvioida?
  • Jos standardiin tulee käsittelyssä muutoksia jotka eroavat Office 2007:n toteutuksesta, millä tavoin nämä huomioidaan?

[muokkaa] Open XML -yhteensopivat sovellukset

Microsoftin Open XML -yhteisösivuston mukaan seuraavat sovellukset tukevat Open XML:ää:[3]

  • OpenOffice Novell Edition
  • Gnumeric
  • Neo-Office 2.1
  • PalmOS (Dataviz)
  • WordPerfect 2007 (tulossa)

[muokkaa] Standardointi

[muokkaa] Ecma

Tietotekniikan ja elektroniikan standardeihin erikoistunut Ecma ilmoitti 8. joulukuuta 2005 luoneensa teknisen komitean 45 (TC45), jonka tehtävänä on laatia toimistosovelluksille virallinen standardi, joka on täysin yhteensopiva Microsoftin laatiman Office Open XML -mallin kanssa. Ehdotuksen tukijoita olivat Microsoftin lisäksi Apple, BP, British Library, Essilor, Intel, NextPage, Statoil ASA ja Toshiba.[4]

Ecma ilmoitti 6. joulukuuta 2006 hyväksyneensä Open XML:n standardiksi ECMA-376.[5]

[muokkaa] Ecman Fast Track -hakemus

Ecma toimitti Open XML:n ISO/IEC:lle sen oman ECMA-376:n valmistuttua. Ecma pyysi ISO/IEC:ltä hakemukseen nopeutettua eli ns. Fast Track -käsittelyä. Hakemuksen liitteiksi Ecma toimitti kaksi dokumenttia: perustelut nopeutetulle käsittelylle sekä Microsoftin Open XML:lle määräämät lisenssiehdot.

Nopeutushakemuksen käsittelyyn on varattu JTC1:ssä 30 päivää, jonka kuluessa ISO:n ja IEC:n jäsenet voivat ilmaista kantansa nopeutetun käsittelyn sallimiseksi. Maakohtainen äänestystystulos voi olla kyllä, ei, epävarma tai ei kantaa.

[muokkaa] SFS

Suomen Standardisoimisliitto SFS on standardisoinnin kansallinen keskusjärjestö. SFS:n jäseninä on elinkeinoelämän järjestöjä ja Suomen valtio.

Standardisoimisliitto on jäsenenä ISO:ssa ja eurooppalaisessa standardisoimisjärjestössä CENissä (European Committee for Standardization). Lisäksi SFS edustaa Suomea ISO/IEC JTC1 SC32:ssa, joka vastaa lopulta Open XML:n käsittelystä.[6]

[muokkaa] Suomen vastaus ISO/IEC:lle nopeutetun käsittelyn osalta

SFS reagoi Fast Track -pyyntöön äänestämällä tyhjää. Perusteluissa SFS toteaa, ettei siltä löydy tarvittavaa työryhmää, joka voisi perehtyä aiheeseen ja laatia päätöstä.

Kommenteissaan Suomen Standardisoimisliitto epäili, ettei millään muullakaan kansallisella organisaatiolla riitä resursseja Open XML:n läpikäymiselle. SFS:n mielestä Ecman hyväksyntäprosessi Open XML:lle ei ole voinut olla standardin laajuuteen ja vaativuuteen nähden tarpeeksi huolellinen.

Kommenteissaan SFS huomautti, että yli 6000-sivuinen standardiehdotus sisältää mm. kahden vektorigrafiikan (VML ja DrawingVML), matemaattisten yhtälöiden (OOMML), schema-mallien elinkaaren hallinnan (Markup Compatibility ML)[7] sekä sitaattilainausten tekniset määrittelyt.

SFS ehdotti vastauksessaan, että olisi parasta jos Open XML:lle ei myönnettäisi nopeutettua käsittelyä, vaan tilalle tuotaisiin jokin suppeampi ehdotus.

SFS kritisoi Microsoftin lisenssiehtoja, joissa avoimen lisenssin ulkopuolelle on suljettu kaikki teknologiat, joihin standardissa viitataan.

Vastaus alkuperäisestä PDF-muodosta sellaisenaan tekstiversioksi muunnettuna:[8]

From: Sirpa Sipola [Sirpa.Sipola@sfs.fi]
Sent: Friday, February 02, 2007 9:36 AM
To: lrajchel@ansi.org
Cc: gkholman@CraneSoftwrights.com; jtc1sc34@scc.ca; Anne-Mari Miikkala;
Antti Karppinen; Susanna Vahtila
Subject: Finnish vote on Fast Track ballot JTC1/N 8455 on Ecma Open
Office XML
Importance: High

** High Priority **

Dear Ms. Rajchel,

SFS is a "P"-member of JTC1 and wishes to vote

ABSTENTION

on the

ISO/IEC/JTC 1/ N 8455
"30 day Review for Fast Track Ballot ECMA-376 - ISO/IEC/DIS 29500 Office Open
XML File Formats".

Reason for abstaining: at the moment we don't have at SFS a relevant expert group
responsible for our national comments on the issue concerned.
However, please find attached some of the comments we have received concerning this
proposal, for your information and consideration.

The comments of Finland:

When considering the size, complexity and scope of the Ecma submission we must raise
some concerns about further procedure.

Considering the speed of the Ecma process, the rapidity of the Fast-Track process and the
length (over 6,000 pages) and complexity of the submitted specification, we have serious
doubts whether this or any other NSB can fulfill its obligations successfully to review this
specification and maintain the integrity of the process and the reputation of JTC1.

The specification contains within it complete specifications of two different vector
graphics languages (VML and DrawingML), a complete specification for the
representation of mathematical equations (OOMML), a complete specification for a
schema evolution language (Markup Compatability ML) and a complete bibliographic
citation language, in addition to others. We know from analogous standards produced by
the W3C, such as SVG and MathML, that the development and review of even a single
one of these sub-specifications would require an expert group 2-3 years. But Ecma, in a
process that did not receive much public visibility, produced a specification that includes
all of these, and their review and approval cycle took less than one year.

Therefore, we believe the best way forward is for Office Open XML to be removed from
the JTC1 Fast Track ballot process at this time, and either be submitted to a WG for more
through review, submitted in reasonably-sized subsections, e.g., 500 pages, for normal
approval, or (preferably) that Office Open XML be harmonized with the existing
ISO/IEC 26300 *Open Document Format*.

In addition the 'Licensing conditions that Microsoft offers for Office Open XML'
(seeJTC001-N-8455-3) explicitly exclude all items merely referenced from the licensing
commitment.

*To clarify, *Microsoft Necessary Claims* are those claims of Microsoft-owned or
Microsoft controlled patents that are necessary to implement only the required portions of
the Covered Specification that are described in detail and not merely referenced in such
Specification.*

Yours sincerely,

For Susanna Vahtila
Finnish Standards Association SFS

Sirpa Sipola
secretary
SFS

Suomen vastaus ja kommentit muiden maiden vastausten ohella löytyvät ISO/IEC JTC1:n SC32-sivustolta. ZIP-muotoisessa paketissa on myös Ecman vastine maakohtaisten vastausten kommenteille (tiedosto: J1N8530-22_Ecma Responses to Comments and Perceived Contradictions.pdf).[8]

[muokkaa] ISO/IEC

Open XML -standardihakemuksen käsittelystä vastaa 155:n maan yhteinen ISO (International Organization for Standardization)[9] sekä sähköalaan erikoistuneen IEC:n (International Electrotechnical Commission)[10] yhteiskomitea JTC1 (Joint Technical Committee 1). Open XML kuuluu JTC1:ssä tiedonhallinta- ja yhteensopivuusasioista vastaavalle alikomitealle 32 (Subcommittee 32 eli SC32).

Open XML:ää käsittelevän tahon nimi kokonaisuudessaan on siis International Organization for Standardization / International Electrotechnical Commission, Joint Technical Committee 1, Subcommittee 32, lyhennemuodossa ISO/IEC JTC1 SC32.[11]

Ali-alikomiteaan SC32:een kuuluu 23 kansallista äänioikeutettua jäsentä, näistä yhtenä Suomi. Tämän lisäksi SC32:n jäseninä on muita organisaatioita, joilla on oikeus osallistua SC32:n kokouksiin mutta ei äänioikeutta.[12]

[muokkaa] Standardin käsittely

JTC1:n sääntöjen mukaan standardi voidaan ottaa viiden kuukauden nopeutettuun käsittelyyn varsinaisen 30 päivän Fast Track -päätöksen tuloksesta huolimatta.

2. huhtikuuta 2007 Ecma tiedottikin, että standardin käsittely on siirtynyt ISO/IEC:ssä 5 kuukautta kestävään pika-arviointiin.[13]

Arviointikausi päättyy 2. syyskuuta 2007, johon mennessä eri maiden jäsenten on ilmoitettava kantansa standardin jatkokäsittelylle.

Maanantaina 20. elokuuta 2007 SFS:n keskustelutilaisuudessa mielipiteet aiheesta menivät ristiin, eikä konsensusta löydetty. Kokous päättikin, että Suomi äänestää jälleen tyhjää.

[muokkaa] Hylkääminen ja jatkokäsittely

Arviointikauden päätyttyä ISO/IEC DIS 29500 ei ollut saanut kansallisilta elimiltä riittävästi puoltavia ääniä, äänestystulos oli siis Disapproval. Ehdotusta ei hyväksytty ISO-standardiksi, vaan se menee jatkokäsittelyyn. Ns. Ballot Resolution Meeting, jossa eri maiden lähettämät kommentit käsitellään, järjestetään Genevessä helmikuun viimeisellä viikolla 2008.

[muokkaa] Äänestystulos

32:sta äänestäneestä P-jäsenmaasta 17 kannatti ehdotusta. Kannatus oli 53,12 %, kun hyväksymiseen vaadittaisiin vähintään 66,66 %.

Kaikista äänestäneistä 69:stä jäsenmaasta 18 vastusti ehdotusta. Vastustus oli 26.08 %, kun hyväksymiseen vaadittaisiin enintään 25%.

[muokkaa] Äänet maittain

Maa Jäsenyys Ääni
Argentina O-jäsen Abstention
Armenia O-jäsen Approval
Australia P-jäsen Abstention
Austria O-jäsen Approval with comments
Azerbaijan P-jäsen Approval
Bangladesh Approval
Barbados Approval
Belarus O-jäsen Approval
Belgium P-jäsen Abstention
Bosnia and Herzegovina Approval
Brazil O-jäsen Disapproval
Bulgaria O-jäsen Approval with comments
Canada P-jäsen Disapproval
Chile O-jäsen Abstention
China P-jäsen Disapproval
Colombia O-jäsen Approval with comments
Congo, The Democratic Republic of Approval
Costa Rica O-jäsen Approval
Côte-d'Ivoire P-jäsen Approval
Croatia O-jäsen Approval
Cuba O-jäsen Approval
Cyprus P-jäsen Approval
Czech Republic P-jäsen Disapproval
Denmark P-jäsen Disapproval
Ecuador P-jäsen Disapproval
Egypt O-jäsen Approval
Fiji Approval
Finland P-jäsen Abstention
France P-jäsen Disapproval
Germany P-jäsen Approval with comments
Ghana Approval with comments
Greece O-jäsen Approval with comments
India P-jäsen Disapproval
Iran, Islamic Republic of P-jäsen Disapproval
Ireland P-jäsen Disapproval
Israel O-jäsen Abstention
Italy P-jäsen Abstention
Jamaica P-jäsen Approval
Japan P-jäsen Disapproval
Jordan Approval with comments
Kazakhstan P-jäsen Approval
Kenya P-jäsen Approval with comments
Korea, Republic of P-jäsen Disapproval
Kuwait Approval
Lebanon P-jäsen Approval
Luxembourg O-jäsen Abstention
Malaysia P-jäsen Abstention
Malta P-jäsen Approval with comments
Mauritius Abstention
Mexico O-jäsen Abstention
Morocco O-jäsen Approval
Netherlands P-jäsen Abstention
New Zealand P-jäsen Disapproval
Nigeria Approval
Norway P-jäsen Disapproval
Pakistan P-jäsen Approval
Panama Approval
Peru O-jäsen Abstention
Philippines O-jäsen Disapproval
Poland O-jäsen Approval with comments
Portugal O-jäsen Approval with comments
Qatar Approval
Romania O-jäsen Approval
Russian Federation O-jäsen Approval
Saudi Arabia P-jäsen Approval
Serbia O-jäsen Approval
Singapore P-jäsen Approval with comments
Slovenia P-jäsen Abstention
South Africa P-jäsen Disapproval
Spain P-jäsen Abstention
Sri Lanka O-jäsen Approval
Switzerland P-jäsen Approval with comments
Syrian Arab Republic Approval
Tanzania, United Rep. of Approval
Thailand O-jäsen Disapproval
Trinidad and Tobago P-jäsen Abstention
Tunisia O-jäsen Approval with comments
Turkey P-jäsen Approval with comments
Ukraine O-jäsen Approval
United Arab Emirates Approval
United Kingdom P-jäsen Disapproval
Uruguay P-jäsen Approval with comments
USA Sihteeri Approval with comments
Uzbekistan Approval
Venezuela P-jäsen Approval with comments
Viet Nam O-jäsen Abstention
Zimbabwe Abstention

[muokkaa] Lähteet

  1. ^ ECMA-376
  2. ^ Open Document Format for Office Applications (OpenDocument) v1.0
  3. ^ Open XML Community: About Open XML
  4. ^ Ecma International creates TC45 to standardize Office Open XML File Formats
  5. ^ Ecma International approves Office Open XML standard
  6. ^ SFS - Mikä SFS on?
  7. ^ Open Packaging Conventions and Open XML Markup Compatibility
  8. ^ a b Maakohtaiset vastaukset Ecman hakemukseen nopeutetulle käsittelylle ISO/IEC JTC1 SC32:n sivustolta (ZIP, PDF)
  9. ^ ISO: Overview of the ISO system
  10. ^ International Electrotechnical Commission
  11. ^ ISO/IEC JTC1 SC32:n kotisivu
  12. ^ ISO/IEC JTC1 SC32:n äänivaltaiset jäsenet
  13. ^ ISO/IEC DIS 29500 (ECMA-376 Office Open XML of Ecma International) ballot starts for a period of 5 months

[muokkaa] Linkkejä

[muokkaa] Open XML -aiheen käsittely Suomessa

Henkilökohtaiset työkalut