Udvekslingsformat for dokumenter

LibreOffice 3.5 kommer på gaden om ganske få dage. En af de nye features i denne version, er en helt ny motor til håndtering af docx-filer. Hvor import og eksport af docx (og for rtf) tidligere var mere eller mindre hardcoded, er der nu tale om en mapper til interfacet. På den korte bane betyder det at import og eksport foregår noget hurtigere, og på den lange bane, at det er mindre besværligt (for udviklerne) at vedligeholde de enkelte dele. Hvis der viser sig en fejl i oversættelsen, skal udvikleren ikke ind og finde det i koden, men kan se i mapperen hvordan de to XML-skemaer er hægtet op mod hinanden. Hvis der er en funktion eller feature i docx som endnu ikke understøttes af LibreOffice, kan den tilsvarende import/eksport oprettes i mapperen når det bliver relevant. Vi kan sammenligne det med en telefonbog, hvor de enkelte detaljer kan vedligeholdes, justeres og tilføjes, uden at det skal ændres direkte i programkoden.

Jeg vil lige indskyde at dette indlæg ikke er ment som indlæg i debatten om dokumentformater og åbne standarder. Det er alene ment som vurdering af de faktiske forhold omkring versionerne af LibreOffice.

I forbindelse med disse ændringer kom jeg til at genoverveje den anbefaling til valg af “udvekslingsformat”, som jeg hidtil har givet. Indtil nu er min erfaring, at det bedste format til udveksling af redigerbare dokumenter mellem Microsoft Office og LibreOffice, er det gamle proprietære .doc-format. Jeg ved at det er “politisk ukorrekt” da netop dette format ikke er i nærheden af at være en åben standard, men det har nu engang været det format de fleste brugte, og det var det format som bedst kunne bygge bro mellem LibreOffice og Microsoft Office.

Dokumenter som ikke forventes at skulle redigeres af modtageren bør fortsat altid fremsendes i PDF eller PDF/A format.

I mellemtiden er der sket flere forskellige ting: Flere har opgraderet deres Office 2003 til enten 2007 eller 2010. Og så har Microsoft sat en prop i deres 2010 version, som gør at .doc filer fra LibreOffice nu pludselig er “defekte”. Jeg har adskillige eksempler som uden videre kan åbnes med Word 2003, Wordviewer og andre programmer, men som Office 2010 altså nægter at åbne. Øv, men sådan er det altså.

Jeg satte mig for at gennemføre en struktureret test. Testen tager først og fremmest udgangspunkt i de funktioner, som for år tilbage blev fastlagt i det såkaldte funktionalitetsloft. Derudover involverer testen en række konkrete dokumenter fra virkeligheden.

Testen er foregået ved at et dokument er skrevet med LibreOffice 3.4.2 på Linux med de funktioner vi ønsker at teste. Herefter er dokumentet gemt som odt-dokument. Efterfølgende er dokumentet eksporteret til henholdvis doc og docx – fortsat med LibreOffice 3.4.2.
Det oprindelige odt-dokument er efterfølgende indlæst i LibreOffice 3.5 RC3 og igen eksporteret til både doc og docx.

I denne omgang har jeg afgrænset teste til alene at kigge på tekstdokumenter, og kun fra LibreOffice til Microsoft Office 2010.

Resultater fra testen

Det generelle indtryk er at layoutmæssigt er .docx bedre end .doc. F.eks. er tabeller justeret korrekt til margin i både højre og venstre side.

Jeg vil ikke komme yderligere ind på det generelle layout, idet stort set alle de generelle layoutformater fungerer 100% korrekt.

Billeder

Placering af billeder (f.eks. logo) er bedre og mere nøjagtig end med .doc. Der er dog fortsat problemer med ombrydning af tekst samt forankring. Årsagen er at de to dokumentformater er “tænkt” forskelligt, og oversættelse mellem de to formater derfor også kommer til at blive den “mindst dårlige” løsning.

Tekstboks/ramme

Rammer der oprettes i LibreOffice konverteres tilsyneladende til “ingenting”, når der gemmes i docx-format. Rammens indhold placeres simpelthen efter det tekstafsnit hvor rammen blev indsat. Hele ideen med rammer og tekstbokse forsvinder.

Indlejrede OLE-objekter

Virker ikke:

  • Excel regneark
  • Calc regneark
  • Draw tegninger

Kommentarer

Kommentarfunktionen fungerer fint begge veje.

Ændringshåndtering

Registrering af ændringer fungerer begge veje, hvilket er et stort fremskridt i forhold til tidligere, hvor ændringshåndtering var upålidelig.

Indholdsfortegnelse

Fungerer fint. Det er en god idè at opdatere indholdsfortegnelsen efter du har indlæst den i Word. Jeg har nemlig konstateret, at enkelte korte linjer helt “mister” tabuleringen, hvilket afhjælpes ved at opdatere.

Felter

Sidetal og sideantal fungerer fint. Det gælder også hvis du nulstiller sidetallet. Visse andre felttyper fungerer også fint, men for visse felttyper vises “Feltnavnet = værdien”.

Krydshenvisninger

Krydshenvisninger fungerer kun delvist. Umiddelbart vises “koden” i Word, og en opdatering af feltet vil i nogle tilfælde give det korrekte resultat. Sidetal vil normalt blive vist korrekt, men hvor du normalt vil forvente at f.eks. overskriftens tekst vises, fungerer det ikke.

Konklusion

Konklusionen må være at spørgsmålet er nøjagtig lige så kompliceret at svare på som det altid har været. LibreOffice 3.5 løser ikke problemerne.

Med mindre du arbejder med meget komplicerede dokumenter, vil du opleve at docx-formatet fremover vil give dig det pæneste resultat, men bruger du de mere avancerede funktioner, f.eks. indlejrede objekter, krydshenvisninger og indtastningsfelter skal du nok overveje fortsat at bruge det gamle doc-format. Positivt er det at ændringshåndtering nu fungerer.

Om leif

Leif Lodahl Leif er certificeret PRINCE2 projektleder og har mange års erfaring inden for dette felt. Desuden er det Leif, der styrer aktiviteterne omkring LibreOffice (tidligere OpenOffice.org), og det er her Leif er på hjemmebane. På dette felt har Leif erfaring med både rådgivning, konsulentarbejde og undervisning. Leif Lodahl er manden, der står i spidsen for Libreoffice i Danmark, og han er en hyppig deltager i debatten omkring LibreOffice og open source.
Dette indlæg blev udgivet i Kontorblokken og tagget , , . Bogmærk permalinket.

En Kommentar til Udvekslingsformat for dokumenter

  1. Omkring det med de statiske PDF’er og udveksling af dokumenter mhp. redigering kan det sikkert have interesse for nogle at læse Simon Phipps’ artikel om hybride PDF-filer.

Skriv en kommentar