Ausführliche Beschreibung des XML-Formats von MS Word

15. Januar 2005 von Wolfgang Sommergut

InformIT beschreibt in einer vierteiligen Serie (1 2 3 4) Microsofts proprietäres Dateiformat WorldML (das seit einiger Zeit WordprocessingML heißt, wohl um einen allgemeineren Anspruch anzumelden). Normalerweise muss man sich nicht durch das Unterholz dieses Dateiformats schlagen, wenn man nicht einen Filter oder eine andere Anwendung dafür schreiben will. Die Artikelserie vermittelt aber einen guten Eindruck davon, wie man XML einsetzen kann, um möglichst viele Vorteile eines offenen Standards zu eliminieren.

Der Output von Word sieht aus, als hätte man einen Obfuscator über eine XML-Datei laufen lassen. Die Elementnamen für Absatzformate bestehen zum Teil aus einem einzigen Buchstaben (zusätzlich zum ebenso langen Namespace „w“). Wären sie auf chinesisch, würde man genauso viel über ihre Bedeutung verstehen. Die Dokumentation von Microsoft scheint offenbar nicht auszureichen, um Entwicklern Aufschluss über das Dateiformat von Word und Excel zu geben.

Links:

Das XML-Format von MS Office: kostenlos, aber nicht offen
OASIS Open Office XML Format

Kategorie: XML Kommentare deaktiviert für Ausführliche Beschreibung des XML-Formats von MS Word

Kommentare sind geschlossen.