W3C verabschiedet eine Reihe von XML-Standards
10. Februar 2004 von Wolfgang SommergutDas W3-Consortium hat in den letzten Tagen gleich mehrere XML-bezogene Empfehlungen verabschiedet. Dazu zählen die Version 1.1 von XML, XML 1.0 dritte Ausgabe, das XML Infoset zweite Ausgabe, VoiceXML, ebenfalls zweite Ausgabe, und zwei Technologien für das Semantic Web, RDF und OWL. Ganz unumstritten sind die Spezifikationen indes aber nicht. Vor allem das Update des XML-Kernstandards sorgte schon bei der Präsentation des ersten Entwurfs für einige Kritik.
Besonders Elliotte „Rusty“ Harold gab zwei klare Ratschläge zu XML 1.1 ab:
Everything you need to know about XML 1.1 can be summed up in two rules:
- Don’t use it.
- (For experts only) If you speak Mongolian, Yi, Cambodian, Amharic, Dhivehi, Burmese or a very few other languages and you want to write your markup (not your text but your markup) in these languages, then you can set the version attribute of the XML declaration to 1.1. Otherwise, refer to rule 1.
Eine der wesentlichsten Änderungen der neuen Version ist die Einführung des „NEL“-Zeichens als gültiges Whitespace Character. Dieses hat den Wert #x85 und dient auf IBM-Mainframes als Zeilenvorschub. Wenn ein Dokument ein solches Zeichen als Whitespace enthält (also etwa zwischen Elementbezeichnern), dann ist es nach XML 1.0 nicht gültig. Damit begründen die W3C Autoren das Hochzählen der Versionsnummer trotz der insgesamt geringfügigen Änderungen:
A new XML version, rather than a set of errata to XML 1.0, is being created because the changes affect the definition of well-formed documents. XML 1.0 processors must continue to reject documents that contain new characters in XML names, new line-end conventions, and references to control characters. The distinction between XML 1.0 and XML 1.1 documents is indicated by the version number information in the XML declaration at the start of each document.
Lästige Kosequenz des Updates könnte sein, dass Verfasser von Dokumenten in der XML-Deklaration die Version 1.1 angeben, obwohl sie deren Neuerungen gar nicht in Anspruch nehmen. Die Masse der installierten 1.0-Parser würden ihre Verabeitung dennoch ablehnen.
Semantic Web kommt in die Gänge
Nach der kürzlichen Verabschiedung von CC/PP waren nun zwei Basisstandards für das Semantic Web an der Reihe. Es handelt sich dabei um das Resource Description Framework (RDF) und die Web Ontology Language (OWL). Ihr Zweck besteht darin, Informationen durch beschreibende Daten eine klare Bedeutung zu verleihen und sie auf diese Weise besser durch Maschinen verarbeitbar zu machen. Neben dem interaktiven Gebrauch durch Menschen soll das Sematic Web dadurch als riesiger Datenbestand besser für Computerprogramme zugänglich sein.
Das Gremium hatte „RDF Model and Syntax“ bereits 1999 als Empfehlung verabschiedet, „RDF Schema“ erreichte bereits 2000 den Status einer Candidate Recommendation. Die nun freigegebene Version RDF trägt den Zusatz „revised“ und wurde nach zahlreichen Einwänden weitgehend überarbeitet. Die neue Empfehlung besteht aus sechs Dokumenten, einer Einführung („Primer„), Concepts, Syntax, Semantics, Vocabulary und Test Cases.
Die OWL baut auf RDF auf und soll genutzt werden, um die Bedeutung eines Ausdrucks explizit zu beschreiben. Diese Darstellung von Inhalten und deren Beziehung untereinander wird als Ontologie bezeichnet. OWL bietet in dieser Hinsicht bessere Mittel als XML oder RDF alleine.
Siehe dazu meinen Beitrag auf Computerwoche Online.
Kategorie: XML Kommentare deaktiviert für W3C verabschiedet eine Reihe von XML-Standards