Auf der Suche nach der idealen URL

12. Juni 2008 von Wolfgang Sommergut

Mit der ersten Generation von Content-Management-Systemen und dynamisch erzeugten Web-Seiten tauchten immer mehr URLs auf, die zufällig generierte Zeichenketten enthielten und wenig über die Inhalte aussagten, auf die sie verwiesen. Die Zeiten solcher URLs, die sich menschliche Besucher einer Website nicht merken können, gehen dank Suchmaschinenoptimierung jedoch zu Ende – auch wenn einige Enterprise-CMS-Anbieter in dieser Hinsicht nicht viel dazugelernt haben (man betrachte etwa die Websites von Vignette oder Interwoven). Allerdings ist es beim Design einer Website mit sprechenden Dateinamen alleine nicht getan.

URLs auf vignette.com

Während man lange Zeit beim URL-Schema akzeptieren musste, was das CMS vorgab, bieten viele moderne Systeme die Möglichkeit, das Aussehen der URLs fast beliebig zu gestalten. In ihnen spiegelt sich in der Regel keine physikalische Verzeichnisstruktur mehr wider, sondern eine eigenständige Logik. Unter den Bedingungen des Web 2.0 ist es allerdings gar nicht so einfach, eine konsistente und plausible Systematik zu entwickeln. In einem Projekt auf Basis von Drupal, an dem ich seit einiger Zeit arbeite, war das URL-Schema für mich ein wesentlicher Aspekt beim Entwurf der Site-Struktur. Hier ein paar Entscheidungen, die ich dabei zu treffen hatte:

  • Wenn man Texte nicht starr einer Kategorie zuordnen, sondern mit Hilfe von mehreren Begriffen beschreiben möchte (Tagging), dann passt eine Struktur vom Typ http:meine-site.de/Installationspfad des CMS/Kategorie/dateiname.html nicht mehr (z.B. http://website.de/cms/sport/em-spielplan.html). Vorausgesetzt, das Tagging ist wie im Fall des Taxonomiemoduls von Drupal tief genug im System verankert, so kann man diese Metadaten an vielen Stellen des Systems nutzen, unter anderem auch bei der Komposition von URLs. Dann ließe sich jedes Schlagwort beispielsweise über ein eigenes Verzeichnis darstellen, also http://meine-site.de/tag1-tag2-tagX (also zum Beispiel http://meine-site.de/soziale-netze/facebook/opensource/dateiname.html). Da Tags im Gegensatz zu Verzeichnispfaden nicht hierarchisch organisiert sind, lassen sie sich nicht plausibel auf eine solche URL abbilden. Besser eignet sich dafür das Muster http://meine-site.de/tag1-tag2-tagX/dateiname.html, aber auch dieses hat unter Umständen unerwünschte Nebenwirkungen.
  • Die Verzeichnispfade in einer URL spielen eine wichtige Rolle, wenn man in einem Tool zur Web-Analyse die Statistik für bestimmte Kategorien ermitteln möchte, weil die Segmentierung nach Kategorien in der Regel über URLs erfolgt. Wenn Verzeichnisse aus aneinander gereihten Tags besteht, dann können diese sehr stark variieren. Selbst jene Texte, die mit den gleichen Schlagwörtern versehen wurden, finden sich dann in unterschiedlichen Verzeichnissen, wenn die Tags nicht immer in der gleichen Reihenfolge vergeben werden. Deshalb ist es hilfreich, wenn das CMS über die Bedieneroberfläche die Auswahl schon vergebener Tags unterstützt und dabei die Einhaltung des gleichen Abfolge von Schlagwörtern gewährleistet (wie das Modul Suggested Terms in Drupal).
  • Neuere Web-Projekte begnügen sich häufig nicht mehr mit herkömmlichen CMS-Publizieren, sondern umfassen neben Artikeln oder News auch Weblogs, Foren oder selbst definierte Content-Typen. Es bietet sich an, den Namen des Content-Typen in die URL aufzunehmen, wenn das CMS wie im Fall von Drupal dies zulässt. Es stellt sich jedoch die Frage, welchen Nutzen das bringt. Für den Besucher kann eine solche URL allerdings eine zusätzliche Orientierung bieten, wenn er beispielsweise aus ihr ersehen kann, dass es nicht mehr mit einem „offiziellen“ redaktionellen Beitrag zu tun hat, sondern mit einem Blog-Posting. Einige größere US-Sites verfahren so, indem sie für Blogs ein eigenes Verzeicnis oder eine Subdomäne einrichten. Der Content-Typ in der URL kann zudem bei der Web-Analyse zusätzliche Auswertungen ermöglichen.
  • Sprechende URLs enthalten die Kategorien oder Tags in den Verzeichnisnamen und den Titel des Beitrags als Dateiname. Das ist angenehm für Besucher und gut für die Bewertung durch Suchmaschinen, die Bindung an diese Informationen kann aber auch lästig sein. Das gilt besonders dann, wenn beim ersten Publizieren nicht ordentlich getaggt wurde oder sich die Überschrift des Textes später noch ändert. Allerdings wäre es in solchen Fällen nicht angebracht, die Änderungen auf die URL durchzuschreiben, weil dies zu toten Links führen könnte. Falls das CMS erlaubt, den Beitrag unter der alten und neuen URL zu erreichen, ist das unter SEO-Gesichtspunkten ungünstig. Ich habe mich dafür entschieden, dem Prinzip des Permalink zu folgen und grundsätzlich die erste erzeugte URL beizubehalten – auch wenn den Inhalt des Textes nicht mehr ganz widergibt.

Kategorie: Content-Management, Suchmaschinen 3 Kommentare »

3 Antworten zu “Auf der Suche nach der idealen URL”

  1. Wie ist das bei WP – sommergut.de/001408.shtml ist ja auch nicht so sprechend. Bei S9Y wird der Tital als Filename genommen.

    Gruss
    Bernd

  2. In der Tat sind die URLs dieses Weblogs nicht ideal :-) Das hat jedoch historische Gründe. Ich habe ursprünglich mit der Version 2.6 von Movable Type begonnen und die beherrschte noch keine sprechenden Dateinamen. Beim Umstieg auf WP sollten die Texte unter der gleichen Kennung erreichbar bleiben, eine Umleitung für hunderte Texte einzurichten schien mir zu aufwändig.

  3. S9Y ist da recht clever /412-irgendwas.html verweist immer auf den Artikel 412.

    Wird übrigens per apache .htaccess rewrite config erreicht, sollte also auch mit anderen Blogs gehen.