RDFa in eigener Website nutzen

w3c sm rdfa

Update 23.02.2011: Habe mich entschieden, das RDFa Plugin wieder zu entfernen, da sich der W3C Validator bei der HTML5 Validierung an den RDF Attributen stört.

Mein Blog läuft seit heute mit RDFa (Resource Description Framework in attributes). RDFa ist eine Empfehlung des W3C um Webdokumente mit Hilfe von Attributen mit Metadaten anzureichern. Im Sinne der Vision des Semantic Web, können Artikel damit mit Semantik, also mit Bedeutung aufgeladen werden, damit die Inhalte einer Webseite auch für Maschinen (z.B. semantische Suchmaschinen) verständlich werden.

Was lange nur in akademischen Kreisen durchdacht wurde, wird zurzeit Realität: Das Semantic Web ist im entstehen. Immer mehr Firmen konzentrieren sich auf die zu Grunde liegenden Technologien, wie RDF, RDFS, OWL, oder SPARQL um Wissensnetze und sogenannte Ontologien aufzubauen. Eine Ontologie definiert das Vokabular und die Konzepte sowie deren Bedeutung, die notwendig sind, um ein Wissensgebiet zu beschreiben (Daconta u. a. 2003, S.185).

Auch für WordPress gibt es schon einige Plugins, welche einem den Einstieg ins semantische Web erleichtern:

Tagaroo, Ontos Feeder und Zemanta verfolgen das gleiche Ziel, automatisch Entitäten (Dinge) im Artikel zu erkennen (z.B. Orte, Personen, Länder, etc.) und diese dann sogleich mit Seiten über weitergehende Informationen zu dieser Entität zu verlinken, z.B. mit Wikipedia.

WP-RDFa verfolgt einen etwas anderen Ansatz. Ich habe mich nun für WP-RDFa entschieden, da sich die anderen Plugins nicht mit meinem Syntaxhighlighter Plugin verstehen und das System auch etwas ausbremsen. Diese Erweiterung reichert die Blogposts mit Attributen aus dem Dublin Core und FOAF Namensraum an, um maschinenverständliche Metadaten zu erzeugen. Im Quellcode kann man das sehr schön daran erkennen, dass dem XHTML, bzw. in meinem Fall HTML5 neue Attribute wie „propery“, „content“, oder „resource“ hinzugefügt wurden.

RDFa arbeitet nach der Logik der Tripel, eine Ressourcenbeschreibung nach dem Schema Subjekt – Prädikat – Objekt, bspw. Darth Vader hat Sohn Luke. „Darth Vader“ ist das Subjekt, „hat Sohn“ ist das Prädikat und „Luke“ ist das Objekt. Alle 3 Elemente können durch Links repräsentiert werden.

Dies soll nur eine kleine Einführung sein. Ich werde in einem weiteren Post noch genauere Informationen über diese Technologien veröffentlichen.

Quellen:

Daconta, M.C., Obrst, L.J. & Smith, K.T., 2003. The Semantic Web: A Guide to the Future of XML, Web Services and Knowledge Management, Indianapolis, IN: Wiley.