Menü

Kampf um die Deutungshoheit im Web: Schema.org vs. Linked Data

vorlesen Drucken Kommentare lesen 32 Beiträge

Im Web ist nach Ansicht von Experten ein Kampf um die Metasprachen entbrannt, mit denen Inhalte maschinenlesbar gemacht und für die Bots von Suchmaschinen markiert werden. Auf der einen Seite steht demnach das auf den Web-Erfinder Tim Berners-Lee zurückgehende Konzept der Linked Open Data, das ein Verweissystem für frei verfügbare Daten über Uniform Resource Identifier (URI) etablieren will. Google, Microsoft und Yahoo haben dem Mitte 2011 ihre eigene Spezifikation schema.org entgegengestellt

Die "versteckte Agenda" hinter diesem Vorstoß sei es, "die Bedeutungs- und Ausdrucksweise des Webs kontrollieren", warnte Stefan Gradmann, Direktor der Universitätsbibliothek der Katholischen Universität Leuven, am Freitag auf einer Tagung der von Google unterstützten Denkfabrik Collaboratory in Berlin. Sprache und Ausdrucksmittel in dem Hypertextmedium würden damit in "monopolistisches Eigentum" umgewandelt.

Web-Metasprachen legen dem studierten Philosophen zufolge letztlich fest, was im WWW "gesagt werden kann und welche Aussagen registriert werden". Sie könnten so auch zur Zensur missbraucht werden. Die im Fall schema.org vereint vorgehenden Internetnavigatoren setzten dabei an der "Leitwährung Aufmerksamkeit" an und sorgten selbst für die Durchsetzung ihrer Deutungsstrukturen. So listeten sie Webinhalte, die mit schema.org ausgezeichnet seien, automatisch höher in den Suchergebnissen. Googles Wissensdatenbank Knowledge Graph baue zudem auf schema.org-markiertem Content auf. Alternative Standards gerieten damit faktisch ins Hintertreffen.

Zu denen gehört das vom World Wide Web Consortium (W3C) entwickelte System Linked Data. Es setzt auf das Resource Description Framework (RDF) als eine Art Grammatik und damit verknüpfte Standards zur Abfrage von Inhalten wie SPARQL. Damit ließen sich Elemente wie Klassen, Eigenschaften oder Werte und darauf basierende Hierarchien erstellen und logische Operationen über eine riesige Menge einfach formalisierter Aussagen ausführen, sagte Gardmann. Der W3C-Vorsitzende Tim Bernes-Lee unterstützt Linked Data gemäß seinem Motto, dass im Web technisch gesehen "jeder alles über alles sagen kann".

Gradmann zufolge hat Linked Data jedoch aufgrund dieser Offenheit ein Qualitätsproblem. Wenn jeder alles über jeden sagen könne, komme es zu vielen miteinander in Konflikt stehenden Aussagen und Redundanzen. So gebe es allein für Personenaussagen bereits rund 480 eigene Ontologien. Diese enthielten viele Konzepte, die wild gewachsen und nicht miteinander verbunden seien. Es sei schließlich nicht immer klar, was jemand mit der Herstellung einer Verbindung von Inhalten über einen Link sagen wolle.

Demgegenüber verfüge schema.org über ein voll kontrollierbares Kernvokabular mit genauso streng überwachten Erweiterungen, konstatierte Gradmann. Vermutlich sei es deswegen auch in der Content- und Medienindustrie so beliebt. Den Suchmaschinen gelinge es damit, die Nutzer länger in ihrem Umfeld zu halten und andere Wege zum Erschließen von Wissen zu verbauen. Dem W3C selbst falle es schwer, auf dieses Problem hinzuweisen, da Google, Microsoft und Yahoo in dem Standardisierungsgremium zu den wichtigsten Mitgliedern zählten.

"Es gibt längst Institutionen, die über neue Kontextualisierungen und damit über unsere Weltbilder bestimmen", sorgte sich auch Verena Metze-Mangold, Vizepräsidentin der deutschen Unesco-Kommission. Es seien semantische Codes, die Kontexte herstellten oder entsprechende Verknüpfungen verböten. (je)