02.02.2012

Das Web 3.0 im Dienste der Wissenschaft


Das World Wide Web birgt unzählige Schätze – viele davon sind indes nicht leicht zu finden. Philippe Cudré-Mauroux, Professor am Departement für Informatik der Universität Freiburg, hat nun ein Klassifizierungssystem entwickelt, das die Suchresultate im Internet sowohl zuverlässiger und präziser wie auch vollständiger machen soll. Das Projekt mit dem Namen ScienceWISE basiert auf der Idee des Semantischen Web und hat den Preis für das beste Demo-System sowie der outrageous idea an der 10. International Semantic Web Conference (ISWC) in Bonn erhalten.


(Foto: Thinkstock)

Prof. Cudré-Mauroux und sein Team arbeiteten zusammen mit Physikern der EPFL und des CERN an der Umsetzung eines Suchsystems, das sich nicht nur auf Stichwörter beschränkt, sondern vielmehr den Inhalt eines im Web publizierten Artikels berücksichtigt. Das System basiert auf sogenannten Ontologien, d.h. semantischen Netzwerken mit logischen Relationen, die Datentabellen bilden. Innnerhalb eines solchen Schemas kann der User von einem Begriff zum nächsten navigieren und findet so die mit dem Initialbegriff verwandten Themen.

Herkömmliche Systeme, die auf der klassischen Suche mit Stichworten basieren, stossen an ihre Grenzen. So kann ein sich im Web befindender Artikel noch so treffend sein in Bezug auf eine Suche – solange er nicht exakt das in der Suchmaschine eingegebene Wort enthält, in einer anderen Sprache verfasst ist oder absichtlich Synonyme enthält, wird er nicht in der Resultateliste erscheinen. Eine grosse Anzahl an Referenzpublikationen risikiert damit in Vergessenheit zu geraten; das Suchresultat ist nicht komplett.

«Der Anstoss zu diesem Projekt kam von Alexey Boyarsky und Oleg Ruchayskiy, Physiker an der EPFL und am CERN. Den beiden Wissenschaftern wurde im Laufe ihrer Forschung deutlich, wie ineffizient die auf Stichwörtern basierenden Suchsysteme sind, um ein adäquates und umfassendes Resultat zu erhalten. Die Informatik hatte also ein ganz konkretes Problem aus der Praxis zu lösen», erklärt Prof. Cudré-Mauroux. In Zusammenarbeit mit der Site http://arXiv.org, dem weltweit grössten Online-Portal für Physik, haben Prof. Cudré-Mauroux und sein Forschungsteam eine Ontologie zum Schwarzen Loch entwickelt, welche die Effizienz ihres Systems belegt. So bietet das neue Suchsystem nicht nur die Möglichkeit, alle das Thema betreffenden Publikationen aus dem Web zu importieren, sondern ergänzt diese auf Wunsch mit einem Ranking, so dass die passendsten Treffer zuerst aufgeführt werden.

Ordnung im Wissenschafts-Web

Das Semantische Web setzt sich aus strukturierten Daten zusammen, welche durch den Computer automatisch verarbeitet werden können. Von gewissen Kreisen bereits als Web 3.0 bezeichnet, öffnen Entwicklungen wie das Projekt ScienceWISE neue Möglichkeiten, welche sowohl Daten wie auch Dienstleistungen zur Verfügung stellen, die frei benutzt und kombiniert werden können und zwar vom menschlichen User wie auch von automatisierten Programmen. Auf der Basis von Daten im RDF-Format übernehmen Algorithmen automatisch die Arbeit des Kodierens und sind gar in der Lage, neue Begriffe zu kreieren und ins Web zu stellen. Die Fachpersonen und User können diese im Anschluss daran verfeinern, indem sie die Publikationen tagen, die sie konsultieren und fehlende Begriffe hinzufügen. «ScienceWISE funktioniert bereits sehr gut und ist unter Physikern äusserst erfolgreich», so Cudré-Mauroux. «Wir möchten nun ein ähnliches System entwickeln, um Publikationen aus dem Bereich der Informatik zu klassifizieren. Unser Ziel ist es, eines der wichtigsten Systeme zur Organisation wissenschaftlicher Publikationen zu erschaffen.»

Das Projekt ScienceWISE wurde in Zusammenarbeit mit dem Labor für Informationssysteme unter Prof. Karl Aberer der EPFL und dem CERN entwickelt und vom Forschungspool der Universität Freiburg unterstützt. ScienceWISE wurde im Rahmen der 10. International Semantic Web Conference (ISWC) in Bonn, dem grössten internationalen Forum zum Semantischen Web, mit dem Preis für die beste Demo-Version und die outrageous idea ausgezeichnet.

Weitere Infos:
http://sciencewise.info
http://diuf.unifr.ch/xi/

Kontakt: Prof. Philippe Cudré-Mauroux, Departement für Informatik, 026 300 83 32, philippe.cudre-mauroux@unifr.ch