Wie offen ist die Open Science?

Versuch einer Bestandsaufnahme

Open Science oder die Offene Wissenschaft will alle Informationsitems, die im wissenschaftlichen Arbeitsprozess anfallen, so unbehindert wie möglich zugänglich machen. IdealeOpen-Science-Workflows ermöglichen kollaboratives Arbeiten und Offenheit in der Phase der Projektformulierung, beim Entwurf des Untersuchungsdesigns sowie in den Labor- und Experimentalphasen. Ergebnisse aller Produktionsschritte wissenschaftlicher Information (von Projektentwürfen über Labordaten bis hin zur Publikation) sollen so zeitnah wie möglich in offenen Formaten entgeltfrei online bereitgestellt werden. Die genutzten Datenformate sollen Re-Analysen und Wiederverwendbarkeit ermöglichen, nicht-proprietär und maschinenlesbar sein und semantische Anreicherung erlauben.

Auch die Datenanalyse hat den Geboten der Transparenz und Überprüfbarkeit zu folgen: Alle Schritte der Datenbearbeitung und -verarbeitung sollen protokolliert und zugänglich gemacht werden. Gleiches gilt für die Diskussion und Interpretation der Auswertungsergebnisse, deren Dokumentation es nachzuvollziehen erlaubt, wie Ergebnisse und Erkenntnisse zustande kamen (man darf nie vergessen, dass wissenschaftliche Erkenntnisse auch soziale Produkte sind). Auch die Publikation, als Kondensat des Projektverlaufs von Beantragung bis Datenauswertung und -interpretation, wird im besten Fall in einem integrierten, aber offenen Workflowsystem abgewickelt. Die Publikation greift dabei interaktiv auf alle im Laufe des Forschungsprozesses angefallenen Informationsitems zurück: Diskussionen der Ergebnisse, Auswertungen, Rohdaten und Projektskizzen.

Der Autor Ulrich Herb ist Herausgeber des Sammelbandes "Open Initiatives: Offenheit in der digitalen Welt und Wissenschaft", der Artikel über Offenheitsinitiativen aus dem Bereich der wissenschaftlichen und nicht-wissenschaftlichen Informationen wie z.B. Open Data, Open Government, OpenStreetMap, WikiLeaks oder Anonymous bündelt. Der Band ist sowohl Open Access verfügbar als auch als Print-Version bestellbar.

Vertreter der Open Science fordern und fördern also mehr als den entgeltfreien Zugang zu den genannten Informationen, sie wünschen sich ein Ausmaß an Offenheit wissenschaftlicher Informationen, das den Ansprüchen der Open Definition gerecht wird. Diese versucht die Open-Source-Prinzipien auf Daten und Inhalte jedweder, also auch wissenschaftlicher Art anwendbar zu machen und unterscheidet analog zwischen der freien und offenen Verfügbarkeit von Informationen. Frei bezeichnet die kostenlose, entgeltfreie Nutzung, wohingegen offen restriktionsfreie Nutzung meint, die auch die Optionen der Weitergabe und Änderung der Informationen einschließt.

Offen nach Modell der Open Definition ist Wissen, das (entgelt)frei

  • benutzt (z.B. gelesen, analysiert)
  • weiterverwendet (z.B. neu ausgewertet, modifiziert und mit anderen Daten kombiniert)
  • weiterverteilt und kopiert, also zur Nutzung durch andere angeboten werden kann.

An die Nutzung der Daten und Informationen dürfen nur zwei Bedingungen geknüpft werden: Zum einen die Namensnennung der Urheber und zum anderen die Verwendung einer Share-Alike-Klausel. Die Verbreitung von Bearbeitungen oder abgeleiteten Werken darf bei Verwendung dieser Klausel nur unter den gleichen Bedingungen erfolgen, unter denen die Daten und Informationen ursprünglich verfügbar gemacht wurden. Nur wenige der zur Onlinebereitstellung von Informationen gebräuchlichen Lizenzen erfüllen die Vorgaben der Open Definition: von den weithin zur Lizenzierung von Texten genutzten Creative-Commons-Lizenzen etwa die CC-BY- und CC-BY-SA-Lizenz, im Bereich der Daten z.B. die CC0-Lizenz. Besonders hervorzuheben sind die weitergehenden Forderungen der Open Definition nach Zugänglichmachung in einer technisch leicht zu handhabenden und veränderbaren Form, Ziel ist die Verwendung offener Dateiformate. Ebenso bemerkenswert erscheint die Vorgabe, Informationen nicht unter Nutzungsbedingungen zu stellen, die bestimmte Nutzungsszenarien verbieten: Kommerzielle oder militärische Nutzung müssen beispielsweise möglich sein.

Versteht man Open Science als Klammer oder Workflow-Prinzip, in dem andere Teilbereichen der Wissenschaftskommunikation verbunden werden, so lässt sich konstatieren, dass in diesen Teilbereichen ebenfalls mehr oder weniger ausformulierte Konzepte für mehr Offenheit existieren. Am prominentesten ist sicher der Bereich wissenschaftlicher Textpublikationen, in dem durch die Budapester Open Access Initiative und vor allem die Berliner Erklärung über offenen Zugang zu wissenschaftlichem Wissen etablierte Forderungen nach offenem Zugang zu wissenschaftlichen Publikationen bestehen.

Open Access kennt, das sei voraus geschickt, zwei Varianten (Die Farbenlehre des Open Access). Green Road Open Access bezeichnet das Veröffentlichen von wissenschaftlichen Texten, die bereits formal in einem regulären Verlagsangebot erschienen sind (sogenannte Postprints) oder deren Vorabversionen (Preprints) auf Open-Access-Servern (oder Repositories). Golden Road Open Access bezeichnet die Herausgabe wissenschaftlicher Open-Access-Journale bzw. das Publizieren in solchen Zeitschriften oder das Publizieren anderer Dokumentarten wie etwa Monografien in einem Open-Access-Verlag. Der Goldene Weg produziert originäre Publikationen, also Born Open Access Documents.

Bei Dokumenten des grünen Open Access haben Autoren meist exklusive Nutzungsrechte an einen Verlag übertragen und können ihre Texte daher nur aus Kulanz des Verlags zusätzlich auf einem Repository ablegen, oder sie können dies tun, weil sie im Publikationsvertrag dem Verlag vorab nur einfache Nutzungsrechte übertrugen. Faktisch stehen die wissenschaftlichen Dokumente auf Repositories nur zu verschwindend geringem Anteil unter einer Lizenz, die den Ansprüchen der Open Definition gerecht wird. Daher sind diese Texte einer offenen Verwendung entzogen, die z.B. die Erlaubnis, abgeleitete Werke wie Übersetzungen oder Aktualisierungen zu erstellen, die Texte zu re-mixen oder einem Text-Mining zu unterziehen, umfassen würde.

Beim Golden Road Modus ist es wahrscheinlicher, dass Texte unter Lizenzen, die zur Open Definition kompatibel sind, publiziert werden. So stellen die renommierten Open-Access-Verlage BioMed Central und Public Library of Science ihre Veröffentlichungen unter entsprechende Creative Commons Lizenzen. Allerdings bilden diese beiden Flaggschiffe des Open Access damit eine Ausnahme. Eine von Ross Mounce initiierte und zusammen mit anderen Mitgliedern der Open Science Working Group der Open Knowledge Foundation erstellte Liste über die Lizenzbedingungen von Open-Access-Journalen und -Verlagen ergibt ein wenig erfreuliches Bild: Nur ca. 5% der aufgeführten Verlage stellen ihre Publikationen unter Bedingungen bereit, die mit der Open Definition in Einklang stehen.

Im Bereich des Open Access zu Forschungsdaten sind zusätzlich zu national unterschiedlichen urheberrechtlichen Regelungen zum Umgang mit Daten auch differierende Vorstellungen von offener Verwendung prägend. Diese reichen bis zur Forderung nach Freilassung der Daten in die Public Domain, allerdings ist diese Position einigermaßen umstritten. Daten sind mehr oder weniger der Quell-Code oder der Rohstoff wissenschaftlicher Publikationen , ihn aus der Hand zu geben und anderen zur offenen Weiterverwendung zu überlassen, kostet viele Wissenschaftler große Überwindung. Denn der größte der Anreiz, die Zitation der Daten unter Nennung ihres Erhebers resp. Urhebers als Quelle wissenschaftlicher Anerkennung, entfällt wenn diese sich in der Public Domain befinden.

Abseits dieser Problematik entfalten sich allerdings ansehnliche Angebote im Bereich des offenen Zugangs zu Forschungsdaten, z.B. in den beiden Open-Access-Daten-Repositories PANGEA (aus den Geo- und Umweltwissenschaften) und DRYAD (Biowissenschaften). Diese stellen Forschungsdaten zitierfähig und im Open Access bereit - meist unter CC-BY- oder CC0-Lizenzen. Ähnlich verfährt das Daten-Journal Earth System Science Data, das die qualitätsgesicherte Dokumentation und Publikation von geowissenschaftlichen Forschungsdaten zum Ziel hat. ESSD nutzt eine zweistufige Peer Review inkl. Open Review, um einen Datensatz und dessen Dokumentation zu begutachten und zu veröffentlichen.

Open Review, sprich die offene Begutachtung, findet allerdings vor allem im Bereich der Textpublikationen Anwendung. So wenig definiert Begriff und Verfahren sind und so unterschiedlich die Ausformungen der Open Review erscheinen: Gemein ist es ihnen den Begutachtungsprozess wissenschaftlicher Publikationen transparent zu gestalten um Verzerrungen, Vorteilsnahme, Machtspiele unter konkurrierenden Wissenschaftlern und Manipulation zu verhindern.

Die Herausgeber des Journal Atmospheric Chemistry and Physics (ACP) setzen Open Review höchst erfolgreich ein und benennen zahlreiche weitere Vorzüge der offenen Begutachtungen gegenüber dem klassischen Peer Review, bei dem die Gutachter anonym bleiben. Unter anderem spricht eine verbesserte Qualitätssicherung für die Open Review: Da bei ACP bereits die Einreichungen und nicht erst die akzeptierten Artikel für jedermann sichtbar gemacht werden, steigt die Qualität der Einreichungen - schließlich will kein Wissenschaftler eben mal ein mittelmäßiges oder gar minderwertiges Paper testweise in einem solchen Journal einreichen und damit für die gesamte Community sichtbar machen. Zudem werden die Kommentare der Gutachter auch zum Teil der wissenschaftlichen Erörterung und darin reflektiert. Die offene Zugänglichkeit der Kommentare bewirkt weitere Effizienz der Begutachtung und vermeidet Mehrfacharbeit.

Auch das wikibasierte Projekt GuttenPlag, bei dem Nutzer im Text der Dissertation Karl-Theodor zu Guttenbergs nicht als Zitat ausgewiesene, aber aus anderen Arbeiten übernommene Textpassagen dokumentierten, stellte eine Art Collaborative Review dar - wenn auch ex post, also nach der Publikation und ohne dass der Volltext zur Verfügung stand. Zudem dürfte in diesem Fall der Review in erster Linie im Füttern von Suchmaschinen mit verdächtigen Passagen aus zu Guttenbergs Text bestanden haben und weniger in einer qualitativen Prüfung. Auch Open Access darf daher wohl für sich beanspruchen, Plagiarismus stärker entgegen zu wirken als Closed Access: Dokumente, die online frei zur Verfügung stehen, können leicht gegen plagiatsverdächtige Texte geprüft werden und auch selbst einfach auf Plagiatsverdacht untersucht werden.

Es werden aber nicht nur offene Verfahren der Qualitätssicherung durch Open Review diskutiert, die Community erprobt auch offene Verfahren der Qualitätsmessung, die den umstrittenen Journal Impact Factor (JIF) ergänzen oder relativieren sollen. Diese Metriken können zum Beispiel auf Nutzungsdaten und -mustern wissenschaftlicher Dokumente oder auf einen offen zugänglichen Corpus an Zitationsdaten basieren, auf die verschiedene Algorithmen (vergleichbar dem Google Page Rank) angewandt und evaluiert werden.

Neben dem erwähnten JIF und dem Hirsch-Index (h-Index) als personenbezogenem Zitationswert existieren auch verschiedene neuartige zitationsbasierte Impact-Maße, deren Scores, anders als beim JIF der Fall, entgeltfrei einsehbar sind. Der Service Eigenfactor.org, der Daten des JIF-Produzenten Thomson Scientific auswertet, ist zwar entgeltfrei nutzbar, bietet aber keinen Datenabzug zum Download an. Ebenfalls entgeltfrei nutzbar, ohne die Daten offenzulegen, ist die Wissenschaftssuchmaschine Google Scholar, die eine Zitationszählung wissenschaftlicher Dokumente, Wissenschaftlerprofile und mittlerweile mit Google Scholar Metrics sogar ein eigenes Journal-Ranking anbietet. Ebenso können die Informationen der zitationsbasierten Impact-Maße SCImago Journal Rank (SJR) und Source-Normalized Impact per Paper (SNIP) online entgeltfrei genutzt werden - und das obwohl beide Verfahren Daten der kostenpflichtigen Datenbank Scopus des Thomson-Konkurrenten Elsevier nutzen.

Trotzdem muss betont werden, dass keiner der Services die Rohdaten oder die Datenmatrix zur Berechnung der Scores zu Verfügung stellt, sondern im besten Fall Tabellen, die zum Beispiel Angaben zum Journal, Zeitraum, Fach, Score und ähnliche Informationen beinhalten: Für SNIP und SJR stehen solche Informationen zum entgeltfreien Download bereit. Im Kontext der Open Metrics müssen auch gänzlich neue Verfahren der Impact-Messung, die sich hinter dem Begriff der Altmetrics verbergen und die unter anderem den Widerhall und die Wirkung wissenschaftlicher Informationen in Web 2.0-Services wie Twitter, Blogs, wissenschaftlichen Social Networks und anderen Datensammlungen zur Impactbestimmung nutzen wollen, genannt werden, wie z.B. ScienceCard oder Total Impact.

Soweit die Diskussionen um die Offene Wissenschaft auch reichen, gänzlich offen im Sinne der eingangs erwähnten Open Definition ist sie nicht strukturiert - und leider, bei allem Bemühen, auch nicht offen im Sinne einer Zugänglichkeit. Nach wie vor ist der Anteil der aus der sozialen Unterschicht stammenden Wissenschaftler äußerst gering und er verringert sich, je höher der wissenschaftliche Status ist. Ebenso sind Frauen beim Zugang zu gehobenen wissenschaftlichen Positionen signifikant benachteiligt und auch was die Partizipation der Bürger an der offenen Wissenschaft angeht, könnte ein Mehr an Offenheit diskutiert werden.

Die Open-Science-Diskussion konzentriert sich bislang stark auf Überprüfbarkeit wissenschaftlicher Ergebnisse und Effizienzsteigerung der Forschung. Ihre Offenheit, die intern produzierte Ergebnisse nach außen bereit stellt, ist damit gewissermaßen einseitig und wenig partizipativ: Citizen-Science- Vorhaben wie Galaxy Zoo, in dem jeder interessierte Laie Galaxien klassifizieren und einen Beitrag zum wissenschaftlichen Fortschritt leisten konnte, stehen bisher recht unverbunden zur Open Science.

Aus Perspektive zweier Granden der Sozialwissenschaft geben die neue Offenheit und die Frage nach der zivilgesellschaftlichen Beteiligung an Wissenschaft dennoch Anlass zur Hoffnung und stellen weitreichende Veränderungen in Aussicht. Während die Citizen Science mit Jürgen Habermas‘ Vorstellung der partizipativen Demokratie, der zufolge intensive Beteiligung und umfassende Informiertheit praktische Demokratie ermöglicht, korrespondiert, wirken Niklas Luhmanns Ansichten über die Auswirkungen der Computerkommunikation nahezu prophetisch: Luhmann sagte einen Bedeutungsverlust der Experten durch das Aufkommen der Computerkommunikation vorher.

Was für Mediziner, Politiker, Musikproduzenten und Journalisten angesichts der Angebote des World Wide Web augenfällig ist, trifft auch auf die Wissenschaft zu: Die Begutachtung wissenschaftlicher Ideen und Konzepte erfolgt online, interaktiv und in manchen Open-Review -Szenarien für jedermann offen, wissenschaftliche Ergebnisse können (entsprechende Kenntnisse und Ressourcen vorausgesetzt) von jedermann überprüft werden. Auch die Bewertung der wissenschaftlichen Wirkung einer Publikation oder einer Datenerhebung könnte über die Auswertung von Twitterfeeds und anderen offenen Social-Media-Angeboten erfolgen. Zumindest erlaubt die Berücksichtigung solcher moderner Impact-Konzepte eine wesentlich facettentreichere Wahrnehmung wissenschaftlicher Relevanz als die eindimensionale Auswertung von Zitationen.

Besonders beim Rezeptionsverhalten wird die Expertenrolle der Wissenschaftler in ihrer Rolle als Herausgeber und Reviewer relativiert: Warum soll ich mich noch darauf verlassen, dass fremde Editors und Gutachter wissen, was wichtig und relevant für mich ist, wenn ich doch die Empfehlungen von Kollegen, denen ich unmittelbar fachlich vertraue, via Twitter oder Blogs verfolgen kann? Zumal diese Empfehlungen auch Informationen außerhalb der kanonischen wissenschaftlichen Publikationstypen, wie etwa Journals, umfassen und daher wesentlich reichhaltiger sein dürften als althergebrachte Wissenschaftsmedien.

Kommentare lesen (16 Beiträge)
Anzeige