zurück zum Artikel

Friede, Freude und freie Eierkuchen-Rezepte, Teil 2

Wissen | Hintergrund

Unsere dreiteilige Serie spürt den freien Inhalten im Netz hinterher – von Unterhaltung und Bildung über Forschung und Lehre bis zu Strickmustern und Fotosammlungen. Im zweiten Teil geht es um freie Daten und wissenschaftliche Veröffentlichungen, Sp

Unsere dreiteilige Serie spürt den freien Inhalten im Netz hinterher – von Unterhaltung und Bildung über Forschung und Lehre bis zu Strickmustern und Fotosammlungen. Im zweiten Teil geht es um wissenschaftliche Aufsätze und freie Daten, um Sprachkurse und Lehrmaterial.

Teil 1: Freie Musik, Filme und Bücher [1]
Teil 2: Freie Forschung und Lehre
Teil 3: Hobby und Kultur [2]

Just dieser Tage hat sich der Bundesrat gegen die Unterstützung von Open Access [3] als wissenschaftliche Publikationsform ausgesprochen, schließlich habe sich das wissenschaftliche Verlagswesen doch bewährt. Natürlich, funktionieren tut es, und viele Wissenschaftler publizieren ihre Fachaufsätze und Monographien bei den etablierten Wissenschaftsverlagen. Aber muss das in Zeiten der weltweiten Vernetzung so sein, und muss es zu den derzeitigen Preisen sein, unter denen die Bibliotheken nicht nur in Deutschland ächzen?

Jeder, der aus dem Internet die Unmengen von Howtos und Texte insbesondere über Computertechnik gewöhnt ist, kann da nur den Kopf schütteln und sich fragen: "Wieso nicht in Selbstorganisation begutachten und einfach im Internet publizieren?" Die Antwort: Die Zitierindices, die bislang nur auf Papier Gedrucktes erfassen, sind zu wichtig für das Renommee und damit die Finanzierung der Forschung, als dass sich ein Wissenschaftler ohne weiteres außerhalb dieses Systems stellen könnte. Trotzdem versuchen verschiedene Initiativen, den Weg der freien Internet-Publikation mit Rücksichtnahme auf den Citation Index zu gehen.

Ganz allgemein ist die Informationslage im Internet für Informatik und Mathematik geradezu paradiesisch anzusehen – verglichen mit Geistes- und Sozialwissenschaften. Praktisch jeder kennt CiteSeer [4] als zentrale Suchmaschine für Fachaufsätze der Informatik. Auch Computerbuchverlage sind weniger zurückhaltend, ihre Publikationen online zugänglich zu machen – O'Reilly beispielsweise arbeitet mit dem Creative-Commons-Projekt zusammen, um langfristig auslaufende Bücher unter Creative Commons (CC) [5] online verfügbar zu machen.

Bild 1 [364 x 65 Pixel @ 12,5 KB]
Citeseer: Informatik-Suchmaschine

Zwei wichtige Initiativen gibt es zur Zeit, wissenschaftliches Publizieren nach einem Open-Source-Modell zu gestalten. Die Open Access Iniative ist dabei, kurz gesagt, für den Inhalt und die Open Archives Iniative für die Form der Daten zuständig.

Die Budapest Open Access Initiative [6] hat sich zum Ziel gesetzt, wissenschaftliche Publikationen für den Leser frei zugänglich, druckbar, kopierbar und verteilbar zu machen. Entscheidend dabei ist, dass Wissenschaftler nicht die Urheberrechte am Aufsatz aufgeben oder ab sofort wild plagiiert werden können, sondern dass der Zugriff auf wissenschaftliche Publikationen erleichtert wird. Natürlich entbindet das keinen Studenten vom sauberen Zitieren und der Nennung der Quelle als Grundlage für wissenschaftliches Arbeiten – aber mit Open Access ist es zum Beispiel möglich, eine Textsammlung für ein Seminar öffentlich ins Web zu stellen.

Bild 2 [100 x 70 Pixel @ 2,2 KB]

Die Open Archives Initiative [7] befasst sich mit offenen Standards zur Archivierung und hat damit eine völlig andere Zielsetzung als die Open Access Initiative. Dort geht es um die Formate für digitale Daten, um Dublin Core, XML und digitale Archivierung.

Für die Wissenschaftslandschaft in Deutschland findet man die besten Informationen an der Uni Bielefeld [8], wo Links und Fachaufsätze zum Thema Open Access zusammengetragen sind. Als weitere wichtige Anlaufstelle fungiert Zugang zum Wissen [9], betreut von der Uni Oldenburg. Dort schreibt Eberhard Hilf außerdem ein Blog zum Thema mit Schwerpunkt auf Initiativen, Konferenzen und Unterschriftenlisten, um Wissenschaftler, Unis und Verlage zur Beteiligung aufzufordern. Auch die Helmholtz-Gemeinschaft [10] als Vereinigung verschiedener naturwissenschaftlicher Institutionen in Deutschland beschäftigt sich mit Open Access und bietet Neuigkeiten und Informationen an. Seit 1. Mai gibt es für den deutschsprachigen Forschungsraum ein Web-Portal, das viele Fragen nach spezifisch deutschen und EU-weiten Forschungsnormen [11] beantwortet.

Ganz allgemein sollten Wissenschaftler und Studenten, die Interesse an Open Access haben, unbedingt das Blog von Peter Suber [12] lesen, wo aktuelle Nachrichten und Diskussionen zum Thema gepostet werden. In Subers Newsletter finden sich Dutzende Einrichtungen, Initiativen und Journale, die sich OA verschreiben.

Weiter: Open Access [13]

Bild 3 [163 x 92 Pixel @ 4,3 KB]

Aus der Open Access Initiative ist vor allen Dingen die Public Library of Science [14], kurz PLoS, mit einigen Wissenschaftsjournalen aus den Bereichen Physik und Biologie hervorgegangen, die explizit unter Creative Commons veröffentlicht sind. Eine umfangreiche Liste mit Journalen und Archiven [15], die im weitesten Sinne zumindest frei zugänglich sind und manchmal auch unter einer freien Lizenz stehen, hat der Welt-Informationsgipfel der UN (WSIS) zusammengestellt. Das Directory of Open Access Journals [16] (DOAJ) bietet eine spezielle Suchmaschine, die nur Zeitschriften aufnimmt, die im Sinne der OAI frei publizieren und einem Peer Review und/oder einer redaktionellen Betreuung unterliegen. Journals können sich dort selbst anmelden. Deutschsprachige und deutsche Wissenschaftsjournale sind übrigens in beschämend geringer Anzahl vertreten.

Bild 4 [600 x 491 Pixel @ 50,1 KB]
Freies Bildmaterial der Public Library of Science: Ein Fadenwurm aus dem Golf von Mexiko. Foto: Charles Fisher, in: Antje Boetius, Microfauna/Macrofauna Interaction in the Seafloor: Lessons from the Tubeworm, PLoS Biology 2005

Biomed Central [17] ist eine ähnliche Sammlung von OA-Journalen, aber mit einem Fokus auf Medizin und Biologie. Es ist keine Suchmaschine, sondern der erste Verlag, der sich auf OA-Journale spezialisiert hat. Sowohl bei PLoS als auch bei den Biomed-Central-Zeitschriften kostet eine Veröffentlichung allerdings Gebühren, die in der Regel die Forschungsinstitute oder Unis bezahlen. Ähnliche Wege geht auch der Springer-Verlag, der zu einem Preis um 3000 (!) US-Dollar eine Option Open Choice [18] anbietet, die laut Springer mit der CC vereinbar ist.

Weiter: Freies Publizieren [19]

Frei zugängliche Journals gibt es allerdings schon länger als die Open-Access-Initiative. Eine Liste mit 4300 solchen Wissenschaftsjournalen [20], sortiert nach Zugriffsart, pflegt die Uni Regensburg. Als frei zugänglich gilt dabei allerdings jede Zeitschrift, die für jedermann via Internet erreichbar und im Volltext lesbar ist – was noch nicht bedeutet, dass damit die Aufsätze und Publikationen frei kopiert und weiterverteilt werden dürfen. Das Verzeichnis ist besonders für Geisteswissenschaftler interessant, die sich derzeit noch ziemlich schwer mit der OAI tun. Die Liste umfasst allein für Politikwissenschaft über 1000 Zeitschriften.

Bild 5 [220 x 300 Pixel @ 85 KB]
Viele klassische Abbildungen sind inzwischen gemeinfrei: Hand aus Gray's Anatomy Plates

Grundsätzlich lohnt sich für englischsprachige Publikationen auch das HighWire-Archiv [21] der Uni Stanford, das verschiedene Listen anzeigt wie zum Beispiel die größten internationalen Archive mit Volltext-Artikeln oder Zeitschriften, deren Artikel nach zwölf Monaten komplett im Volltext erhältlich sind. Auch das bedeutet nicht automatisch eine freie Lizenz im Sinne der CC. Da aber korrektes Zitieren und die Nennung der Quelle sowieso wissenschaftlicher Standard ist, hilft schon weiter, einen Aufsatz einfach online lesen zu können. An der Uni Oxford [22] in England wird ebenfalls ein Verzeichnis mit frei zugänglichen und OA-Journalen gepflegt, die auch kleinere Publikationen unter OAI enthält.

Auch die Max-Planck-Gesellschaft betreibt einen eigenen OA-Server. Der eDoc-Server [23] versammelt nicht bloß Naturwissenschaftler, sondern auch juristische, kunsthistorische und ethnologische Forschungseinrichtungen unter seinem Dach und ist ein Beispiel für die Open-Access-Möglichkeit der Selbstarchivierung, bei der Forschungseinrichtungen ihre Publikationen technisch selbst verwalten und das nicht an einen Verlag auslagern.

Ein anschauliches Beispiel, wie die Präsentation von Wissenschaft und Forschung sowohl für Fachleute als auch interessierte Laien aussehen kann, zeigt das Alfred-Wegener-Institut für Polarforschung [24], das nicht nur eine schöne Website hat, wo man Bild- und Videomaterial für den privaten und erzieherischen Gebrauch unter Nennung der Quelle frei zur Verfügung stellt, sondern auch einen Open-Access-Server [25] für Publikationen betreibt. Dabei greift das AWI auf freie XML-Formate des Dublin Core (standardisierte XML-Schemata für bestimmte Anwendungszwecke) zurück und bietet seine Forschungsergebnisse sowohl im Web als auch nach den Regeln der Open Archive Initiative an.

So rund kann man Forschung im Internet präsentieren: schön gemachte Website, Material für Laien und Schulen, professionelle Öffentlichkeitsarbeit, zweisprachig Deutsch und Englisch, offene Standards für Metadaten und Archivierung, Zugänglichkeit der Forschung durch Open Access – und wem das nicht reicht, der kann auch noch ein paar Webcams in der Arktis und Antarktis anschauen.

Natürlich geht es auch mit weniger Aufwand. An der Brown University zeigt ein Handbuch über Medienkunst [26], wie man Open Access auch interpretieren kann: Das Handbuch steckt in einem Wiki und ist unter der CC veröffentlicht. Jeder Leser wird ermuntert, Fehler zu korrigieren und Ergänzungen vorzunehmen. Eine Buchfassung in mehreren Sprachen wurde 2006 im Taschen-Verlag veröffentlicht – parallel dazu existiert trotzdem weiterhin das Wiki.

Wer nichts mehr liebt als social networking und eine Xing-artige Gemeinschaft fürs wissenschaftliche Arbeiten sucht, wird bei Lalisio [27] fündig. Der Vorzug dieses Netzwerks ist das gegenseitige Sichtbarmachen von sogenannten "Grauen Materialien" – Thesenpapiere, Vortragsfolien, ein kurzer Ideenabriss und dergleichen mehr. Darauf können die Mitglieder untereinander jeweils zugreifen. Außerdem bietet Lalisio eine Online-Suche für verschiedene wissenschaftliche Publikationsverbunde wie Biomed Central und Project Muse an.

Weiter: Freie Daten [28]

Ein völlig anders gelagertes Problem stellen Forschungsergebnisse und Rohdaten dar. Da von Forschungsinstituten inzwischen erwartet wird, dass sie über Drittmittel, Patente oder die Lizenzierung ihrer Forschungsergebnisse selbst Gelder erwirtschaften, landen viele von der öffentlichen Hand bezahlte Forschungsergebnisse direkt in Unternehmen. In den USA beispielsweise gibt es zwar offiziell die Verpflichtung, staatlich finanzierte Forschung auch der Öffentlichkeit zugänglich zu machen – die Realität zeigt aber, dass "teure" Forschung wie Medizin und Pharmazeutik schlicht in die privatwirtschaftliche Sphäre umverlagert wird.

Eigentlich sind Rohdaten nicht urheberrechtlich schützbar – so zumindest die Theorie. In der Praxis werden Datensammlungen aber beileibe nicht einfach zum handlichen Download im Internet verteilt, sondern teilweise sogar über Patente geschützt.

Die wichtigste Anlaufstelle für die Open-Source-Spielart für Wissenschaft ist deswegen der Creative-Commons-Ableger Science Commons [29], der derzeit einen Fokus auf Bio- und Neurowissenschaften hat. Die Idee hinter Science Commons ist die freie Zugänglichkeit von Forschungsdaten und -Datenbanken. Ein Abkommen soll hier einen schnellen Austausch von Zellkulturen, DNA und anderen Biomaterialien zwischen Forschungsinstitutionen sicherstellen, ohne sich in monatelangen Lizenzverhandlungen aufzuhalten.

Bild 6 [173 x 77 Pixel @ 4,3 KB]

Aus Australien kommt die Initiative BiOS aus dem Projekt Cambia [30], die Open-Source-Prinzipien und -Lizenzen auf die Molekularbiologie zu übertragen versucht. Cambia erhält seine Gelder unter anderem vom norwegischen Aussenministerium und betreut außer viel Informationsmaterial noch die Site BioForge [31] – die Download-Site der Initiative, deren Name sich ganz bewusst an Sourceforge.net anlehnt.

Ein weiteres Projekt zu freien Biodaten ist die BioBrick Foundation [32], die wesentlich auf die Initiative von Drew Endy und Thomas Knight zurückgeht, die die Vorzüge der Entwicklung von freier Software auf Biotechnologie übertragen möchten. Unter dem plakativen Label "Open Wetware" stellt die BioBrick Foundation DNA-Schnipsel für Bioingenieure unter einer freien Lizenz zur Verfügung. Die Idee dahinter ist, Biotechnologie zu ähnlichen Innovationsschüben durch den "Garagengenetiker" ähnlich jenem sprichwörtlichen IT-Startup in der Garage des Elternhauses zu verhelfen.

Bild 7 [700 x 167 Pixel @ 69,3 KB]
BioBrick Foundation: Biotechnologie in Open-Source-Manier

Auch in den Sozialwissenschaften geht es um Rohdaten – Statistiken über Arbeitslosigkeit, Bevölkerungswandel oder Umweltdaten sind nur einige Beispiele, wo Wissenschaftler auf behördliche Rohdaten zugreifen. Diese Daten gibt es und sie sind mehr als reichlich verfügbar: Praktisch jede Behörde eines Landes sammelt Daten und erstellt eigene Statistiken vom Amts wegen. Zentral in Deutschland sind natürlich die statistischen Landesämter, das statistische Bundesamt sowie Eurostat, das europäische Amt für Statistiken der EU. Sowohl das Bundesamt für Statistik [33] als auch Eurostat [34] haben eine äußerst schwammige "Lizenz" ihrer online verfügbaren Daten: "darf man unter Nennung der Quelle kopieren, solange nichts anderes vermerkt ist". Für den interessierten Laien oder für ein Arbeitslosenstatistik-Mashup empfiehlt es sich daher, sicherheitshalber beim Amt nachzufragen.

Allerdings kann man historisch bedingt und aufgrund der mit den Datenerhebungen zusammenhängenden Datenschutzprobleme nicht einfach so die Fahne des "Daten ab ins Internet" schwingen: In vielen Staaten werden öffentlich erhobene Daten durch Statistikgesetze oder Sozialgesetzbücher geregelt, weil natürlich das europäische Sozialwesen bereits seit dem 19. Jahrhundert Daten sammelt und nicht erst seit der Erfindung des Internets. Jahrhunderte, bevor auch nur jemand an Open Source dachte, fingen das französische Polizeiwesen und das preußische Beamtentum bereits mit der Datensammelei an.

Das Bundeamt stellt inzwischen aber mehr und mehr Daten für Forscher zur Verfügung. Diese Daten kosten manchmal eine Gebühr von 65 Euro und sind in zwei rechtliche Zugriffskategorien gesplittet: "public use"-Daten sind "absolut anonym", während "scientific use"-Daten nur "faktisch anonym" sind – hier besteht ein Restrisiko der Deanonymisierung, weswegen sie nur nationalen Forschern zur Verfügung gestellt werden.

Für alle nichtforschenden Bürger gibt es trotzdem viele kostenlose Downloads von Daten und Zusammenfassung von bereits ausgewerteten Daten und natürlich in neuerer Zeit auch in Deutschland das Informationsfreiheitsgesetz, was einen verbesserten Zugriff auf Daten und Informationen für jedermann erlaubt. Allerdings gilt für die meisten politisch oder sozialwissenschaftlich relevanten Daten: Man muss sich gründlich durch die jeweiligen Institutionen durchrecherchieren und Lizenzen und Zugangsbedingungen wirklich mit der Lupe suchen. Zentrale Datenbanken? Handliche APIs auf Tabellen? Davon wird man noch einige Jahrzehnte träumen müssen.

Weiter: Freie Geodaten [35]

Weltweit nutzen Unternehmen, Forscher und Laien Geodaten für alle möglichen Projekte. Schlimmstenfalls sind es jene lästigen Geolocation-Analysen auf Webseiten, die anhand des Standorts der IP-Adresse regional bezogene Werbung einblenden – oder gleich eine schlecht übersetzte Webseite servieren. Mehr Freude haben die meisten Internetnutzer an den vielen Spielereien, die man mit den Daten von Google Maps anstellen kann. Rein von der Lizenz her gesehen ist Google Maps übrigens nicht sonderlich "frei", sondern fällt eher in den Bereich von "bis zu einem bestimmten Umfang frei zugänglich". Das sieht bei anderen "Geodiensten" nicht anders aus: Langjährigen Internetanwendern in Deutschland ist sicher noch der Streit um das Kartenmaterial von "stadtplandienst.de" gegenwärtig. Woher also "die Welt" unter freier Lizenz beziehen?

Die erste Anlaufstelle ist FreeGIS.org [36]. Dort findet man außer einer Reihe von Anwendungen und diversen "Geo-APIs" für alle möglichen Programmiersprachen eine umfangreiche Liste von Geodaten-Sets aller Art. Vieles davon kommt aus dem Visible-Earth-Projekt der NASA [37], aber man findet beispielsweise auch eine US-Straßenkarte des Open-Source-Protagonisten Bruce Perens, Daten für die Stadt Osnabrück oder Daten über europäische Flußsysteme. Die Uni Hannover [38] pflegt eine Linkliste mit frei verfügbaren Geo- und Wetterdaten sowohl von Satelliten als auch als digitales Kartenmaterial. Die Lizenzen sind allerdings sehr spezifisch – unbedingt vorher nachlesen.

Bild 10 [484 x 200 Pixel @ 29,8 KB]
Kanada veröffentlicht staatlich gesammelte Geodaten im Netz.

Kanada geht übrigens seit April diesen Jahres mit gutem Beispiel voran und veröffentlicht auf GeoGratis.ca [39] staatlicherseits gesammelte Geo- und Wetterdaten zur kostenlosen, nicht-kommerziellen Nutzung im Internet. Langfristig sollten Freunde des Geo-Mashups das Blog OpenGeoData [40] lesen, in dem seit zwei Jahren Links und Informationen zu frei verfügbaren Geodaten gesammelt werden – gerade, weil es keine weltweit zentrale Datenbank für freie Daten dieser Art gibt, sind interessierte Laien auf gesammelte Hinweise der weltweit verstreuten Daten angewiesen.

Was kann man dann mit den Daten machen? Selbst bei minimalen Programmierkenntnissen kann man viele eigene Projektideen entwickeln und auch diese Projekte unter einen freien Lizenz jedermann zur Verfügung stellen. Das wichtigste seiner Art ist erstens das Georeferenzierungsprojekt bei Wikipedia [41], das sich bemüht, Koordinaten an jeden geo-angehauchten Artikel, der irgendeinen Platz der Erde beinhaltet, anzufügen. Aus dieser Zuweisung kann man vielfältige Visualisierungen generieren. OpenStreetMap [42] ist ein weiteres freies Projekt, das im Prinzip ähnlich wie Google Maps arbeitet, aber editierbar und damit von Nutzerseite erweiterbar ist.

Bild 11 [589 x 338 Pixel @ 126,9 KB]
OpenStreetMap: freie Alternative zu Google Maps

Das deutsche Projekt OpenGeoDB [43] stellt für fast alle Städte im deutschsprachigen Raum die Längen- und Breitengrade mit Postleitzahl zur freien Verfügung – zum Beispiel für freie Routenplaner mit Entfernungsberechnung. Wer gern mit GPS-Empfängern spielt, kann sich beim Geoclub [44] beteiligen, der außerdem das Projekt Opencaching betreut, bei dem Nutzer selbstgewählte Standorte (Freiluftkinos, Museen, Sehenswürdigkeiten und so weiter und so fort) mit den GPS-Koordinaten erfassen und mit einer Kurzbeschreibung publizieren. Zu guter Letzt kombiniert man dann die GPS-Daten in einem handlichen, mobilen PDA mit GPS-Empfang mit den freien Reisetips des Travel Wiki [45] und verbindet Erholung, freie Lizenzen, Technik und ein bisschen Weltbürgertum auf elegante Weise miteinander.

Weiter: Freie Rede – geschlossene Sprache [46]

Linguisten und Sprachwissenschaftler jeder Art haben es allerdings noch schwerer. Es gibt ein paar freie Textkorpora – zum Beispiel auf Basis des Gutenberg-Projekts –, aber in der Masse sind Zusammenstellungen von "Sprache" interessanterweise nicht frei, weil diese Sammlungen auf Basis von Zeitungen und Büchern aus Verlagshand erstellt werden. Und die Verlage gestatten dies nur unter recht strikten Lizenzbedingungen.

Bild 8 [250 x 326 Pixel @ 12,4 KB]
Der Duden - deutsche Sprache unter Copyright

Neben dem Grimmschen Wörterbuch [47] ist in Deutschland natürlich der Duden maßgeblich für die deutsche Sprache. Auf den Datenbestand kann man online zugreifen – nach Anmeldung und Abschluss eines kostenpflichtigen Abonnements. Wer auf den Webseiten stöbert, findet zwar eine Abteilung "Open Duden"; dabei handelt es sich aber um einen Jungjournalisten-Nachwuchs-Wettbewerb und nicht etwa um ein freies Online-Angebot. Natürlich ist "der Duden" schlicht ein Wörterbuch des ganz regulären Duden-Verlags [48]; aber anders als beim Oxford English Dictionary [49] oder Merrimam-Webster [50] für US-Englisch existiert nicht einmal eine frei zugreifbare Online-Fassung.

Stöbern wir also beim Institut für Deutsche Sprache [51]: Dort ist explizit und sehr deutlich vermerkt, dass es absolut unmöglich ist, Dritten Zugriff auf die Korpora zu ermöglichen – deren Preisklasse zwischen 200 und 2250 Euro liegen. Und selbst wenn man bezahlt, ist der Zugriff restriktiv und gestattet es beispielsweise nicht, einfach den kompletten Korpus handlich auf DVD nach Hause zu tragen. Woran das liegt? Die Textgeber [52] – alles, was Rang und Namen in der Verlagslandschaft hat – haben dem IDS keine weiterreichenden Nutzungsrechte eingeräumt.

Das dritte große Projekt für Deutsche Sprache ist der Wortschatz der Uni Leipzig [53], ein Projekt, in dem Häufigkeit und Verbindungen der deutschen Sprache aus Online-Quellen aufbereitet und mit Graphen dargestellt werden. Lizenz: Im Web darf jedermann suchen – aber irgendeinen Korpus oder Daten zum Herunterladen gibt es nicht. Auch automatisierte Abfragen sind ausdrücklich nicht erlaubt.

Open Access findet sich dann auch auf keiner der genannten Webseiten – weswegen in vielen Sprachprojekten Korpora oder Wortlisten selbst kompiliert werden, die dann wiederum nicht für jedermann zur Verfügung stehen. Eine gute Idee wäre, gemeinsam mit Verlagen und Forschungseinrichtungen einen – nennen wir es einmal so – "Bundeskorpus der zeitgenössischen deutschen Sprache" zu erstellen, der für Forschung, Kunst, Erziehung und Privatgebrauch jedermann zur Verfügung steht – gern auch gegen eine bezahlbare Schutzgebühr. Schliesslich klagt vom Goethe-Institut bis zum deutschen Feuilleton jeder darüber, wie wenig deutsche Sprachpflege betrieben wird.

Wissenschaft besteht aus den drei Säulen Forschen, Publizieren und Lehren. Dementsprechend gibt es natürlich auch verschiedene Initiativen, Vorlesungsmaterial und Literaturverzeichnisse unter eine freie Lizenz zu stellen. Die Stichworte hierzu heißen Open Courseware (OCW) und Learning Objects. Das bekannste Projekt dieser Art dürfte die Open-Courseware-Sammlung des MIT [54] sein, die sich übrigens nicht bloß mit Informatik, sondern mit auch mit allen möglichen anderen Fächern beschäftigt. Die Qualität der Unterlagen ist sehr verschieden: Manchmal handelt es sich im Grunde nur um den Terminplan der Vorlesung mit einem Literaturverzeichnis.

Ähnlich wie die Creative-Commons-Webseite für freie Inhalte und die Science Commons für Wissenschaften gibt es die Open Educational Ressources (OER Commons [55]) als zentrales Register für frei zugängliche Lehrmaterialen für Schulen und Universitäten. Auch hier sind mehr Fächer als nur Informatik und Naturwissenschaften versammelt.

Beim Stöbern wird man früher oder später außerdem über die Open University in England stolpern. Dabei handelt es sich nicht um eine Universität, sondern um eine Berufsakademie, an der jedermann studieren kann. Das Konzept ist ähnlich dem der Fernuniversität Hagen, die allerdings im Unterschied zur Open University staatlich anerkannt ist – und wesentlich günstigere Preise veranschlagt. Die Open University hat einige Lehrmaterialien [56] unter CC zum Herunterladen veröffentlicht. Deren Qualität bewegt sich eher auf Volkshochschulniveau, was nicht grundsätzlich schlecht ist, aber nichts mit Universität und Forschung zu tun hat.

Auf jeden Fall lohnt sich ein gründliches Nachforschen nach Unterrichtsmaterialien bei einer der zentralen Link-Sammlungen wie Stingy Scholar [57], das regelmässig auf interessante Ressourcen hinweist. Eine komplette Recherche-Datenbank für Open Courseware findet man zum Beispiel bei iberry.com [58].

Leider ist Open Courseware in Deutschland als Label nicht sonderlich verbreitet – zwar stellen sehr viele Dozenten ihre Lehrmaterialien und Unterlagen ins Internet, aber eine zentrale Anlaufstelle und Recherchemöglichkeit fehlt bisher. In der Regel sind die Unterlagen auch nicht mit einer Lizenz versehen, geschweige denn im Sinne der CC vorrecherchiert und ausgewählt. Dadurch ergibt sich in Deutschland eine paradoxe Situation zwischen Umfang und Lizenz: Es gibt sehr viel Material, aber wieviel davon problemlos und legal kopier- und weiterverwendbar ist, ist größtenteils ungeklärt.

Bild 9 [250 x 262 Pixel @ 16,2 KB]
Frei zugängliches Bildmaterial lässt sich auch schaffen: Totenmaske aus Kolumbien, Ethnologisches Museum Berlin-Dahlem. Foto: Andreas Praefcke

Für französische Lehrmaterialien gibt es an der Paris-Tech eine längere Liste [59] – hauptsächlich zu Informatik und Naturwissenschaften. Natürlich wird in Europa die Lage durch die Sprachvielfalt erschwert – ob etwa in Deutschland das Schlagwort "Open Courseware" überhaupt verwendet wird und wie das Pendant in anderen EU-Sprachen heißt, erleichtert das Auffinden nicht gerade.

Insgesamt bewegt sich einiges in der Wissenschaftslandschaft. Trotzdem werden viele Wissenschaftsbereiche noch sehr, sehr viel Geduld aufbringen müssen, bis eine ähnliche Verfügbarkeit wie in Mathematik oder Informatik erreicht ist. Dabei müssen sich besonders (deutsche) Geistes- und Gesellschaftswissenschaftlen – die seit Jahrhunderten wortreich über Freiheit und Gerechtigkeit und Gleichheit forschen – in absehbarer Zeit fragen lassen, wo eigentlich ihre Open-Access-Initiativen bleiben, denn wissenschaftliche Publikationen dieser Fachbereiche sind noch eher spärlich als Open Content zu finden. Ein wenig in Schutz nehmen muss man die Geisteswissenschaften dennoch, denn natürlich gibt es freien Zugang, der freilich nicht unter dem Mäntelchen Open Access daher kommt – allein Geschichtswissenschaft und Politik, Ethnologie, Achäologie und Kunstgeschichte präsentierten seit 100 Jahren einen Gutteil ihrer Erkenntnisse in Museen und Gedenkstätten.

Von dem Tag, an dem Professoren einfach eine URL angeben, wo die Lektüre fürs Seminar komplett zu finden ist, oder einem einfachen "Klar, warte, ich geb' dir die Aufsätze für das Thema auf 'nem USB-Stick mit!" sind wir allerdings noch sehr weit entfernt.

Weiter: Freie Fremdsprachen [60]

Besser sieht die Situation für Menschen aus, die "bloß" eine fremde Sprache erlernen wollen. Das Web ist voll von "freien" Sprachkursen, Podcasts, Vokabeltrainern und Einführungen in die Grammtik des modernen Navaho. Allerdings muß man schon genauer hinsehen: Viele Sites haben sich zwar das Schild "frei" angeheftet, meinen damit aber nur "darf man einfach benutzen". Wirklich "frei" im Sinne von GPL, FDL oder CC sind nur einige wenige Fremdsprachen-Ressourcen.

In Deutschland ist beispielsweise Leo.org [61] eine wichtige Anlaufstelle für englische, französische und spanische Wörterbücher – die Nutzungsrechte sind allerdings ziemlich restriktiv: kein Download, keine Spider, keine Vokabellisten zum Herunterladen, nur Nachgucken im Webfrontend und in zwei, drei betriebssystemspezifischen Tools ist erlaubt. Auch Pons hat eine ganze Reihe seiner Wörterbücher [62] via Web zugänglich gemacht – aber wirklich frei à la CC sind diese Inhalte auch nicht. In der wohl umfangreichsten Liste von Sprachressourcen [63] findet man immer einige CC-lizenzierte Kleinigkeiten, zum Beispiel die exzellente Idee eines Vokabeltrainers für chinesische Hanzi-Zeichen [64] – fürs Handy.

Und wer immer dachte, dass man Open Source nur für Linux und BSD erhält: Ein weiterer Vokabeltrainer fürs Handy [65] läuft nur auf Windows-Mobile-basierten Geräten. Noch weiter treibt es eine Site zum Russisch lernen [66], deren Englisch-Russisches Wörterbuch es (GPL-lizenziert) nur für Windows XP mit .NET gibt. Da fragt man sich schon manchmal, wieso die Linuxwelt an die 200 httpd-Daemons als Open Source veröffentlich, währen die Mac- und Windowsentwickler alltägliche Jedermann-Gebrauchssoftware programmieren.

Was übrigens nicht einfach zu finden ist: Wirklich gute, umfangreiche Wortschatz-Listen, wie man sie in Buchform kennt – "Grund- und Aufbauwortschatz XY". Vokabellisten, deutsche Wörterbücher auf dem Niveau eines Oxford English Dictionary oder des Petit Roberts – Fehlanzeige. Diese Wortlisten wären aber eine essenzielle Basis für weitere freie Sprachprojekte.

Immerhin existiert das freedict-Projekt [67]. Die Dateien gibt es in verschiedenen Formaten: für den dictd, als XML in TEI [68] (die "offizielle" DTD, Vokabeln in XML auszuzeichnen) und bereits für StarDict konvertiert [69]. Die Qualität der frei verfügbaren Wörterbücher schwankt allerdings sehr: Das deutsch-französische Freedict-Wörterbuch etwa kennt weder die Übersetzung für Computer noch den citoyen als Bürger – nicht gerade völlig unbekannte französische Spezialvokabeln. Angaben wie feminin oder maskulin gibt es nicht, ebensowenig wie Hinweise auf die Konjugationform eines Verbs oder die Pluralbildung eines Substantivs.

Sprachfreunde, die sich also berufen fühlen, etwas wirklich Sinnvolles beizutragen: freie Wortlisten in guter Qualität – für Vokabeltrainer, Sprachkurse und Wörterbücher und für jedermann frei verfügbar. (odi [70])


URL dieses Artikels:
http://www.heise.de/-222141

Links in diesem Artikel:
[1] https://www.heise.de/ct/artikel/Friede-Freude-und-freie-Eierkuchen-Rezepte-Teil-1-222135.html
[2] https://www.heise.de/ct/artikel/Friede-Freude-und-freie-Eierkuchen-Rezepte-Teil-3-222145.html
[3] https://www.heise.de/meldung/Bundesrat-fuer-umfassendere-Volkszaehlung-und-gegen-Open-Access-177656.html
[4] http://citeseer.ist.psu.edu/
[5] http://creativecommons.org/projects/founderscopyright/oreilly
[6] http://www.soros.org/openaccess/
[7] http://www.openarchives.org/
[8] http://www.uni-bielefeld.de/ub/wp/links.htm#link
[9] http://www.zugang-zum-wissen.de/
[10] http://oa.helmholtz.de/
[11] http://www.open-access.net/
[12] http://www.earlham.edu/~peters/fos/fosblog.html
[13] http://www.heise.de/open/artikel/93983/1
[14] http://www.plos.org/
[15] http://www.wsis-si.org/oa-journals.html
[16] http://www.doaj.org
[17] http://www.biomedcentral.com/
[18] http://www.springer.com/dal/home/open+choice?SGWID=1-40359-0-0-0
[19] http://www.heise.de/open/artikel/93983/2
[20] http://rzblx1.uni-regensburg.de/ezeit/fl.phtml?bibid=UBR&colors=7&lang=en
[21] http://highwire.stanford.edu/
[22] http://www.inasp.info/peri/free.shtml
[23] http://edoc.mpg.de/
[24] http://www.awi.de
[25] http://epic.awi.de/Main
[26] https://wiki.brown.edu/confluence/display/MarkTribe/New+Media+Art
[27] http://www.lalisio.com
[28] http://www.heise.de/open/artikel/93983/3
[29] http://sciencecommons.org/
[30] http://www.cambia.org
[31] http://www.bioforge.net
[32] http://www.biobricks.org/
[33] http://www.destatis.de/
[34] http://epp.eurostat.ec.europa.eu/pls/portal/url/page/PGP_ESTAT_HOME_PAGE/PGE_HP_DYNAMIC
[35] http://www.heise.de/open/artikel/93983/4
[36] http://freegis.org
[37] http://visibleearth.nasa.gov/
[38] http://www.geog.uni-hannover.de/phygeo/geodaten.html
[39] http://www.geogratis.ca/
[40] http://www.opengeodata.org
[41] http://de.wikipedia.org/wiki/Wikipedia:WikiProjekt_Georeferenzierung/Wikipedia-World/en
[42] http://www.openstreetmap.org/
[43] http://opengeodb.hoppe-media.com/
[44] http://www.geoclub.de/
[45] http://wikitravel.org
[46] http://www.heise.de/open/artikel/93983/5
[47] http://germazope.uni-trier.de/Projects/DWB
[48] http://www.duden.de/
[49] http://www.askoxford.com/
[50] http://www.merriam-webster.com/
[51] http://www.ids-mannheim.de
[52] http://www.ids-mannheim.de/kl/projekte/korpora/textgeber.html
[53] http://wortschatz.uni-leipzig.de/
[54] http://ocw.mit.edu/OcwWeb/index.htm
[55] http://www.oercommons.org
[56] http://www.open.ac.uk/openlearn/home.php
[57] http://http://stingyscholar.blogspot.com
[58] http://iberry.com/
[59] http://graduateschool.paristech.org/index.php?type=cours
[60] http://www.heise.de/open/artikel/93983/6
[61] http://dict.leo.org
[62] http://www.pons.de/home/specials/ponsline/
[63] http://freelanguage.org/
[64] http://www.ironfrost.co.uk/flashcards/
[65] http://devlicio.us/blogs/brendantompkins/archive/2007/03/29/an-open-source-free-windows-mobile-translation-dictionary.aspx
[66] http://www.russianlessons.net/software/dictionary.php
[67] http://freedict.org
[68] http://sourceforge.net/project/showfiles.php?group_id=1419
[69] http://stardict.sourceforge.net/Dictionaries.php
[70] mailto:odi@heiseopen.de