Fokus

Datenschatz Internet

Wie IGB-Forschende die Netzwelt für Forschungswissen nutzbar machen
Um wissenschaftliche Erkenntnisse zu generieren, brauchen Forscherinnen und Forscher Daten. Zwei neue Forschungszweige, Culturomics und iEcology, nutzen dafür das Internet. Das bietet viele Chancen, insbesondere auch für die Erforschung aquatischer Lebensräume.

Um Rückschlüsse auf die Nutzung von Gewässern zu ziehen, nutzen IGB-Forschende unter anderem Social-Media-Daten. | Foto: shutterstock/Dmytrenko Vlad

Jeden Tag werden im Internet gigantische Mengen Fotos, Videos und Texte aller Art veröffentlicht. Allein auf YouTube laden User pro Minute 500 Stunden Videomaterial hoch, die englischsprachige Wikipedia umfasst inzwischen mehr als 6.000.000 Artikel. Diese internetbasierten Datenmengen macht sich seit einiger Zeit auch die Wissenschaft zunutze: Bereits 2010 tauchte der Begriff Culturomics erstmals in einem Science-Artikel über digitalisierte Bücher auf, während der letzten fünf Jahre hat die neue Forschungsrichtung auch in der Biodiversitätsforschung an Bedeutung gewonnen.

„Bei Culturomics geht es darum, zu analysieren, wie der Mensch auf die Umwelt reagiert, bei iEcology liegt der Fokus auf der Naturseite der Daten. Wir suchen beispielsweise nach Anzeichen, wie sich Populationen bestimmter Spezies entwickeln oder ökologische Zustände verändern“, sagt Gregor Kalinkat, Postdoktorand in der Arbeitsgruppe Lichtverschmutzung und Ökophysiologie.

Der Forscher hat schon bei verschiedenen Untersuchungen mit den neuen Methoden gearbeitet; oft zusammen mit einem der Pioniere der beiden neuen Forschungszweige, mit dem ehemaligen IGB-Forscher Ivan Jarić vom Institut für Hydrobiology an der tschechischen Akademie der Wissenschaften. Für eine Studie unter Leitung von Ivan Jarić, deren Ergebnisse im Sommer 2020 erschienen sind, analysierte ein Forschungsteam deutsche, britische und französische Webseiten, auf denen über Spezies berichtet wurde, die auf der Roten Liste gefährdeter Arten stehen. „Uns interessierte, welche Bedrohungsfaktoren im Mittelpunkt der Darstellungen stehen, und dabei insbesondere, welchen Stellenwert invasive Arten einnehmen“, sagt Ivan Jarić. Am häufigsten genannter Bedrohungsfaktor war der Klimawandel, während über die Rolle invasiver Arten selten berichtet wurde. „Dass die Bedeutung des Klimawandels für den Artenverlust viel bekannter ist und darüber häufiger berichtet wird, hatte man zuvor angenommen, wir konnten das nun aber mit unserer Analyse auf einfache, schnelle und kostengünstige Art nachweisen“, bemerkt Gregor Kalinkat.

Schlüsselbereiche wären Artenmonitoring, der Ökosystemstatus und menschliche Einflüsse

Das Beispiel zeigt, welches Potenzial Culturomics und iEcology haben. Insbesondere um aquatische Lebensräume zu erforschen, bieten die neuen, internetbasierten Methoden zahlreiche Möglichkeiten, sind Gregor Kalinkat und Ivan Jarić überzeugt. Beide haben mit weiteren Forschenden eine Übersichtsstudie verfasst, in der sie Schlüsselbereiche identifizieren, für die Culturomics und iEcology besonders hilfreiche Erkenntnisse liefern können. Dazu gehören die Verbreitung bedrohter, seltener und gebietsfremder Arten, der Ökosystemstatus und anthropogene Auswirkungen. Besonders große Potenziale sieht Gregor Kalinkat im Bereich Monitoring: „Uns schwebt eine automatisierte Artenerkennung vor, mit der sich Hintergrundinformationen in digitalen Daten analysieren lassen, wie zum Beispiel im Hintergrund von Fotos und Videos unbeabsichtigt aufgenommene Arten. Das würde das Monitoring weniger auffälliger Elemente der Biodiversität, etwa der Vegetation, erheblich erleichtern“, sagt er.

Auch Probleme, die mit den neuen, internetbasierten Methoden einhergehen, benennt die Ende Oktober 2020 erschienene Studie. So existieren nur spärliche Daten von weiter entfernten Punkten in Gewässern und unter Wasser. Zudem verwenden nur bestimmte Nutzergruppen Social Media, sodass online veröffentlichtes Material von Touristen beispielsweise Einschätzungen und Verhaltensweisen von Ortsansässigen widersprechen kann. Eines der Hauptprobleme ist ein beträchtlicher Bias bei der Auswahl: Während es zahllose Filme über oder Fotos von Vögeln, Amphibien und Säugetieren gibt, ist Material zu Fischen oder Wirbellosen rar. Und auch der Datenabruf birgt Probleme. Bei kommerziellen Plattformen wie Twitter, Google oder Facebook nutzen die Forschenden ein Interface, um die gewünschten Daten herunterzuladen. „Nehmen die Dienste Änderungen an der Schnittstelle vor, ist das für uns ein Problem. Veränderte Algorithmen erschweren zeitliche Analysen, denn die vor und nach einer Änderung erhobenen Daten sind nur bedingt miteinander vergleichbar“, sagt Ivan Jarić.

Ein Vergleich mit Offline-Daten hilft, die Ergebnisse zu validieren

Das Problem kennt auch Simone Podschun, Projektkoordinatorin von AQUATAG. Bei dem Projekt geht es darum zu erkennen, wann und wo Gewässer besonders intensiv für Freizeitbeschäftigungen genutzt werden, und herauszufinden, wie sich die Freizeitnutzung besser managen lässt. Um Besucherzahlen zu ermitteln, nutzt das Team Social-Media-Daten – und immer wieder kommt es vor, dass der Code, der zum Abruf der Daten verwendet wird, nicht mehr funktioniert oder dass die Datenstruktur sich geändert hat. Die Forschenden werten unter anderem Daten von Twitter und Strava aus, einer App für Lauf-, Rad- und Wassersportler*innen. „Wir sind besonders an georeferenzierten Tweets interessiert; das heißt, wir sehen, wann und wo er abgegeben wurde. Die Daten von Strava sind eine gute Ergänzung, denn sie liefern uns zusätzlich Angaben wie Distanzen, Zeiten, Art der Aktivität und Zahl der Sporttreibenden für ein beliebiges Gebiet“, sagt Simone Podschun.

Weil die Nutzerzahlen von Social Media zugenommen haben, könne man zurückliegende Jahre nur mit Vorsicht vergleichen: „Immer mehr Leute nutzen Fitnesstracker und stellen ihre Daten online“, sagt die Biologin und Expertin für Geoinformationssysteme. Deswegen achtet das Forschungsteam unter Leitung von Markus Venohr vor allem auf die Relationen – wie viele kommen, wenn es warm ist, und wie viele bei niedrigeren Temperaturen? Die Vorteile der Nutzung von Social-Media-Daten liegen für Simone Podschun auf der Hand: „Zählungen vor Ort sind enorm aufwändig, und man hat immer nur einen kleinen Ausschnitt. Onlinedienste liefern uns dagegen Informationen fast in Echtzeit: Wir konnten sofort sehen, dass durch Corona die Freizeitaktivitäten an Spree und Havel im Sommer anstiegen“, sagt sie. Die Forschenden sind sich auch bewusst, dass Social-Media-Daten anfällig für Ausreißer sind, beispielsweise bei einem Marathonlauf oder in Gebieten ohne Mobilfunkanschluss. Daher verlassen sich die Forschenden nicht alleine auf die Daten von Twitter und Strava. „Das AQUATAG-Team glich die über Social Media generierten Besucherzahlen für Badeseen um Berlin mit Daten der Berliner-Bäderbetriebe ab“, berichtet die Forscherin. Auch mit den elektronischen Zählungen, die die Stadt Berlin für Radfahrer eingeführt hat, vergleicht das AQUATAG-Team die Werte.

Mittels YouTube Artenverteilungen aufzeigen oder Erkenntnisse zum Freizeitfischen gewinnen

Wie die Analyse von Videos wertvolle Einsichten liefert, zeigen zwei aktuelle Studien des ehemaligen IGB-Forschers Valerio Sbragaglia, die im Team von Robert Arlinghaus entstanden sind. Der Verhaltensökologe wertete gemeinsam mit weiteren Forschenden YouTube-Videos aus, die von Freizeitfischern aufgenommen und online gestellt worden waren. In einer der Studien ging es darum, Freizeitangler und Speerfischer zu vergleichen. Das Team nahm dafür Videos italienischer Freizeitfischer unter die Lupe, die eine bedeutende Mittelmeer-Fischart, die Zahnbrasse, gefangen hatten. Dabei interessierte die Forschenden, wie die Größe der gefangenen Fische und das soziale Feedback der YouTube-User korrelieren. „Wir haben dafür YouTube nach für unsere Forschungsfrage passenden Videos durchsucht und anschließend die Metadaten analysiert, also Angaben wie Titel und Beschreibung des Videos. Außerdem haben wir uns angeschaut, welche Videos wie viele Likes, Views und Kommentare haben“, berichtet der Forscher, der 2017 über ein Leibniz-DAAD-Postdoc-Stipendium in der Gruppe von Robert Arlinghaus arbeitete und heute am Institute of Marine Sciences des Spanish National Research Council arbeitet. Die Suche erledigte dabei eine in R (einer freien Programmiersprache) entwickelte Software – bei fast 20.000 Videos eine enorme Arbeitserleichterung.

In der zweiten Studie standen makroökologische Muster der Verteilung zweier Fischarten im Vordergrund, des Braunen und des Weißen Zackenbarschs im Mittelmeer. Auch hierfür analysierte das Team um Valerio Sbragaglia eine hohe Anzahl an YouTube-Videos. „Um die Arten korrekt zuzuordnen, haben wir uns für diese Untersuchung die Videos teilweise auch angeschaut – aber wir arbeiten daran, diesen Prozess ebenfalls zu automatisieren“, erläutert der Forscher. Das Team fand heraus, dass der Braune Zackenbarsch in größeren Meerestiefen häufiger ein höheres Gewicht erreicht. Ein solches Muster scheint nicht ausschließlich durch die Fischerei begründet und fügt einer kontroversen Diskussion in der Fischereiwissenschaft eine neue Perspektive hinzu. Und für den Weißen Zackenbarsch konnten die Forschenden nachweisen, dass die Art weiter in den Norden des Mittelmeeres gezogen ist. Die Analyse lieferte also wertvolle Aufschlüsse – ohne dass die Forschenden einen einzigen Fisch selbst vors Gesicht bekamen.

Gregor Kalinkat ist überzeugt, dass den neuen Methoden die Zukunft gehört: „Das Potenzial von Culturomics und iEcology wächst so schnell, dass die aktuellen Probleme an Bedeutung verlieren werden“, sagt der Forscher. Auf klassische Forschungsmethoden werde man aber nicht verzichten können: Fotos von Anglern, die ausgewertet werden, um mehr über den Zustand eines Sees zu erfahren, können eine Beprobung nicht ersetzen.

Text: Wiebke Peters

Selected publications
November 2020

Expanding conservation culturomics and iEcology from terrestrial to aquatic realms

Ivan Jarić; Uri Roll; Robert Arlinghaus; Jonathan Belmaker; Yan Chen; Victor China; Karel Douda; Franz Essl; Sonja C. Jähnig; Jonathan M. Jeschke; Gregor Kalinkat; Lukáš Kalous; Richard Ladle; Robert J. Lennox; Rui Rosa; Valerio Sbragaglia; Kate Sherren; Marek Šmejkal; Andrea Soriano-Redondo; Allan T. Souza; Christian Wolter; Ricardo A. Correia
PLoS Biology. - 18(2020)10, e3000935
Ansprechpersonen

Gregor Kalinkat

Postdoktorand*in
Forschungsgruppe
Lichtverschmutzung und Ökophysiologie

Markus Venohr

Programmbereichssprecher*in
Forschungsgruppe
Flussgebietsmodellierung

Robert Arlinghaus

Forschungsgruppenleiter*in
Forschungsgruppe
Integratives Angelfischereimanagement
Projekte

Seite teilen