Meta: Mehr Daten von Facebook und Instagram für die Wissenschaft

Es gibt noch vieles, was wir über die Auswirkungen sozialer Medien nicht wissen. Meta-Lobbyist und Ex-Politiker Nick Clegg kündigt nun neue Forscher-Tools an.

In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen
Eingang zu Facebooks Europa-Zentrale in Irland

Der Eingang zu Facebooks Europa-Zentrale in Irland in einer Archivaufnahme

(Bild: Daniel AJ Sokolov)

Lesezeit: 8 Min.
Von
  • Tate Ryan-Mosley

Meta will transparenter werden. Dazu liefert die Mutter von Facebook und Instagram eine neue "Meta Content Library" samt Programmierschnittstelle (API), die künftig ausgewählten Forschern zur Verfügung stehen wird. Damit sollen Wissenschaftler direkten Zugriff auf veröffentlichtes Material auf den Plattformen erhalten, um sich ein umfassenderes Bild darüber zu machen, was dort passiert.

Der Schritt kommt zu einem Zeitpunkt, an dem Social-Media-Unternehmen unter erhöhtem Druck von Öffentlichkeit und Regulierungsbehörden stehen, mehr Informationen zu veröffentlichen, wie ihre Produkte – insbesondere die Empfehlungsalgorithmen – funktionieren und welche Auswirkungen sie auf die Gesellschaft haben. Forscher fordern seit langem einen besseren Zugang zu den Daten von Social-Media-Plattformen, einschließlich Meta. Die neue Bibliothek ist ein erster Schritt und könnte helfen, besser zu verstehen, wie die Meta-Plattformen Menschen und Politik beeinflussen.

Metas oberster Lobbyist, der britische Ex-Politiker Nick Clegg, der den Titel "President of Global Affairs" trägt, meinte in einem Interview mit MIT Technology Review, die neuen Werkzeuge seien "wirklich sehr wichtig". Sie sollten "in vielerlei Hinsicht den umfassendsten Zugang zu öffentlich verfügbaren Inhalten auf Facebook und Instagram bieten", den der Konzern bislang gab. Die Meta Content Library soll dem Unternehmen auch dabei helfen, neue regulatorische Anforderungen und Verpflichtungen in Bezug auf Datenoffenlegung und Transparenz zu erfüllen, wie das Unternehmen in einem Blog-Posting aus der vergangenen Woche anmerkte.

Die Bibliothek und die dazugehörige API wurden bereits vor einigen Monaten als Beta-Version veröffentlicht. Sie ermöglichen Forschern den Zugriff auf Echtzeitdaten über Seiten (Pages), einzelne öffentliche Posts, Gruppen sowie eingestellte Events auf Facebook. Bei Instagram sind Creator- und Business-Accounts abgedeckt, ebenso wie die damit verbundene Anzahl von Reaktionen, Shares, Kommentaren und Beitragsaufrufen. Zwar sind all diese Daten längst öffentlich zugänglich, doch die Bibliothek erlaubt endlich einen direkten Zugriff auf Metas Server, was das Durchsuchen und Analysieren in großem Umfang erlaubt.

Meta hat allerdings Schutzmaßnahmen ergriffen. So soll es aus Gründen der Privatsphäre nur einen virtuellen "Reinraum" geben, über den Forscher zugreifen können. Auch ein direkter Download ist nicht möglich. Außerdem wird der Zugang auf spezifisch zugelassene Forscher beschränkt sein, die sich über eine unabhängige Drittorganisation bewerben müssen. Zusätzlich zu der neuen Bibliothek und der API kündigte Meta neue Partnerschaften mit Forschungseinrichtungen an, die ein wissenschaftliches Vorhaben aus dem Jahr 2022 fortsetzen sollen, bei dem es um die Zusammenhänge zwischen sozialen Netzwerken und wirtschaftlicher Mobilität ging.

Metas Ankündigung kommt nur wenige Tage, nachdem berichtet wurde, dass der Konzern sein Team für "Responsible AI" auflösen wird. Die Forscher sollen in anderen Bereichen Metas weiterarbeiten. Gut kam das nicht an. Clegg wollte zur Umstrukturierung des KI-Teams keinen Kommentar abgeben. Wissenschaftler hatten in der Vergangenheit ein eher angespanntes Verhältnis zu Social-Media-Unternehmen, insbesondere wenn es um den Zugriff auf deren Daten ging. Oft wurde versucht, diese nicht öffentlich zu machen. Im Jahr 2021 schickte Facebook sogar ein Unterlassungsschreiben an Forscher des Transparency Project der New York University, die politisches Targeting auf der Plattform mithilfe des sogenannten Web Scraping untersuchte, was nach Ansicht des Unternehmens "die Privatsphäre der Nutzer" verletzte.

Clegg sagte, er wolle, dass die neue Bibliothek Forschung ermögliche, die in erster Linie "aussagekräftig" sei. Es fehle derzeit an einem Konsens in der Wissenschaft über die genauen Auswirkungen sozialer Medien – eine Tatsache, die zweifellos durch das Fehlen öffentlicher Daten der Social-Media-Firmen erschwert wurde. Bei Metas neuem Ansatz handelt es sich in erster Linie um eine Datenbank, auf die entweder über eine Webschnittstelle ähnlich einer Suchmaschine oder über eine API zugegriffen werden kann, über die Forscher ihre eigenen Abfragen programmieren können, um größere Ergebnisse zu erhalten. Forscher könnten zum Beispiel alle öffentlichen Beiträge in englischer Sprache über generative KI am 14. Februar 2023 abfragen, sortiert nach der Anzahl der Aufrufe bis zu den am wenigsten aufgerufenen.

Jüngste Vorstöße von Regulierungsbehörden, insbesondere in der Europäischen Union, dürften Meta zuvor unter Druck gesetzt haben. Der Digital Services Act (DSA) der EU, der im August in Kraft getreten ist, verlangt, dass Plattformen von der Größe Metas Forschern Zugang zu Echtzeitdaten gewähren. Voraussetzung: Sie beschäftigen sich mit der "Erkennung, Identifizierung und dem Verständnis systemischer Risiken in der Europäischen Union". Regulierungsbemühungen in Australien, Brasilien, den USA und anderswo haben bereits begonnen, diese Anforderungen zu übernehmen. Das nennt man den Brüsseler Effekt: Technologieunternehmen halten sich oft an die strengsten Standards, die in der Regel von der EU festgelegt werden. Um eine Fragmentierung der Produkte zu vermeiden, gelten sie dann auch für andere Regionen.

Die Politik bemüht sich, die Forderungen nach größerer Transparenz mit den Bedenken in Sachen Datenschutz in Einklang zu bringen. Clegg meint, dass Meta versucht habe, ein solches Gleichgewicht zu finden – zum Teil durch besagtes Antragsverfahren. Forscher, die auf die Inhaltsbibliothek und die API zugreifen wollen, müssen dem "Inter-university Consortium for Political and Social Research", einer unabhängigen Organisation an der Universität von Michigan, Informationen über ihre Institution und ihre Forschungsfragen vorlegen. Meta zufolge dient das Screening in erster Linie dazu, eine Sicherheitsprüfung vorzunehmen und Finanzfragen zu erklären. Der Forschungsansatz soll nicht hinterfragt werden.

Das Bewerbungsverfahren hat jedoch bereits erste Probleme aufgeworfen. Smitha Milli, Postdoc-Forscherin an der Cornell Tech, die sich mit den Auswirkungen sozialer Medien auf die Gesellschaft befasst, fragt sich, warum die Daten nicht für jeden zugänglich sind. Schließlich enthalte die Content Library nur bereits veröffentlichtes Material. Das Bewerbungsverfahren nehme nur unnötig Zeit in Anspruch und bremse Forschung aus. "Das beschränkt uns sehr."

Meta pocht auf den Schutz der Privatsphäre der Nutzer. "Es besteht ein großer Unterschied zwischen Informationen, die auf der Plattform öffentlich zugänglich sind, und solchen, auf die man über eine Schnittstelle zugreifen kann", sagt Meta-Produktmanager Kiran Jagadeesh. Forscher erhielten so große Datenmengen – trotz mangelndem Download. Milli reicht das nicht. Sie möchte Informationen darüber, wie Empfehlungsalgorithmen wirklich funktionieren und was die Leute in ihren individuellen Feeds sehen – sowie Möglichkeiten, Experimente auf den Plattformen selbst durchzuführen. Es sei nicht klar, wie die Meta Content Library an diesen Fronten Fortschritte bringen wird. Clegg sieht das naturgemäß anders. Es sei ja möglich, die Bibliothek mit anderen Meta-Projekten wie Hintergrundinformationen zu Algorithmen zu kombinieren, die zusammen "ein viel, viel umfassenderes Bild ergeben, als es jemals möglich war".

Lena Frischlich, Professorin am Zentrum für digitale Demokratie an der Universität von Süddänemark, testete bereits die Beta-Version der Inhaltsbibliothek. Nützlich sei gewesen, Zugang zu Multimedia-Inhalten wie Reels auf Instagram und Veranstaltungen auf Facebook zu erhalten. Außerdem seien die Anzahl der Aufrufe interessant. Frischlich sagt aber auch, dass das neue Produkt zwar "ein wichtiger nächster Schritt zu mehr Transparenz" sei, aber eben nur ein Schritt. "Der Zugang zu den Daten ist immer noch etwas eingeschränkt." So sei nicht jedes Land in der Datenbank enthalten und nur bestimmte qualifizierte Forscher erhielten Zugang. Clegg sagt, er hoffe, dass das neue Instrument letztendlich zu besserer Forschung über die Rolle sozialer Medien in der Gesellschaft führe. Meta wollen damit "eine Art von gesellschaftlichem Verantwortungsgefühl" zeigen. "Es gibt aber auch ein Eigeninteresse daran, einigen der Übertreibungen, die im Zusammenhang mit sozialen Medien stehen, etwas gegenüberzustellen und eine solidere Grundlage zu liefern."

(bsc)