FathomNet: Open-Source-KI-Bilddatenbank soll Meeresforschung voranbringen

Um mehr über die Ozeane und ihre Bewohner zu erfahren, müssen große Mengen an Bilddaten maschinell ausgewertet werden. FathomNet soll dies ermöglichen.

In Pocket speichern vorlesen Druckansicht

(Bild: jremes84/Shutterstock.com)

Lesezeit: 3 Min.

Forscherinnen und Forscher des Monterey Bay Aquarium Research Institute (MBARI) haben in Kooperation mit weiteren Forschungseinrichtungen die Open-Source-Bilddatenbank FathomNet ins Leben gerufen, die das Training von Künstlicher Intelligenz zur Auswertung großer Mengen an visuellen Bilddaten aus Ozeanen ermöglichen soll. Die Datenbank, die in einem wissenschaftlichen Artikel in Scientific Reports beschrieben wird, soll dabei helfen, Forschungen zum Zustand der Ozeane zu beschleunigen.

Den Auswirkungen des Klimawandels etwas entgegenzusetzen, ist eine große Herausforderung. Wissenschaftlerinnen und Wissenschaftler müssen deshalb möglichst viele Informationen über die Ozeane mit ihren Meeresbewohnern, ihren Ökosystemen und Prozessen erfahren. Derzeit werden in verschiedenen Projekten mit Unterwasser-Robotern Bilddaten in Form von Fotos und Videos gesammelt. Allerdings ist deren Auswertung ein riesiges Problem, denn Forschende haben nur eine begrenzte Kapazität. Dieser Engpass kann durch den Einsatz von Künstlicher Intelligenz und maschinellem Lernen minimiert und die Meeresforschung so schneller vorangebracht werden.

"Ein großer Ozean braucht Big Data. Forscher sammeln große Mengen an visuellen Daten, um das Leben im Ozean zu beobachten. Wie können wir all diese Informationen ohne Automatisierung verarbeiten? Das maschinelle Lernen bietet einen Weg nach vorn, aber diese Ansätze sind auf riesige Datensätze für das Training angewiesen. FathomNet wurde entwickelt, um diese Lücke zu schließen", sagt Kakani Katija, eine der beteiligten Forscherinnen des MBARI.

FathomNet soll als Open-Source-Bilddatenbank Meeresforscherinnen und -forschern zur Verfügung stehen, damit sie die kuratierte Unterwasserbild-Trainingsdatenbank für eigene Forschungsprojekte nutzen können. Damit steht ihnen ein Tool zur Verfügung, um etwa Maschinen zur Erkennung von Unterwasserobjekten und -lebewesen zu trainieren, die etwa eine Unterwasserverfolgung ermöglichen.

MBARI hat in den letzten 35 Jahren etwa 28.000 Stunden Videomaterial und mehr als eine Million Tiefseebilder gesammelt. Hinzu kommen über eine Million Tiefseebilder. Diese Daten wurden von Forschungstechnikern kommentiert. Allein das MBARI-Videoarchiv umfasst etwa 8,2 Millionen Kommentare zu Tieren, Lebensräume und Objekte. Ein Teil davon ist davon in FathomNet eingeflossen. Hinzu kommen Daten von National Geographic und der National Oceanic and Atmospheric Administration (NOAA).

Als webbasierte Open-Source-Ressource können andere Institutionen auf das Datenmaterial zurückgreifen und zum Aufbau der Datenbank beitragen. In einem von MBARI gestartetem Pilotprojekt kommentieren mit FathomNet trainierte Machine-Learning-Modelle Videos, die mit ferngesteuerten Unterwasserfahrzeugen aufgenommen worden sind. Der dafür sonst nötige menschliche Aufwand sei um 81 Prozent reduziert worden, heißt es von MBARI.

Noch befindet sich FathomNet im Aufbau. Ziel soll es sein, je 1000 unabhängige Beobachtungen für mehr als 200.000 Tierarten in verschiedenen Posen unter verschiedenen Bildbedingungen zu gewinnen. Insgesamt sollen so nach und nach 200 Millionen Beobachtungen in die Datenbank einfließen. Das erfordert ein hohes Engagement der gesamten Forschungsgemeinschaft. Katija ist sich aber sicher, dass das gelingen wird, denn FathomNet ist als webbasierte Plattform, die auf einer API aufbaut, so konzipiert, dass die Nutzungshürden möglichst gering gehalten sind.

(olb)