Data-Science-Survey: Auswirkungen der Pandemie und ethische Algorithmen

Im Survey 2021 State of Data Science fragte Anaconda neben den beliebtesten Programmiersprachen nach Unternehmensentscheidungen innerhalb des letzten Jahres.

In Pocket speichern vorlesen Druckansicht

(Bild: Phonlamai Photo/Shutterstock.com)

Lesezeit: 4 Min.
Von
  • Maika Möbus
Inhaltsverzeichnis

Der Report zum 2021 State of Data Science, einem von Anaconda durchgeführten Survey, ist erschienen. Anaconda ist ein Anbieter von Open-Source-Python- und R-Distributionen mit Fokus auf wissenschaftliche Einsatzzwecke wie Data Science und Machine Learning. Im Jahr 2018 hat das Unternehmen die Umfrage zum State of Data Science erstmals durchgeführt. In der aktuellen Ausgabe mit über 4000 Befragten standen nicht nur die beliebtesten Programmiersprachen im Fokus, sondern auch die Auswirkungen der Coronaviruspandemie und ethischer Aspekte auf die Zukunft von Data Science.

Die Befragten nutzen am häufigsten Python – und das mit großem Abstand. Sowohl bei der Verwendung "immer" (34 %) als auch "oft" (29 %) und "manchmal" (22 %) belegt Python die Spitzenpositionen. Auf dem zweiten Platz der "immer" verwendeten Programmiersprachen landet SQL mit 15 %, dahinter R mit 10 % und JavaScript mit 8 %. Dabei gilt es allerdings zu beachten, dass Anaconda vor allem für seine Python-Distribution bekannt ist.

Da sich die Pandemie auf die Arbeitsweise vieler Menschen ausgewirkt hat, empfand Anaconda es als notwendig, diesen Aspekt in die Befragung mit einzubeziehen. Das Unternehmen selbst stellte während der Pandemie einen Anstieg der Python-Package-Downloads um 48 Prozent im Vergleich zum Vorjahr fest. Die Report-Verantwortlichen führen diese Entwicklung unter anderem auf die Zunahme an Freizeit im Homeoffice zurück.

In der Befragung stellte sich zudem heraus, dass die Investitionen in Data Science in 24 % der Unternehmen seit Beginn der Pandemie gleich blieben, während sie in 26 % der Fälle vor allem aufgrund von Neueinstellungen und neuen Projekten sogar zunahmen. Die Abnahme von Investitionen trat in 37 % der Fälle auf und war vor allem durch unveränderte Teamgrößen und ein verringertes Budget, aber auch durch Stellenabbau begründet. Anaconda wertet es jedoch als Zeichen für die hohe Bedeutung von Data Science in Unternehmen, dass der Investitionsrückgang nicht stärker ausfiel.

Die Befragung widmete sich nicht nur bisherigen Entwicklungen, sondern warf auch einen Blick auf gegenwärtige und mögliche zukünftige Probleme im Data-Science-Bereich. Im Hinblick auf den problematischsten Aspekt bei Künstlicher Intelligenz und Machine Learning sind sich 31 Prozent der Befragten einig: Sie sehen soziale Auswirkungen durch Bias in Daten und Modellen auf dem ersten Platz. Allerdings sind nur in 10 Prozent der Unternehmen bereits erste Maßnahmen zur Bias-Verringerung eingeleitet worden, und 30 Prozent der Unternehmen planen diesen Schritt innerhalb der nächsten zwölf Monate. Weitere 30 Prozent der Unternehmen verzichten aber darauf. Auf dem zweiten und dritten Platz der problematischsten KI-Bereiche folgen Auswirkungen auf die Privatsphäre (21 %) sowie verschlechterte Job-Chancen (19 %).

In der Verhinderung von Bias und der Entwicklung ethischer Data Science sieht Anaconda wichtige Zukunftsaspekte. Die Herausgeber des Reports gehen weiterhin davon aus, dass Python seinen Data-Science-Spitzenplatz verteidigen wird, dass Unternehmen zunehmend zu Open Source beitragen werden, und dass Automatisierung trotz etwaiger Vorbehalte zunehmen wird.

Anaconda führte die Befragung als Online-Survey vom 14. April bis 5. Mai 2021 durch. Die 4299 Teilnehmerinnen und Teilnehmer stammen aus über 140 Ländern. 72 % gaben an, männlich zu sein, 23 % weiblich und 5 % nichtbinär. Das Alter der Befragten rangiert zu 50 % im Bereich zwischen 25 und 40 Jahren, die häufigsten Bildungsabschlüsse sind Bachelor (34 %) oder ein Master (24 %).

Auf Basis ihres Hintergrunds sortierte Anaconda die Survey-Teilnehmer in drei Tracks ein: Studierende, Akademiker oder im kommerziellen Umfeld Berufstätige. Da sich die Tracks nicht nur gemeinsame Fragen teilen, sondern auch spezifische Fragen aufweisen, kann die Anzahl der Antwortenden von Frage zu Frage variieren.

Weitere Infos sowie Zugriff auf den vollen 2021 State of Data Science Report bietet die Anaconda-Website.

(mai)