Missing Link: Grassroot-KI – Afrikas Aufholjagd bei Künstlicher Intelligenz

Afrika will Künstliche Intelligenz in Eigenregie mitgestalten. Die westlichen KIs passen nicht zur Bevölkerung – sie basieren auf fremden Werten und Normen.

In Pocket speichern vorlesen Druckansicht 117 Kommentare lesen
Ai(artificial,Intelligence),Concept.,Holographic,Earth,And,Digital,Pattern.

(Bild: metamorworks/Shutterstock.com)

Lesezeit: 18 Min.
Von
  • Monika Ermert
Inhaltsverzeichnis

ChatGPT heizt das Ringen um die Hoheit im Bereich Künstliche Intelligenz gerade mächtig an. Während viel spekuliert wird, wie OpenAI-Microsoft, Alphabet und Facebook nun die Welt unter sich aufteilen werden, drängen viele Forscher in Afrika auf eine eigene Entwicklung. Afrika dürfe nicht zum "Abladeplatz" einer vom Globalen Norden und dessen Werten dominierten Technologie werden. In der lokalen Aufholjagd setzen sie auch auf "Graswurzel-KI".

Nationale KI-Programme haben Konjunktur auf dem afrikanischen Kontinent. Ägypten, Mauritius und Ruanda waren die ersten auf dem Kontinent, die nationale KI-Strategien verabschiedet haben. Auch Südafrika, Tunesien, Uganda, Kenia und Nigeria habe jeweils eigene Instrumente zur Förderung von Machine Learning und Data Policies vorgelegt. Kommissionen oder Taskforces sind fast überall am Werk. In Nigeria und in Tunesien laufen aktuell Konsultationen zu KI-Gesamtstrategien.

Doch das sind längst noch nicht alle Länder, die sich das Thema auf die Fahnen geschrieben habe, erläutert Tshilidzi Marwala, Vizekanzler der Universität Johannesburg, gegenüber heise online. Da sind noch Sambia und Botswana, die mit zu den Vorreitern gehören, so Marwala; und Benin hat am 19. Januar ein Programm für 7 Millionen Euro für fünf Jahre aufgelegt.

KI-Politik-Barometer: Politische Initiativen zur künstlichen Intelligenz aus 69 Ländern. Weitere Details finden Sie hier.

(Bild: OECD.AI (2021), powered by EC/OECD (2021), database of national AI policies, accessed on 3/02/2023)

Nicht einmal das KI-Politik-Barometer der Organisation für Wirtschaftliche Zusammenarbeit (OECD) kommt noch damit hinterher, die immer neuen KI-Strategien zu dokumentieren. Marwala, der ab März die Leitung der United Nations University übernimmt, kennt die Szene seit vielen Jahren. Er ist nicht nur Vorsitzender der südafrikanischen Arbeitsgruppe "Vierte Industrielle Revolution", sondern gehörte auch zu einer entsprechenden Taskforce in Namibia. Diese habe im vergangenen Jahr ebenfalls ihre Vorarbeiten abgeschlossen und Interessierte zu einer Konferenz über die nächsten Schritte geladen.

Neben dem Rennen um nationale Initiativen, Prinzipien und Programme gibt es Anstrengungen, KI-Politik auch regional zu entwickeln. Im vergangenen September verabschiedete das UNESCO Southern Africa sub-Regional Forum on
 Artificial Intelligence (SARFAI) eine Liste von Empfehlungen für den Umgang mit KI auf dem Kontinent. Zu SARFAI gehören Botswana, Malawi, Mosambik, Namibia, Südafrika, Sambia und Simbabwe. In puncto KI enthalten die Empfehlungen neben Datenschutz und Data-Localisation-Überlegungen auch Vorschläge, wie pan-afrikanische Datensätze schneller aufgebaut werden könnten.

Datennutzung und -Souveränität stehen auch auf der Tagesordnung der schon etwas älteren Smart Africa Allianz, die sich bislang vor allem um einen afrikanischen Backbone und grenzüberschreitende Netze gekümmert hat. Die 30-Mitglieder starke Allianz wird auch von der Bundesregierung unterstützt und soll unter dem Motto data4africa und FAIR Forward lokale Datenmärkte fördern.

CfP Practical Machine Learning | Konferenz in Ruanda
Practical Machine Learning for Developing Countries – Learning under limited/ low resource scenarios, Workshop 5 May 2023 in Kigali, Rwanda

(Bild: PML4DC)

Vom 1.-5. Mai 2023 findet in Kigali, Ruanda die elfte Ausgabe der ICLR-Konferenz statt (Eleventh International Conference on Learning Representations). Am 5. Mai richten die KI-Forscherin Timnit Gebru und internationale Partner im Rahmen der ICLR einen Workshop aus zu praktischen Machine-Learning- und KI-Anwendungen für Entwicklungsländer. Im Fokus steht dabei das Arbeiten unter Bedingungen mit geringen und begrenzten Ressourcen.

Call for Proposals: Practical ML for Developing Countries

Noch bis zum 10. Februar nehmen die Veranstalter Vorschläge entgegen (hier geht es zu der Bewerbungsseite). Beiträge zu Algorithmen und Methoden, Industrieerfahrungen und praktische Anwendungen sowie Gesellschaftsthemen sind willkommen. Die Organisatoren freuen sich über Einreichungen aus dem Themenspektrum "Practical Machine Learning for Developing Countries" (PML4DC). Mehr dazu lässt sich der Workshop-Website entnehmen.

An einem großen Aufschlag arbeitet zudem die Afrikanische Union (AU), in der alle Länder Afrikas vertreten sind. Zum Ende des ersten Vierteljahres 2023 werde die AU ihre "AI Continental Strategy" vorlegen, sagt Marwala. Auf fünf zentrale Säulen habe man sich bereits geeinigt. Dazu gehören eine Ausbildungsrevolution, eine Politik, die Innovation und Ethik vereinbart, eine Open Data Policy für Afrika, ein Investitionsschub für lokale KI-Zentren und, nicht zu vergessen, die Schaffung der notwendigen Infrastrukturen als Grundlage. Denn nicht überall sind Netze und Computing Power überhaupt vorhanden.

"Missing Link"

Was fehlt: In der rapiden Technikwelt häufig die Zeit, die vielen News und Hintergründe neu zu sortieren. Am Wochenende wollen wir sie uns nehmen, die Seitenwege abseits des Aktuellen verfolgen, andere Blickwinkel probieren und Zwischentöne hörbar machen.

Inwieweit eine solche Kontinentalstrategie für KI ab Mitte des Jahres die Länder mitziehen kann, die bislang keine eigenen nationalen Strategien haben, ist noch unklar. Deutlich wird aus all den politischen Vereinbarungen und Papieren das Gefühl der Dringlichkeit, das zumindest in einigen Hauptstädten und Universitäten des Kontinents besteht.

Denn trotz vieler politischer Absichtserklärungen, mittlerweile rund 4500 KI-Unternehmen und über 400 Exzellenzhubs im Bereich Technologie und Innovation – viele davon kümmern sich um KI – hinkt Afrika hinter dem Globalen Norden und China her. Kein afrikanisches Land steht laut Marwala aktuell unter den Top 10 der Länder, die am meisten von Automatisierung und KI-Anwendungen profitieren werden. Die Einführung komme einfach zu langsam voran.

Auf dem Internet Governance Forum in Addis Abeba im Dezember 2022 hatte Marwala angesichts der Entwicklung daher eindringlich gewarnt: "Afrikanische Länder mit großen in Armut lebenden Bevölkerungsgruppen drohen in vollkommene Abhängigkeit von westlicher Technologie zu geraten, wenn wir uns nicht ernsthaft daran machen, die großen Lücken schließen."

Was ist so schlimm, auf westliche Tools von Google Search bis Google Translate oder die neuen Chatbots aufzubauen? Marwala und viele seiner afrikanischen Kollegen sind sich einig, dass man damit eine KI bekommen würde, die auf fremden Werten basiert – kulturell, aber auch schlicht numerisch. "Denn da, wo KI gebaut wird, sitzen wir nicht mit am Tisch." Die von Google wegen Insubordination gefeuerte KI-Wissenschaftlerin Timnit Gebru hatte zugespitzt formuliert, sie sei besorgt über die Zukunft von KI, nicht wegen wild werdender Maschinen, die alles übernehmen könnten, sondern wegen der homogenen, eindimensionalen Gruppe von Männern, die aktuell die Technologie vorantreiben.

Sally Radwan, Beraterin im ägyptischen IT-Ministerium, spricht davon, dass multinationale Unternehmen einfach ihre Produkte in der Region einführen, "ohne dass wir mitreden oder etwas beitragen können, sei es in Bezug auf eigene Datensets oder in Bezug auf Audits oder Zertifizierungen". Afrikanische Länder könnten bei einer solchen Entwicklung kaum noch etwas dagegen tun, dass ihre Werte, Traditionen und auch Gesetze verletzt würden, sagte die Computerwissenschaftlerin und Biotech-Ingenieurin.

Zu den zahlreichen Lücken gehören laut dem Gründer von InstaDeep, Karim Beguir, dass Start-up-Firmen und -Manager auf dem Kontinent fehlten. In einer von Adji Bousso Dieng, der ersten schwarzen Computerwissenschaftlerin an der Universität Princeton, im vergangenen Jahr veranstalteten Diskussionsrunde zum Thema KI in Afrika, mahnte auch Beguir zu einem schnelleren Handeln.

Beguirs Firma galt als genau ein solches Start-up, wie es Afrikas KI-Szene aktuell noch fehlt. Es gibt noch einige andere, etwa den Softwarevermittler Andela oder das nigerianische Fintech-Unternehmen Flutterwave. Beguirs mit bescheidenem Startkapital aus dem Boden gestampftes Deep-Tech-Unternehmen gelte aber als Grundlagenentwickler. InstaDeep könne mit den Großen der Branche wie Google durchaus mithalten, versicherte Beguir.

Der aus Tataouine stammende Gründer versprach, dass seine Firma Open-Source-KI-Tools für die neue KI-Generation in Afrika zur Verfügung stellen werde. Die Open-Source-Tools, die InstaDeep auf seiner InstaChain Plattform zur Verfügung stelle, erlaubten es jedermann mit Laptop, eigene KI-Anwendungen und -Ideen zu entwickeln.

Anfang des Jahres hat Beguir InstaDeep verkauft, es gehört nun zum Mainzer Biotech-Unternehmen BioNTech. Dies hatte (wie auch die Deutsche Bahn und andere Unternehmen) zu den Abnehmern von KI-Anwendungen der generativen InstaDeep-Algorithmen gehört. Ob Beguir nun sein Versprechen noch einhalten kann, die nächste Entwicklergeneration – auch im Biotech-Bereich – mit Open-Source-Tools zu ermächtigen, ist abzuwarten. Beguir wollte sich dazu gegenüber heise online nicht äußern. BioNTech seinerseits ist durch eine eher rigide Politik bezüglich seiner geistigen Eigentumsrechte bekannt.

Ist die Geschichte vom ersten weltweit bekannten DeepTech-Konkurrenten afrikanischer Provenienz also ein zusätzliches Beispiel dafür, wie der Globale Norden die für ihn interessanten Rohstoffe schürft? "Ich würde es doch eher als Booster in den Arm der afrikanischen KI-Szene sehen wollen", meint Marwala. Das Interesse an einem Start-up werfe schließlich ein positives Licht auf die Innovationskraft des Kontinents. Zugleich erinnert er daran: InstaDeep habe schon vor dem Verkauf seine Zentrale im Vereinigten Königreich aufgeschlagen, wie übrigens auch andere afrikanische KI-Avantgarde-Unternehmen. Das deute noch auf eine "ganz andere Dimension der Diskussion" hin.

Gemeint ist damit die nach wie vor bestehende Orientierung des Nachwuchses am Ausland. Nicht nur zur Ausbildung gehen viele Nachwuchsforscher noch an US-amerikanische oder europäische Universitäten. Sie verlassen sich auch auf die Tools von dort.

Umkehren will diesen Trend eine wachsende Gruppe jüngerer Wissenschaftler, die vom Konzept der "Graswurzel-KI" schwärmen. Deep-Learning-Indaba-Koordinator Vukosi Marivate von der Universität Pretoria oder Jade Abbott, Mitbegründerin von Masakhane, sehen in ihren neuen Netzwerken ein Pfund, mit dem sich wuchern lässt.

Jede Region habe "ihre eigene Superpower", erklärte auch Beguir. Die USA hätten die besten Tech-Firmen. Europa sei spitze, wenn es um innovative Datenpolitik und die notwendigen Datenschutzkonzepte gehe. China besteche durch die Langfristigkeit seiner KI-Pläne. Die Besonderheit Afrikas sei eine besonders starke Community, meinte Beguir.

Das Paradebeispiel für Afrikas Grassroot-AI-Bewegung ist Masakhane, ein 2019 entstandenes Netzwerk, das sich um Natural Language Processing (NLP) für afrikanische Sprachen kümmert.

Masakhane-Mitgründerin Jade Abbot beschreibt das Ziel des Netzwerks als "die Entwicklung von NLP von Afrikanern für Afrikaner in Afrika." Der Anlass für die Gründung war laut der Informatikerin ein Blick auf eine Karte zu NLP-Veröffentlichungen weltweit. Afrika war darauf ein riesiger weißer Fleck, obwohl der Kontinent 2000 verschiedene Sprachen spricht. 75 davon werden von mehr als einer Million Menschen gesprochen. Viele Länder haben zehn oder mehr Sprachen. Auch eine Reihe nicht-lateinischer Schriften gibt es, etwa die äthiopische Silbenschrift.

Um die "weiße Landkarte" zu füllen, bedürfe es nach Ansicht von Abbott und einigen Mitgründern einer großen grenzüberschreitenden Anstrengung. Die Resonanz gibt den Gründern recht: über tausend Mitglieder gehören heute zum Netz und kümmern sich um mehr als 40 Sprachen in fast ebenso vielen Ländern. Anders als bei vergleichbaren Initiativen außerhalb des Kontinents gehe es bei Masakhane nicht darum, einfach nur die statistisch besonders häufig gebrauchten Sprachen auszuwählen und abzuarbeiten. Vielmehr entschieden Wissenschaftler, Informatiker, Sprach- und Kulturwissenschaftler vor Ort, worum man sich kümmert, sagte Abbot während einem ihrer vielen Auftritte.

Denn natürlich bemüht sich unter anderem auch Googles Team um die Integration nicht-europäischer Sprachen in seine Übersetzungsbots. 2022 fügte das Unternehmen eigens zehn zusätzliche afrikanische Sprachen hinzu. Insgesamt erlaubt Google Translate nun Übersetzungen in knapp zwei Dutzend afrikanische Sprachen. Fehlerfrei sind diese nicht, wie das Beispiel "Masakhane" selbst zeigt. Es ist isiZulu und heißt, wie das Netzwerk auf seiner Webseite erklärt, soviel wie "wir bauen zusammen". Google Translate übersetzt es hingegen mit "lasst uns zusammenkommen."

Eine Herausforderung für Masakhane besteht darin, dass Trainingsdaten in vielen afrikanischen Sprachen bei allem Sprachreichtum des Kontinents ein rares Gut sind. Im Internet sind die Sprachen kaum vertreten. Die "Netze" von Web Crawlern bleiben dementsprechend leer auf ihren Fischzügen. NLP-Forscher sprechen von "ressourcenarmen Sprachen". Es fehlt an originären Inhalten genauso wie an Wörterbüchern, in denen Sprache annotiert und kategorisiert wird.

"Viele Länder des Globalen Südens waren Kolonien, und das hat die Verfügbarkeit von Quellen für die entsprechenden Sprachen beeinflusst", sagt Marivate. Nicht selten sei in den Schulen der von Kolonialmächten beherrschten Länder das Sprechen der eigenen Sprache verboten gewesen, erklärte der Informatikprofessor, der Chair of Data Science an der Universität von Pretoria ist.

Sprachdaten, die man heute zu Trainingszwecken für Sprachmodelle heranziehe, seien nicht selten Bibelübersetzungen christlicher Missionare. Das könne zu religiöser Schlagseite führen. "Wir müssen sehen, wie wir damit umgehen", sagte Marivate.

Je länger man allerdings warte mit der Restaurierung und Entwicklung der eigenen Sprachressourcen, desto teurer werde es, so seine dringende Warnung. Seit dem Ende der Apartheid vor über dreißig Jahren habe man Pläne, etwa im Bildungsbereich Vielsprachigkeit und die entsprechenden Unterrichtsmittel einzuführen, aus Kostengründen immer wieder verschoben. "Am Ende ist das wie eine weit überzogene Kreditkarte. Die Schulden werden immer höher." Am Ende könnte der Kontinent ohne Entwicklung der eigenen digitalen Sprachressourcen doch zum Abladeplatz für Technologie aus dem Globalen Norden werden.

Gewinner und Verlierer (Anzahl der Sprachen, Anzahl der Sprecher und Prozentsatz der Gesamtsprachen für jede Sprachklasse)

(Bild: Under-resourced Languages (PDF))

Masakhane kümmert sich daher um alles, angefangen vom Sammeln der Daten. Marivati besorgte sich etwa die Nachrichtentexte des Südafrikanischen Rundfunks in den elf Sprachen Südafrikas. Dann wird annotiert, dazu wurden Studierende ins Boot geholt. Extradaten holte man sich aus Bibelübersetzungen und auch einem berüchtigten Datensatz, den zwei Forscher aus den parallel in 343 Sprachen veröffentlichten Webartikeln der Zeugen Jehovas gewonnen haben. Im Ergebnis wurden Nachrichten-Snippets in den südafrikanischen Sprachen mit über 60-prozentiger Genauigkeit kategorisiert, berichtet Marivate, ein Anfang. "Wir sind noch nicht bei über neunzig, aber wir arbeiten daran", erklärte er.

Weitere Arbeiten aus dem Kreis der Masakhane-Mitglieder haben bereits untersucht, wie gut die mit Bibel-lastigen Daten trainierten Modelle für Nachrichtentexte wirken. Es wird erforscht, wie sich die erarbeiteten Modelle auf nicht im ursprünglichen Trainingsset enthaltene Sprachen übertragen lassen. Auch bei der Erkennung von Namen in einem Satz afrikanischer Sprachen hat man Grundlagenarbeit geleistet. Die neuen Datensets sollen ebenso wie die Modelle in der Regel jedermann zur Verfügung gestellt werden.

Laut Abbott ist dafür auch in der Zusammenarbeit mit Partnern wie Google Vorsicht geboten. Gerne würden die Big-Tech-Unternehmen nämlich dazu einladen, die gemeinsam von Sprachwissenschaftlern und weiteren Partnern mühsam zusammengetragenen Daten an den hauseigenen Modellen der Datenriesen auszuprobieren. Dann wollen sie aber auch, dass die kleinen afrikanischen Partner Non-Disclosure-Agreements (NDA) unterschreiben. Die Gefahr liegt laut Abbott darin, dass am Ende dann der große Partner lizenziert und den Zugang beschränkt.

Das widerspricht der Philosophie der "Masakhanier". Denn sie wollen ja gerade eine Basis für KI im eigenen Kontinent schaffen und gehen dabei auch eigene Wege in ihren Publikationen. Statt wie in der traditionellen Wissenschaft üblich, werden in Masakhane-Papers nicht nur die schreibenden Autoren gelistet, sondern alle, die zur Forschung beigetragen haben. Manches Paper hat an die 50 Autoren.

Die Gemeinschaftsidee funktioniert gut. Für 2023 hat man sich wieder eine lange Liste von Forschungsprojekten vorgenommen. Unter anderem steht die automatisierte Erkennung von Hatespeech in 18 afrikanischen Sprachen auf der To-do-Liste. Außerdem geplant ist die automatisierte Übersetzung wissenschaftlicher Papers, oder doch wenigstens der Abstracts, in verschiedene afrikanische Sprachen – zur Dekolonialisierung des Wissenschaftsbetriebs.

Das Ökosystem von GrassrootAI laut Jade Abbott

Das Modell Masakhane, aus der Taufe gehoben in einer der von Marivate mitveranstalteten Konferenz Deep Learning Indaba, hat inzwischen Nachahmer im eigenen Land gefunden. Die Forschergruppe Sisonke Biotik etwa, die sich um KI in der Gesundheitsforschung kümmern will, nennt sich einen Masakhane-Fork. Außerdem gibt es ähnliche Grassroot-KI-Initiativen auf anderen Kontinenten, etwa Americas NLP (NLP for Indigenous Languages of the Americas).

Auch die jährliche Zusammenkunft Deep Learning Indaba, die KI und Machine Learning breiter abdeckt und dem wissenschaftlichen Nachwuchs ein Forum bieten will, wurde zur Marvatis Freude bereits kopiert. In Lateinamerika wurde Khipu gestartet, in den osteuropäischen Ländern die Eastern European Machine Learning Summer School und in Asien die South East Asia Machine Learning School. Eine afrikanische Idee wurde kopiert, sagt Marvati stolz. "Indaba war der Trendsetter für diese Entwicklung."

Um digitale Kluften zwischen Globalem Norden und Süden tatsächlich zu schließen, bleibt noch viel zu tun. Das zeigt nicht nur die wissenschaftliche Sisyphosarbeit von Masakhane, die zwar von einer Reihe von Partnern finanziell unterstützt wird, aber doch mit kleinem Budget haushalten muss. Neben dem Enthusiasmus für Graswurzel-KI könnte die Entwicklung in Afrika aber noch von etwas anderem profitieren: Die ägyptische KI-Expertin Radwan sieht die afrikanischen Länder bei der Haltung zur KI im Vorteil.

Anders als Europa, für das die Risiken der Technologie schwerer wiegen als die Chancen, sähen afrikanische Länder ein kleines Risiko und enorme Möglichkeiten. Aus afrikanischer Sicht laute die Frage, wie man in einem Riesensatz die bestehende Innovationslücke zum Westen überspringen kann und wie es gelingt, die Wirtschaftsentwicklung in einzelnen Sektoren zu beschleunigen und die digitale Kluft zu schließen, erklärt Radwan.

KI soll nicht zuletzt helfen, die Entwicklungsziele der Vereinten Nationen bis 2030 zu erfüllen, lautet das Credo. Ägypten hat daher die Entwicklung einer App auf den Weg gebracht, die Bauern von der Aussaat bis zum Verkauf ihrer Ernte unterstützen soll. Solche Public Private Partnerships seien sehr sinnvoll, findet Radwan, weil die öffentliche Hand damit auch Werte vorgebe.

Während sich Regierungen und Wissenschaftler bei "KI als Entwicklungshelfer" durchaus einig sind, wächst zurzeit eine Kluft in puncto Regulierung. Wissenschaftler befürchten laut der ägyptischen Expertin, dass mit immer mehr Bürokratie und Regulierung ihr Drive gebremst werde, "einfach coole Technologie" zu entwickeln. Kluge Regulierung müsse sich aber ohnehin auf die Regelung des Gebrauchs, nicht der Technologie an sich konzentrieren. Ein Vorbild sieht sie hier etwa in der EU-Medizinprodukteverordnung. Die ziele auf die Risiken für die Nutzer, nicht auf die Technik als solche.

Während sie in diesem Punkt einem Ideenimport positiv gegenübersteht, warnt die Informatikerin und Biotechnologin zugleich vor der Idee, schon jetzt auf globaler Ebene KI regulieren zu wollen. Viel besser sei es, Brücken zu bauen zwischen den regional entwickelten Regeln und sich vielleicht auf Grundsatzprinzipien zu einigen. Ein paar wenige würden reichen, meint sie, und das wäre besser als das aktuelle Chaos von fünfhundert Prinzipien-Papieren. "Wenn man fünfhundert hat, hat man im Grunde gar keine", sagt sie. Das wiederum kann nicht im Sinne derjenigen sein, die ihre Aufholjagd im KI-Bereich gerade erst begonnen haben.

(bme)