Masakhane – “We build together”

MicrosoftTeams-image, Masakhane – pioneering participatory approaches to building African language technologies, for Africans, by Africans / Masakhane (INT), Credit: Masakhane Community

Obwohl 2000 der Sprachen der Welt afrikanisch sind, sind sie in der Technologiebranche kaum vertreten. Zurückzuführen ist das auf den Kolonialismus, der sich auf die Förderung, Erhaltung und Integration afrikanischer Sprachen ausgewirkt hat. Daraus resultierend werden im technologischen Raum ihre Namen, Kulturen, Orte und Geschichte nicht verstanden. Masakhane will das ändern. Sie wollen die Neuro-Linguistische-Programmier-Forschung in afrikanischen Sprachen, für Afrikaner*innen und von Afrikaner*innen stärken und vorantreiben. Der technologische Fortschritt soll im Sinne der Menschenwürde, des Wohlbefindens und der Gleichberechtigung erzielt werde. Durch integrative Gemeinschaftsbildung, offene partizipative Forschung und Multidisziplinarität sollen Afrikaner*innen diesen Fortschritt mitgestalten und sich zu eigen machen können. Jetzt sind sie dafür mit dem Ars Electronica Award for Digital Humanity des Bundesministeriums für Europäische und Internationale Angelegenheiten ausgezeichnet worden.

Was sind die Herausforderungen bei der Verarbeitung und Verwendung afrikanischer Sprachen im Technologiebereich, und wie versucht Masakhane, diese zu überwinden?

Chris Emezue: Zu den Herausforderungen bei der Verarbeitung afrikanischer Sprachen gehören der Mangel an maßgeschneiderten Technologien und Infrastrukturen, begrenzte Datensätze und Finanzierungsengpässe. Masakhane geht diese Probleme an, indem es eine Gemeinschaft von Forscher*innen aufbaut und die Datenerfassung erleichtert. Es zielt darauf ab, sprachliche Vielfalt, Datenknappheit und die Ressourcenknappheit zu überwinden, indem es Orientierung und Unterstützung bietet, das Engagement fördert und die Verfügbarkeit von Sammlungen verbessert.

Gibt es bestimmte Projekte oder Anwendungen, die von Masakhane vorangetrieben wurden?

Chris Emezue: Zu den Herausforderungen in der afrikanischen Sprachverarbeitung gehören maschinelle Übersetzung, Text-to-Speech, Named Entity Recognition (NER), Sentiment-Analyse und Part-of-Speech-Tagging. Gemeinschaftsprojekte wie MasakhaNER (https://arxiv.org/abs/2103.11811), MasakhaNEWS (https://arxiv.org/abs/2304.09972) und MasakhaPOS (https://arxiv.org/abs/2305.13989) haben zur Entwicklung von Datensätzen und Benchmarks beigetragen. Andere Initiativen konzentrieren sich auf die Entwicklung von Tastaturen für eine einfachere Spracheingabe und die Verbesserung der Qualität bestehender Datensätze. Die Entwicklung von Spracherkennung (https://arxiv.org/abs/2103.07762, https://arxiv.org/abs/2207.00688), maschineller Übersetzung (https://arxiv.org/abs/2204.04306, https://aclanthology.org/2022.naacl-main.223.pdf), afrikanischen Sprachdatensätzen und Sprachressourcen/-toolkits sind wesentliche Ziele. Diese Bemühungen unterstützen auch nachgelagerte NLP-Aufgaben wie NER, POS-Tagging und die Beantwortung von Fragen.

Credit: Masakhane Community

Welche Auswirkungen könnte Masakhanes Arbeit auf Bildung, Wirtschaft und kulturelle Vielfalt in Afrika haben?

Chris Emezue: Masakhanes Arbeit hat einen erheblichen Einfluss auf die Bildung und die kulturelle Vielfalt in Afrika gehabt. Durch die Erstellung von Datensätzen und Modellen für afrikanische Sprachen und die Erleichterung von Beiträgen afrikanischer Forscher*innen hat die Plattform die Hürden für die NLP-Forschung in Afrika gesenkt. Die Online-Präsenz der Plattform, Treffen und Workshops haben Forscher*innen die Möglichkeit gegeben, zur Förderung der NLP-Forschung in afrikanischen Sprachen beizutragen und zusammenzuarbeiten. In wirtschaftlicher Hinsicht erweitert Masakhane die Sprachtechnologiemärkte in Afrika und fördert die Erstellung lokaler Inhalte. In kultureller Hinsicht stärkt Masakhane die einheimischen Gemeinschaften durch die Unterstützung afrikanischer Sprachen, fördert die kulturelle Vielfalt und den Austausch und unterstützt die Integration durch die Verbesserung des Verständnisses und der Kommunikation in der eigenen Sprache. Darüber hinaus fungiert Masakhane als Inkubator für Forschungstalente, der Einzelpersonen in die Lage versetzt, die Zukunft zu gestalten und Entwicklungen in diesem Bereich zu beeinflussen.

Wie können Menschen, die an der Förderung afrikanischer Sprachen und Technologien interessiert sind, zu Masakhane beitragen?

Chris Emezue: Um zu Masakhanes Mission der Förderung afrikanischer Sprachen und Technologien beizutragen, können Einzelpersonen mehrere Schritte unternehmen. Erstens ist die Teilnahme an der Online-Community (Slack und Mailingliste) für den Aufbau von Kapazitäten und der Gemeinschaft als Masakhane-Mitglieder unerlässlich. Zweitens können Einzelpersonen die Arbeit auf verschiedene Weise unterstützen: Zusammenarbeit bei der Erstellung von Ressourcen (Datensätze/Tools) und Governance für bestehende Modelle oder projektspezifische Finanzierung sowie Sprachaktivismus und politische Arbeit von Einzelpersonen, die für Regierungen und NGOs arbeiten, um sich für Masakhane einzusetzen. Entscheidend ist, dass wir alle einbeziehen und die afrikanischen Sprachen als integralen Bestandteil des Prozesses betrachten, anstatt sie als separate Einheiten zu behandeln.

Was sind die Pläne und Ziele von Masakhane für die Zukunft?

Chris Emezue: Zu den Plänen und Zielen von Masakhane für die Zukunft gehören die Förderung der Zusammenarbeit in der afrikaspezifischen Forschung, die Betreuung und Ausbildung von jungen Forschern und Nachwuchswissenschaftler*innen im Bereich NLP, die Ausweitung der Sprachabdeckung, die Behandlung unterrepräsentierter Sprachen und dialektaler Variationen, die Verbesserung von Sprachtechnologieanwendungen und das Eintreten für die Bedeutung afrikanischer Sprachen in politischen Diskussionen.

Das Projekt kann während des diesjährigen Ars Electronica Festivals besichtigt werden. Die Festival Highlights findest Du hier.

Masakhane (https://www.masakhane.io) (Multinational) ist die OPEN RESEARCH, PARTICIPATORY, GRASSROOTS NLP INITIATIVE FOR AFRICANS BY AFRICANS, mit dem Ziel, die afrikanische Forschung im Bereich NLP auf die Landkarte zu bringen, indem die Probleme, denen NLP gegenübersteht, ganzheitlich angegangen werden. Masakhane wurde 2019 gegründet und hat seitdem über 2000 Forscher aus mehr als 30 afrikanischen Ländern versammelt, hochmoderne Forschungsergebnisse (einschließlich eines Wikimedia-Awards des Jahres 2021) für mehr als 38 afrikanische Sprachen an verschiedenen Orten veröffentlicht und eine blühende Community aufgebaut. Unser Ziel ist es, dass Afrikaner*innen diese technologischen Fortschritte in Richtung Menschenwürde, Wohlergehen und Gleichberechtigung durch integrative Gemeinschaftsbildung, offene partizipative Forschung und Multidisziplinarität gestalten und sich zu eigen machen.

, ,