Sotra-APP – Machine Translation (MT) für die sorbische Sprache (Deutsch > Obersorbisch) und sächsische Verwaltung

WITAJ-Sprachzentrum als Teil der Domowina − Bund Lausitzer Sorben e. V. arbeitet seit 2024 mit der t2k GmbH aus Dresden zusammen, um für Sprachlernende – Erwachsene wie Schüler – einfach zugängliche Möglichkeiten zu schaffen die Sorbische Sprache mittels KI im Alltag wie in pädagogischen Szenarien zugänglich zu machen.

Logo der Sotra Übersetzungs-App der Agentur t2k aus Dresden

Für welches Problem wurde durch das Projekt eine Lösung entwickelt?

In einem ersten Schritt wurde ein deutsch-tschechisches Übersetzungsmodell trainiert, da Tschechisch dem Obersorbischen ähnlich ist. So konnte das Modell mit einem recht großen Datensatz erlernen, deutsche Sätze in eine dem Tschechischen verwandte Sprache – Obersorbisch – zu übertragen. Auf diese Weise wird das Problem reduziert, dass für die obersorbische Sprache nur wenige Trainingsdaten zur Verfügung stehen. In einem zweiten Schritt fand das Training des Modells mit Deutsch-Obersorbisch statt. Dafür wurden über 1,8 Millionen Satzpaare verwendet. Diese stammen unter anderem aus dem monolingualen Korpus des WITAJ-Sprachzentrums. Mit Hilfe der genannten Techniken ist es gelungen, für die „kleine“ Sprache Obersorbisch ein neues besseres Übersetzungsmodell zu trainieren.

Das Projekt wird/wurde in Zusammenarbeit/Kooperation mit folgenden Beteiligten umgesetzt:

Dr. Beate Brězan (Leiterin) Domowina z. t. / Rěčny centrum WITAJ | Domowina e. V. / WITAJ-Sprachzentrum Postplatz 2 | 02625 Bautzen Telefon: +49 (0) 3591 550401 beata.brezanowa@witaj.domowina.de und Dr. Anne-Kathrin Schumann (Geschäftsführerin), t2k GmbH Beilstraße 14, 01277 Dresden Telefon: +49-351-27 51 97 74 E-Mail. ak.schumann@text2knowledge.de

weitere Informationen

nächster Beitrag
Nach oben