Wer in der Schweiz Chatbots und andere KI-Applikationen entwickelt, muss sich irgendwann fragen, in welchen Sprachen die Sprachmodelle zuverlässig genutzt werden können. Die Antwort ist ernüchternd: Es sind weniger als erhofft.
Gemeinsam mit der Caritas Zentralschweiz entwickeln wir einen Chatbot, der Menschen gezielt über staatliche und sonstige Sozialleistungen informiert. Der Bot führt ein kurzes Gespräch mit der ratsuchenden Person und stellt gezielte Nachfragen, um auf relevante Leistungen hinzuweisen. So bekommen beispielsweise Studentinnen, Verwitwete, selbständig erwerbende Väter oder Geflüchtete die jeweils für sie relevanten Informationen.
Der Chatbot verarbeitet zudem Informationen aus Merkblättern, Handbüchern und Webseiten, um Fragen zu den empfohlenen Sozialleistungen verständlich zu beantworten. Damit soll sich jede Person selbständig und einfach informieren können.
Da der Bot nicht nur Schweizer:innen, sondern auch Menschen mit Migrationshintergrund unterstützen soll, stellt sich die Frage: In welchen Sprachen kann GPT eine verlässliche Hilfestellung gewährleisten?
GPT von OpenAI ist laut eigenen Angaben multilingual. Doch reicht das aus, um Gespräche über Sozialleistungen in verschiedenen Sprachen auf qualitativ hohem Niveau zu führen? OpenAI selbst gibt keine detaillierten Informationen zur Sprachkompetenz ihrer Modelle. Die offizielle Aussage lautet:
"The models are optimized for use in English, but many of them are robust enough to generate good results for a variety of languages. GPT-4 achieves robust performance on many multiple-lingual language tasks."
Befragt man ChatGPT nach seinen Sprachfähigkeiten, gibt das Modell folgende Selbsteinschätzung:
Also nur 7 Sprachen sehr gut… Der Übersetzungsdienst der Caritas Zentralschweiz arbeitet regelmäßig mit über 40 Sprachen. Letztes Jahr wurden am häufigsten Türkisch, Ukrainisch, Arabisch, Dari, Tigrinya, Persisch (Farsi), Russisch, Tamil, Portugiesisch, Albanisch und Pashto übersetzt. Einige dieser Sprachen fehlen in der Liste von GPTs stärksten Sprachen.
Wir testeten GPT4o mit der in Eritrea und Äthiopien verbreiteten Sprache Tigrinya – eine für die Caritas Zentralschweiz sehr relevante Sprache. Deutsche Chatbot-Konversationen wurden mittels der üblichen online-Übersetzungsdienste ins Tigrinya übersetzt, vom Bot verarbeitet und die Antwort wieder zurück ins Deutsche übersetzt. Das Ergebnis: unverständlicher Nonsens.
Grosse Sprachmodelle werden in jenen Sprachen zuerst entwickelt, die die grössten Märkte umfassen - sie müssen also wirtschaftlich relevant sein. Zweitens müssen genügend Trainingsdaten vorliegen. Je mehr Personen eine Sprache sprechen (bzw. schreiben und publizieren), desto mehr Trainingsdaten stehen zur Verfügung. Im Subsahara-Afrika gibt es eine enorme Diversität an gesprochenen Sprachen und ein Mangel an verfügbaren Daten für das Training von LLMs. Viele afrikanische Sprachen existieren zudem nur in mündlicher Tradition.
In Zusammenarbeit mit professionellen Übersetzer:innen der Caritas Zentralschweiz testeten wir den Chatbot in fünf weiteren Sprachen. Diese Übersetzer:innen sind sich gewohnt, auch den kulturellen Aspekt zu beachten und sie kennen das System der sozialen Sicherheit relativ gut. Das macht ihre Einschätzungen zur Sprachqualität für unseren Chatbot besonders wertvoll.
Eine weitere Erkenntnis: Die Übersetzung von Fachbegriffen hat Vor- und Nachteile: Sie erleichtert das Verständnis, kann aber zu ungenauen Übersetzungen führen.
Auf Basis der Tests werden wir den Chatbot vorerst nur in folgenden Sprachen anbieten:
Die KI-Welt dreht sich schnell. Die Anzahl zuverlässig nutzbarer Sprachen wird weiter wachsen.
Kennt ihr weitere Sprachen, die man mit GPT4o bedenkenlos nutzen kann? Wir freuen uns über Feedbacks und Erfahrungsberichte!
Die Entwicklung eines multilingualen Chatbots stellt in vielerlei Hinsicht eine Herausforderung dar – nicht nur aufgrund der beschriebenen Grenzen von GPT-4o. Wir sind der richtige Partner, um maßgeschneiderte, mehrsprachige Chatbots gezielt und effizient zu realisieren!
Nathalie Portmann zeigt, warum man einen modernen Chatbot nicht trainieren muss und wie man die besten Antworten aus ihm herausbekommt.
Nathalie Portmann zeigt, warum man einen modernen Chatbot nicht trainieren muss und wie man die besten Antworten aus ihm herausbekommt.