Amazons ‚Alexa‘, ‚Cortana‘ von Microsoft, Googles ‚Assistant‘ oder ‚Siri‘ von Apple: Die diversen verfügbaren Sprachassistenten können mittlerweile Erstaunliches leisten und werden trotz der Skepsis von Datenschützern immer beliebter. Doch obwohl die Schweiz eins der Länder mit der höchsten Smartphone-Dichte ist, konnten sich die Sprachassistenzsysteme hier bislang noch nicht so recht durchsetzen. Der Grund: Die Apps haben so ihre Schwierigkeiten, das Schweizerdeutsch zu verstehen. Etwa die Kollegin des Schweizer Radio und Fernsehens SRF, die wissen möchte, ob es am Wochenende schneien wird:
„Chunds das Wochenend cho schnaia? / Grüß dich! / Musch mi ned grüssa. / Ich verstehe leider nicht, was du mit ‚und das Wochenende’ meinst.“
Auch der SRF-Kollege, der „öppis ässä“ – also „etwas essen möchte“ – bekommt eine andere Antwort als die, die er erwartet hat:
„I wette öppis ässa. / Du scheinst keine App mit dem Namen ‚Besato’ zu haben. Wenn du möchtest, kann ich im App-Store danach suchen. / Nei nei, isch scho guat.“
Bei Schweizer Dialekten verstehen Sprachassistenten zu häufig nur Bahnhof – also nichts:
„Tut mir leid, das habe ich nicht mitbekommen. / Tut mir leid, da ist was schiefgelaufen. / Bitte probiere es noch mal.“
Entweder verkündet die freundliche Stimme höflich, dass sie etwas nicht verstanden, mitbekommen hat, oder dass irgendein Fehler gemacht wurde, etwas schiefgelaufen ist. Doch ab und an haben auch Schweizer im Umgang mit Sprachassistenten ein Erfolgserlebnis:
„Wenn fahrt der Zog for uff Fribourg? / Ich suche nach der Wegbeschreibung mit öffentlichen Verkehrsmitteln, Ziel: Freiburg. / Suppr!“
Dass digitales Verstehen künftig nicht von Zufällen abhängt, hat sich der Kommunikationswissenschaftler David Imseng auf die Fahnen geschrieben – gewissermaßen aus einem Eigeninteresse heraus. Er ist nämlich im Schweizer Kanton Wallis aufgewachsen, also dort, wo man zwei Sprachen spricht: Schweizerdeutsch und Französisch. Der Experte für multilinguale Spracherkennung hat 2014 ein Start-up namens „recapp IT“ gegründet. David Imsengs Ziel: eine Software, bei der das Mikrofon quasi zur Tastatur wird.
„Unsere Vision ist, dass wir die Spracherkennung dem Schweizer Volk zur Verfügung stellen können.“
Mithilfe künstlicher Intelligenz soll sich das Spracherkennungssystem des Schweizers an neue Dialekte, Sprachen und Sprecher anpassen können. So soll es sämtliche in der Schweiz gesprochenen Sprachen zuverlässig erkennen und in Text umsetzen können: Französisch, Italienisch, Rätoromanisch, Hochdeutsch und eben auch Schweizerdeutsch. Doch da es „das eine“ Schweizerdeutsch nicht gibt, verbinden sich mit den im Alpenland gesprochen Dialekten drei – wie er es nennt – Herausforderungen:
„Schweizerdeutsch ist schwierig, weil es akustisch sehr variabel ist, weil es nicht existiert in geschriebener Sprache und weil nicht viele Daten vorhanden sind, um entsprechende Systeme zu trainieren.“
Dass es in den verschiedenen Schweizer Dialekten unterschiedliche Aussprachevarianten oder gar komplett unterschiedliche Bezeichnungen für gleiche Dinge gibt, kann die automatische Spracherkennung oft lernen – aber immer klappt es leider nicht:
„Beispielsweise wird das Wort ‚Maus‘ in einigen Regionen, also zum Beispiel im Walliser Deutsch ‚Mü:s‘ ausgesprochen, in der Deutsch-Schweiz dann vielleicht als ‚Mu:s‘, dann ist es naheliegend für den Computer, dass das Wort ‚Haus‘ entsprechend als ‚Hü:s‘ oder ‚Hu:s‘ ausgesprochen wird. Dann gibt es aber auch Wörter, die einfach speziell ausgesprochen werden in verschiedenen Regionen. Der Apfelrest ist so ein Beispiel, das auf etwa 50 verschiedene Arten gesagt wird in der Schweiz. Aber auch ganz alltägliche Gegenstände wie zum Beispiel ein Kühlschrank wird einerseits in der Deutschschweiz als ‚Chüelschrank‘ bezeichnet. Und bei uns hier im Wallis wär' das der ‚Frigo‘. Und das kann der Computer dann natürlich nicht lernen.“
Es sind nicht nur solche Begriffe, die normalen Spracherkennungsprogrammen Probleme bereiten. Auch allein zig Varianten für das nach dem Essen übriggebliebene Kerngehäuse des Apfels wie etwa ‚Bütschgi, Gigertschi, Gigetschi, Gröibschi, Grübschi‘ würden jedes normale Sprachassistenzsystem in die Knie zwingen. Für Varianten wie diese müssen quasi per Hand spezielle Datenbanken angelegt werden. Auch im Schweizerdeutschen übliche Zusammenziehungen und Füllworte stellen für die Spracherkennung ein Problem dar, sagt David Imseng und nennt Beispiele:
„‚fürne‘ – ‚für einen‘, zum Beispiel. Oder ‚vorrem‘ – ‚vor dem‘. Dann gibt es auch Ausdrücke wie zum Beispiel ‚es chund cho go rägna‘. Und das würde man ja dann nicht transkribieren als ‚es kommt kommt kommt regnen‘. Und das liest sich dann entsprechend auch ein wenig lustig.“
Der Software die vielen Spezialfälle der schweizerdeutschen Dialekte beizubringen, ist aufwendig und kostenintensiv und somit für Google, Apple, Amazon und Co. nicht attraktiv. Gleichzeitig sei das aber eine Chance für das Start-up aus dem Wallis, meint David Imseng:
„Der Schweizer Markt mit den vielleicht sechs bis acht Millionen Leuten, die Schweizerdeutsch sprechen, ist relativ klein. Die Großkonzerne konzentrieren sich in erster Linie darauf, mit möglichst kleinem Aufwand natürlich möglichst große Bevölkerungsgruppen zu adressieren.“
Die großen Konzerne wollen mit ihren Spracherkennungsprogrammen am liebsten Menschen ansprechen, die eine der gängigen Weltsprachen beherrschen. So stehen Entwicklungsaufwand und Nutzen in einem besseren Verhältnis. David Imseng hat somit eine Nische entdeckt. Die recapp-IT-Software funktioniert bei eingegrenzten Themengebieten schon ganz gut. Bis eine universelle App vorliegt, die Schweizerdeutsch verstehen kann, dauert es aber noch, meint David Imseng. Denn er leiste quasi Pionierarbeit, auch wenn es schon jetzt ab und an Erfolgserlebnisse gibt:
„Versteisch du Schwiizerdütsch? / Ich spreche viele Sprachen.“