Von der technischen Funktionsweise her gesehen, nennt man diese Art der S2ST den Cascading-Ansatz, da mehrere Prozesse nacheinander ablaufen: Von der Spracherkennung über die maschinelle Übersetzung zur SprachsyntheseDigitalisierungSprachsynthese. Ein anderer Forschungsansatz besteht darin, diesen Ablauf durch den Verzicht auf die beiden Schritte der Spracherkennung und -synthese zu vereinfachen, und wiederum mit Hilfe Künstlicher Intelligenz (Google AI) ein direktes Dolmetschen („end-to-end speech-to-speech translation model“) von Sprache zu Sprache zu ermöglichen. Dazu werden die aufgenommenen Sprachdaten in Form von Schallwellen („Waveform“) ohne verschriftlichten Text direkt übersetzt, d.h. in Schallwellen einer anderen Sprache transformiert, wobei zusätzlich eine gewisse Ähnlichkeit zur Ausgangsrede (Modulation, Stimmlage, Emotion) gewährleistet werden soll. Die Forschung in diesem Bereich steckt noch in den Kinderschuhen, zeigt aber bereits das darin verborgene Potential, rednerspezifische Zusatzinformationen wie emotionalen Kontext mit einzubeziehen.
Anhand dieser Entwicklungen lässt sich zumindest eine Annäherung an die technologische Singularität auch für das Dolmetschen beobachten. Insgesamt könnte der Zusammenhang zwischen Mensch und Maschine im DolmetschenDigitalisierungMaschinelles Dolmetschen sowie die entsprechende Entwicklung folgendermaßen tabellarisch skizziert werden.
Mensch | Mensch + Maschine | Maschine |
Dolmetscher ortsgebunden | Dolmetscher über Internet | Maschine über Internet |
Maschine zur Recherche | Maschine zur Datenübertragung | Maschine zum Dolmetschen |
Simultan-, Konsekutiv- dolmetschen | RSI Remote Simultaneous Interpreting | S2ST Speech-to-Speech Translation |
Tab. 1:
Zusammenhang Mensch-Maschine im Dolmetschen
Dies ist aber nicht zwingend als lineare Weiterentwicklung zu sehen, sondern präsentiert sich zur Zeit eher als ein Nebeneinander der verschiedenen Bereiche, die in jeweils anderen Kontexten und in jeweils unterschiedlicher Frequenz in der Praxis oder experimentell mit all den damit verbundenen Vor- und Nachteilen eingesetzt werden. Dabei gilt es aber, die Auswirkungen und Folgen dieser Entwicklungen auf die mehrsprachige Kommunikation im Allgemeinen und letztlich auf Berufsprofile und Berufschancen im Besonderen zu beachten.
4 Folgewirkungen
Offensichtlich besteht ein Bedarf nach einer effizienten technologischen Lösung für das Problem der Mehrsprachigkeit, das den kostenintensiven Faktor Mensch reduziert bzw. ausklammert. Doch solange automatisierte Lösungen keine deutliche Verbesserung gegenüber dem Einsatz ausgebildeter Sprachmittler:innen aufweisen können, solange der Einsatz dieser Entwicklungen nicht nahtlos und einfach mit den Erwartungen und Anforderungen der Kommunikationsteilnehmer:innen in Einklang gebracht werden kann, bleibt menschliche Sprachmittlung unabdingbar. Die Gefahr, dass die Arbeit ausgeht, besteht zwar kurzfristig nicht, wie das die oben zitierten Statistiken und Umfragen zeigen, bleibt aber längerfristig in Hinsicht auf das Eintreten der technologischen Singularität mit all ihren sozialen Folgen bestehen.
Was uns bevorsteht, ist die Aussicht auf eine Arbeitsgesellschaft, der die Arbeit ausgegangen ist, also die einzige Tätigkeit, auf die sie sich noch versteht. Was könnte verhängnisvoller sein? (Hannah Arendt 1960: Vita activa oder Vom tätigen Leben)
Bis dahin wird sich die Arbeitswelt kontinuierlich weiterentwickeln und dabei die menschliche Arbeit von einfacheren Tätigkeiten befreien und auf höherwertige kognitive Leistungen fokussieren, die sich einer Automatisierung weitgehend entziehen. Der Schwerpunkt im Bereich der Sprachmittlung verschiebt sich dadurch von automatisierbaren Aufgaben hin zu Aufgaben der Planung, Organisation und Evaluierung, wodurch der Lern- und Vorbereitungsaufwand, aber auch die Verantwortung deutlich steigen. Es kommt zu verstärktem Wettbewerbs- und Preisdruck, der in Verbindung mit den Schwierigkeiten des RI für zusätzlichen Stress im Beruf sorgt. RI bedeutet darüber hinaus eine Isolierung vom Ort des Geschehens: Anstatt am Kongress aktiv vor Ort beteiligt zu sein, sitzt die DolmetscherinDigitalisierungArbeitsplatz zuhause vor dem Bildschirm in einer virtuellen Kabine. Reisen und Auslandsaufenthalte, zufällige Gespräche, Interaktion mit Konferenzteilnehmer:innen sowie Kontakte zu wichtigen Persönlichkeiten außerhalb der zu dolmetschenden Reden fallen weg und viele Dolmetscher:innen, die sich unter anderem auch aus solchen sozialen Gründen für den Beruf entschieden haben, würden dies bei ausschließlichem RI nicht mehr tun. Neben dieser Art der EntfremdungDigitalisierungEntfremdung (vgl. Marx 1844/2017) von anderen Menschen bzw. vom menschlichen Gattungswesen durch das RI fügt die maschinelle Übersetzung beim S2ST die Entfremdung vom Produkt hinzu, das der Algorithmus ohne Zugabe des Menschen fertigt, bzw. ohne kreativen Umgang des Menschen mit Sprache aus Versatzstücken bestehender Übersetzungen zusammenstellt. Diese vom Menschen produzierten Übersetzungen werden lediglich im Trainingsstadium des maschinellen Übersetzungssystems und daher unabhängig vom Zeitpunkt des automatischen Dolmetschens eingebunden. Noch dazu ist den Benutzer:innen eines solchen Systems nicht bekannt, von wem, wann und unter welchen Bedingungen die zugrundeliegenden Übersetzungen zustande gekommen sind. Zur Entfremdung vom Werkzeug, das andere herstellen, kommt damit auch die Entfremdung von der eigenen Tätigkeit, die durch die Maschine aus der Arbeit unbekannter anderer entsteht. Grundsätzlich führt das maschinelle ÜbersetzenDigitalisierungMaschinelles Übersetzen zu einem ungelösten Konflikt zwischen Mensch und Maschine, da kein System ohne Daten, d.h. ohne menschliche Übersetzungen, funktionieren kann. Damit ist die Maschine gerade von dem abhängig, was sie vorgibt zu ersetzen.
Translation als Remix aus Input-Daten (vgl. Sandrini 2013) ist eigentlich nichts Neues, hatte doch schon Nida (1959) angesichts komplexer Äquivalenzbeziehungen Informationsverlust, Informationsgewinn und Informationsänderung als Konstanten des Übersetzens beschrieben (Prunč 2012:104). Ein maschinelles Übersetzungssystem kann Informationen ausschließlich aus bestehenden Übersetzungen lernen und keine anderen Informationsquellen wie Kontext und SkoposSkopos einbeziehen, wodurch Informationsverlust und Informationsänderung, gewollt oder ungewollt, immer wieder vorkommen. Was die Maschine aber grundsätzlich nicht kann, ist eine an den Kommunikationszweck angepasste Informationsanreicherung. Darin liegt die Stärke des Menschen, die durch eine entsprechende Ausbildung gewährleistet werden muss.
5 Erweiterung der Anforderungsprofile
Die besten Zukunftsaussichten werden allgemein zwei Arten von Tätigkeiten zugesprochen: Zunehmender Technologieeinsatz erfordert erstens hochspezialisierte Arbeitskräfte, die mit Daten umgehen können und entsprechende Qualifikationen besitzen: „Data analysts, which companies expect will help them make sense and derive insights from the torrent of data generated by technological disruptions“ (World Economic Forum 2016 zitiert in Wörwag & Cloots 2018:46). Dies gilt auch für die TranslationTranslationals Sprachdienstleistung: Alle Arten von Daten, die im Zusammenhang mit Übersetzungen und Mehrsprachigkeit anfallen, von Translation-Memories über Terminologie und Textkorpora bis hin zu Segmentierungsregeln und Auftragsspezifikationen (Melby et al. 2013), müssen für eine optimale Nutzbarkeit in verschiedenen Formaten aufbereitet, gespeichert und verwaltet werden. Eine weitere zukunftsträchtige Tätigkeit liegt darin, komplexe Dienstleistungen und technologische Angebote verständlich zu machen und eine beratende Vermittlerrolle zwischen automatisierter Produktion und Kund:innen einzunehmen:
To become skilled in commercializing and explaining their offerings to business or government clients and consumers, either due to the innovative technical nature of