23.09.2021 09:15:00 / Verfasst von Alexandre Rallo
Stolpersteine beim Post-Editing maschinell übersetzter Inhalte
Die Zeit der regelbasierten und statistischen maschinellen Übersetzung (MÜ oder Machine Translation, MT) ist vorüber. Heutzutage arbeiten MT-Engines mithilfe neuronaler Technologie.
Da sie trainiert werden können, lassen sie sich spezifisch an Projekte anpassen. Jedoch verlangen immer mehr Kunden eine Nachbearbeitung (Post-Editing) dieser Übersetzungen, um sicherzustellen, dass die Qualität der MT-Ausgabe dem Ergebnis einer menschlichen Übersetzung nahekommt und eine projektübergreifende Konsistenz gewährleistet wird. Im Folgenden erfahren Sie, welche die häufigsten Stolpersteine sind, auf die ein Post-Editor stoßen kann, und wie diese aus dem Weg geräumt werden können.
Gleichgewicht
[Ausgeglichenheit, Ausgewogenheit, Stabilität]
Der erste Stolperstein bei der Nachbearbeitung liegt darin, das richtige Gleichgewicht zu finden. Post-Editoren sollten genau wissen, wann ein Text nachbearbeitet werden muss und wann nicht. Sie sollten weder nachlässig noch übereifrig handeln. Das hängt ganz von den spezifischen Projektanforderungen ab:
- Welche Textart liegt uns vor? Handelt es sich beispielsweise um eine simple „Kurzanleitung“ für eine benutzerfreundliche Software?
- Ist die allgemeine Satzstruktur kurz und einfach?
- Welche Qualitätsanforderungen stellt der Kunde?
- Manche Kunden haben ein sehr knappes Budget und legen eventuell großen Wert auf eine schnelle Lieferung der Übersetzung.
- Andere Kunden wiederum legen mehr Wert darauf, dass der Text sprachlich flüssig ist, und erwarten, dass die Qualität der einer menschlichen Übersetzung entspricht.
Demnach sollte Over-Editing – zu viel Nachbearbeitung – vermieden werden, da es die Fertigstellung eines Projekts verzögern kann. Andererseits leidet beim Under-Editing – zu wenig Nachbearbeitung – oftmals die Qualität.
Genauigkeit
[keinen [logischen] Fehler oder Widerspruch, keine Ungenauigkeiten, Unstimmigkeiten enthaltend]
Ist das richtige Gleichgewicht einmal gefunden, stehen Linguisten vor der nächsten großen Herausforderung: Die Richtigkeit maschineller Übersetzungen kann oft trügen.
Gemeint ist damit, dass der maschinell übersetzte Text zwar richtig zu sein scheint, aber tatsächlich eine Inkonsistenz in das Projekt einführt.
Hier sind Beispiele einer französischen und deutschen MT-Ausgabe:
EN Ausgangstext: Restart the computer the device is connected to before updating it.
DE MT-Ausgabe: Starten Sie den Computer, an den das Gerät angeschlossen ist, neu, bevor Sie es aktualisieren.
Auf den ersten Blick erscheint eine Nachbearbeitung nicht zwingend notwendig. Der Linguist müsste das Segment eigentlich nur noch bestätigen und könnte dann zum nächsten übergehen. Allerdings ist eine konsistente Verwendung von Terminologie ein absolut entscheidender Faktor. Wir müssen uns sicher sein können, dass die terminologischen Präferenzen des Kunden stets eingehalten werden.
Möglicherweise hat der interne Französisch-Korrekturleser des Kunden in diesem Fall darum gebeten, „device“ mit „dispositif“ zu übersetzen anstatt mit „appareil“. Da „device“ ein sehr häufig verwendeter Begriff ist, besteht eine hohe Wahrscheinlichkeit, dass die MT mitunter eine falsche Übersetzung dafür liefert, selbst wenn die Engine trainiert wurde.
Nachbearbeitungsprozesse sind oftmals langwierig und solche Ungenauigkeiten können somit schnell übersehen werden. Ein Abgleich mit dem Glossar bei der Qualitätssicherung kann dabei helfen, solche Inkonsistenzen in der Terminologie aufzudecken.
Syntax
[in einer Sprache übliche Verbindung von Wörtern zu Wortgruppen und Sätzen; korrekte Verknüpfung sprachlicher Einheiten im Satz]
Tags sind sehr nützliche und häufig verwendete Platzhalter, die direkt vom Ausgangs- in den Zieltext kopiert werden. Leider bereiten sie maschinellen Übersetzungssystemen oftmals Probleme, da die Syntax eines Satzes im Ausgangstext durch sie unterbrochen wird. Trotz aller Fortschritte auf diesem Gebiet kommt es gelegentlich weiterhin zu kleinen Problemen.
Ein solches Tagproblem könnte beispielswiese folgendermaßen aussehen:
EN Ausgangstext: Click on <b>Open</b> [TAG1] > [TAG2] > OK to complete the process.
DE MT-Ausgabe: Klicken sie auf <b>Öffnen</b> [TAG1] > [TAG2] > OK den Prozess zu beenden.
Hier wird deutlich, dass die Syntax im Ausgangstext durch die Tags und Pfeile unterbrochen wird. Die MT geht in diesem Fall davon aus, dass „OK to complete the process“ ein separater Satz ist und somit unabhängig übersetzt werden sollte, obwohl es sich dabei eigentlich um das Ende des gesamten zu übersetzenden Segments handelt. Dies muss von einem Post-Editor korrigiert werden.
Sprachfluss
[ohne Stocken; fließend, zügig]
Ob ein Text sprachlich flüssig ist, hängt auch damit zusammen, wie umfangreich die Nachbearbeitung ausfällt, und stellt somit eine besondere Herausforderung dar. Das zuvor genannte Gleichgewicht zwischen Under- und Over-Editing spielt hier eine wichtige Rolle. Orientiert sich die Übersetzung zu stark an der Syntax des Ausgangstextes, kommt es häufig vor, dass die MT-Ausgabe zwar gut verständlich ist, gleichzeitig aber in der Zielsprache nicht flüssig wirkt.
Hier sind weitere Beispiele in französischer und deutscher Sprache:
EN Ausgangstext: Please wait while the files are being updated. Then, restart the device.
DE MT-Ausgabe: Bitte warten Sie, während die Dateien aktualisiert werden. Starten Sie dann das Gerät neu.
Nachbearbeiteter Text: Warten Sie, bis die Dateien aktualisiert sind, und starten Sie dann das Gerät neu.
Die MT-Ausgabe ist in diesem Fall streng genommen nicht falsch, allerdings macht die Satzstruktur deutlich, dass der Text Wort für Wort aus dem Englischen übersetzt wurde. Der Lesefluss wird somit unterbrochen. Außer bei Texten, die nur eine leichte Nachbearbeitung erfordern, sollten Linguisten solche Fehler möglichst korrigieren, da sie ansonsten die sprachliche Flüssigkeit des Textes beeinträchtigen und stilistische Inkonsistenzen verursachen können.
Dieser Blogbeitrag zeigt nur einige der vielen Herausforderungen auf, die die Nachbearbeitung maschinell übersetzter technischer Dokumentationen mit sich bringt. Auch wenn in der heutigen Zeit MT-Engines immer leistungsstärker werden, ist die Expertise von Linguisten weiterhin unentbehrlich, um sicherzustellen, dass die Qualität und Konsistenz der Übersetzungen stets auf hohem Niveau liegen – und das ganz unabhängig von der Qualität der ursprünglichen MT-Ausgabe. Eine trügerische Richtigkeit der Übersetzung sowie durch Tags verursachte Probleme können mithilfe von strengen Kontrollen bei der Qualitätssicherung vermieden werden. Die sprachliche Flüssigkeit eines Textes kann hingegen nur von einem Post-Editor professionell nachbearbeitet werden.
Wenn Sie erfahren möchten, ob Ihre deutschsprachigen technischen Dokumentationen für die maschinelle Übersetzung und professionelle Nachbearbeitung geeignet sind, klicken Sie auf die Schaltfläche unten und erhalten Sie einen kostenlosen Bericht.
Themen: Artikel, Best Practices beim Übersetzen, Geschäftsstrategie, Lokalisierungstechnologie, Maschinelle Übersetzung
Verfasst von Alexandre Rallo
Alex has been working at SimulTrans since 2011. He holds a master’s degree in English History, Literature and Linguistics from Université Lumière Lyon 2. After a year teaching secondary school French in Dublin, he joined the company’s translation department – working both from France and Ireland – and has since been involved in the development of its MT program. Greatly attached to the languages he works with, he makes it a point to ensure the team’s deliveries are as fluent as can be. Outside of the office, Alex likes to read and travel.