05.02.2025 06:41:57 / Verfasst von Adam Jones
Die Risiken maschineller Übersetzung für Translation Memorys
Wir bei SimulTrans erhalten von Neukunden regelmäßig eigene Translation-Memory-Dateien, die uns wiederum dabei helfen, die sprachliche Konsistenz lokalisierter Inhalte zu erhöhen, Kosten zu senken und Prozesse zu beschleunigen. Leider stellen wir jedoch immer häufiger fest, dass die Qualität dieser Translation Memorys aufgrund maschineller Übersetzungen zu wünschen übrig lässt.
Bei der Übersetzung neuer Inhalte werden viele Segmente automatisch mit übereinstimmenden Einträgen (sogenannte „100%-Matches“) aus dem Translation Memory gefüllt. Wenn der Kontext der in der Datenbank gespeicherten früheren Übersetzungen beibehalten wird, liegt die Trefferquote sogar noch höher („101%-Match“). In der Vergangenheit konnte man sich in der Regel darauf verlassen, dass es sich hierbei um qualitativ hochwertige Übersetzungen handelte, die zuvor bereits überprüft wurden und daher nur wenig oder gar keine Bearbeitung erforderten. Dies ist mittlerweile leider nicht mehr der Fall.
Viele dieser Segmente basieren auf qualitativ minderwertigen maschinellen Rohübersetzungen, die weder gelesen noch nachbearbeitet wurden. Zudem ist im Gegensatz zu neuen maschinellen Übersetzungen, die einem Post-Editing unterzogen werden, die Herkunft dieser Segmente nicht unmittelbar erkennbar. Sie sind mit keiner „MT“-Kennzeichnung versehen, die uns darauf hinweisen würde, dass sie besondere Aufmerksamkeit benötigen. Einige Segmente sind sogar automatisch gesperrt, um zu verhindern, dass unsere Übersetzer Änderungen am bereits veröffentlichten Text vornehmen können, selbst wenn dieser Fehler enthält oder die Qualität mangelhaft ist.
Im folgenden Beispiel handelt es sich bei dem Translation-Memory-Match um eine maschinelle Rohübersetzung. Da es keinerlei Hinweise auf die Herkunft des Eintrags gibt, würden viele Übersetzer vermutlich davon ausgehen, dass der Text nicht überprüft werden muss:
Normalerweise wird eine maschinelle Übersetzung mit „MT“ gekennzeichnet, damit Übersetzer sofort wissen, dass der Inhalt sorgfältig überprüft und bearbeitet werden muss. Bei maschinellen Übersetzungseinheiten, die bereits gespeichert wurden, ist dies nicht der Fall.
Im Laufe der Zeit führt dies dazu, dass die Qualität von Translation Memorys durch den zunehmenden Umfang an maschinell übersetzten Segmenten immer mehr beeinträchtigt wird. Jedes neue Projekt, das KI-basierte Fehlübersetzungen oder Ungenauigkeiten enthält, zerstört somit den wertvollen Bestand an professionellen Übersetzungen und handverlesener Terminologie, der über Jahre hinweg mühsam von Experten aufgebaut wurde.
Das Problem vervielfacht sich zudem, wenn Sie Ihr verunreinigtes Translation Memory verwenden, um damit Ihr maschinelles Übersetzungstool zu trainieren und zu aktualisieren.
Schützen Sie Ihre Translation Memorys
SimulTrans nutzt effektive Methoden, um zu verhindern, dass Translation Memorys durch maschinelle Übersetzung verunreinigt werden. Sie können dasselbe tun.
Vermeiden Sie die Speicherung maschineller Übersetzungen
Die naheliegendste und einfachste Lösung ist, den maschinell übersetzten Text überhaupt nicht im Translation Memory zu speichern. Wenn Sie keine zusätzliche Zeit investieren, um die Übersetzung nachzubearbeiten und zu perfektionieren, macht es wenig Sinn, den Text aufzubewahren und wiederzuverwenden.
Selbst wenn Sie ein großer Fan der maschinellen Übersetzung sind, sollten Sie nicht zulassen, dass solche Rohübersetzungen im Translation Memory landen. KI-Übersetzungstools entwickeln sich ständig weiter. Der Output, den wir heute verwenden, wird schon in naher Zukunft nicht mehr aktuell sein, was die Verwendung älterer maschineller Übersetzungen überflüssig macht. Zudem geben Übersetzungsmanagementsysteme in der Regel den Einträgen der Translation Memory Vorrang vor der maschinellen Übersetzung, was dazu führen würde, dass Ihre gespeicherte alte maschinelle Übersetzung Vorrang vor dem neuen und optimierten KI-Output hätte. Um immer auf dem neuesten Stand zu sein und sicherzustellen, dass Sie stets mit den aktuellsten neuronalen Technologien arbeiten, sollte die Nutzung von Translation Memorys mit unbearbeiteten maschinellen Übersetzungen daher vermieden werden.
Erstellen Sie ein separates Translation Memory
Wir wissen, dass der Einsatz maschineller Übersetzungstools manchmal unumgänglich ist. Die Inhalte sollten jedoch idealerweise immer einem Post-Editing unterzogen werden. In diesen Fällen können Sie die Übersetzung in ein separates Translation Memory übertragen. Übersetzungstools ermöglichen es Übersetzern in der Regel, auf mehrere Übersetzungsspeicher zuzugreifen und aus allen zu lesen, während sie in einem arbeiten.
Profitieren Sie von Ihrem hochwertigen Translation Memory, ohne es zu verunreinigen, indem Sie ein separates Translation Memory für maschinelle Übersetzungen erstellen. Schützen Sie Ihre professionell übersetzten Inhalte durch die Verwendung einer speziellen Memory-Datenbank, um so dafür zu sorgen, dass sie nicht durch qualitativ minderwertige KI-Outputs verunreinigt werden.
Bei der Anwendung des von Ihnen erstellten Translation Memorys können Sie Prozentsätze als sogenannte „Abzüge“ festlegen, um dafür zu sorgen, dass Matches mit einer geringeren Prozentzahl angegeben werden, um so eine Überprüfung der Segmente – wie im obigen Beispiel gezeigt – zu erzwingen. So können Sie verhindern, dass Übersetzer automatisch davon ausgehen, dass häufig fragwürdige Übereinstimmungen qualitativ einwandfrei sind.
Achten Sie auf parallel bestätigte Übersetzungseinheiten
In den meisten Übersetzungstools – wie Phrase, XTM, Trados und memoQ – werden Segmente im Translation Memory gespeichert, sobald sie vom Übersetzer bestätigt werden.
Es kann jedoch vorkommen, dass diese Segmente nicht einzeln nacheinander abgearbeitet werden, sondern dass durch ein paar einfache Tastenkombinationen direkt die gesamte Datei bestätigt wird. Dies kann katastrophale Auswirkungen haben! Bei einigen Linguisten kann es zudem der Fall sein, dass sie lediglich offensichtliche Fehler korrigieren und beim Rest des maschinell übersetzten Textes davon ausgehen, dass dieser akzeptabel ist. Die Segmente werden dann ohne genaue Prüfung ins Translation Memory aufgenommen.
Dies zu verhindern ist zwar schwierig, ein solches Vorgehen ist in der Regel allerdings leicht erkennbar. Ein Blick auf die Metadaten von Translation Memorys genügt. Wenn beispielsweise eine Vielzahl von Übersetzungseinheiten dasselbe Datum und dieselbe Uhrzeit aufweisen, ist die Vermutung naheliegend, dass sie nicht einzeln bestätigt wurden. Auf diese Weise können Sie die Person einfach entlarven. Löschen Sie diese Einträge aus Ihrem Translation Memory und sorgen Sie dafür, dass der Übersetzer die Segmente noch einmal sorgfältig nacheinander bearbeitet.
Ist Ihr Translation Memory verunreinigt?
Wir bei SimulTrans unterstützen Sie gerne, indem wir Ihr Translation Memory analysieren, um festzustellen, inwiefern die Qualität Ihres Übersetzungsspeichers durch maschinell übersetzte Einträge beeinträchtigt ist. Laden Sie ganz einfach Ihre TMX-Datei hoch. Mithilfe unseres eigenen Algorithmus erstellen wir eine entsprechende Bewertung für Sie.
Verfasst von Adam Jones
Als Präsident und Chief Operating Officer steuert Adam Jones die weltweite Tätigkeit von SimulTrans. Zuvor verantwortete er über 25 Jahre lang Kundenkontakt, interne Produktionsabteilungen und sonstige operative Vorgänge. Bevor er zu SimulTrans kam, war er bei Oracle Corporation im Bereich Strategic Accounts tätig. Adam Jones ist Absolvent der Stanford University, wo er Politikwissenschaft mit Schwerpunkt Bildung studiert hat. Der Bildungspolitik ist er durch sein Engagement in der lokalen Schulverwaltung und damit verbundenen Non-Profit-Organisationen treu geblieben.