翻訳メモリの整合に関して考慮すべき3つの要素

作成者: サイマルトランスチーム｜2022/07/26 15:19:52

翻訳メモリ（TM）システムは、新規の翻訳プロジェクトにおいて、既存の翻訳済みテキストを再利用、すなわち「有効活用」する非常に有益な手段として、翻訳とローカリゼーションの業界で用いられています。つまり、このシステムでは過去の翻訳を使って翻訳メモリを作成します。

翻訳プロジェクトにおいて行われる全ての翻訳は、翻訳メモリデータベースにアップロードされます。リンギストは必要に応じていつでも、100％一致またはあいまい一致となるこれらの翻訳を利用することができます。こうすることで時間と費用を節約し、プラットフォームとバージョンの一貫性を維持することが可能です。

翻訳メモリの整合とは？

簡単に言えば、翻訳メモリの整合とは、リンギストがTradosやMemsourceなどのアプリケーションツールを使ってソースファイル（例：英語）とそれに対応する翻訳ファイル（例：フランス語）を用いて互いのセグメントを一致させることです。この作業が翻訳単位（TU）のリポジトリを作り上げ、今後の翻訳プロジェクトで活用可能な翻訳メモリとして保存されます。

蓄積した資料（過去の翻訳）がTMの形式で利用できない場合、次のようないくつかの理由が考えられます。業界における最も一般的なファイル形式はXLIFFとTMXの2種類で、どちらもXMLファイルです。

理由：

1. TMシステムへアクセスできない国内オフィスで翻訳されたため。

2. 納品物の一部としてTMを提供しない言語ベンダーによって翻訳されたため。

3. 翻訳ベンダーによる翻訳の質が悪く、その品質向上のための変更が翻訳ファイル上のみで行われ、TMには反映されていないため。

これは、過去の作業は無駄で、またいちからやり直さなければならないということなのでしょうか？いいえ、決してそのようなことはありません。こうした場合、「整合」と呼ばれるプロセスにより、これまで蓄積したテキストからTMを作成することが可能です。

1つ目の整合方法は、市場に流通する多くの自動化された整合ツールのいずれかを使用することです。対となるソースファイルとターゲットファイルをツールに読み込ませ、ファイル名をもとに連結させます。その各ペアのファイルで自動整合が行われます。

整合ツールはソースファイルとターゲットファイルの両方の構造を読み込み、ソースのテキストを、対になると予想される翻訳に1文ずつ一致させていきます。

整合ツールはここ何年もかけて非常に精巧になり、自動プロセスは通常優れた結果を出しています。

また、内部アルゴリズムに基づいて品質のスコアレポートを生成するツールもあります。このスコアは整合がどれだけ正確に行われたかを示します。

自動整合が行われたプロジェクトは、リンギストが検証することをおすすめします。リンギストはセグメントごとに確認を行い、正しい一致は確定し、間違った一致は訂正（あるいは必要に応じて削除）します。

例：

間違った一致とは、例えば、ソースの英語では2文に分かれている箇所が、翻訳文の流れをより良くするためにドイツ語では1文に訳出されていたとします。整合ツールはこれを認識せず、それ以降一致させるペアがずれてしまうということがあるでしょう。

しかしながら、一旦リンギストが必要な修正をすると、そこから先の自動整合を再度実行することで、間違っていた一致も更新されます。

この作業が完了すれば、全てのファイル上の承認済みセグメントが、お客様が選択したTMの形式に出力され、使用可能になります。場合によっては、自動整合のみを行い、リンギストによるチェックなしでTMを生成する方が良い場合もあるでしょう。

例えば、蓄積した資料が非常にシンプルで、整合がとても容易な短い文で構成されているような場合です。こうした場合、TMからの一致に「整合によるペナルティ」を適用することができます。

リンギストがこのTMを用いて新規の翻訳を行う際、全ての一致において、ある一定の一致率が自動的に差し引かれます。そのため、もしペナルティが10％に設定されると、100％一致は90％一致となり、リンギストの参考になるよう「整合」とタグ付けられます。90％一致は必要に応じて編集することで、確実に良い品質を確保できるようにできます。

翻訳を整合する前に考慮すべき要素とは？

整合結果の改善に役立つ次のような要素があります。

ソースファイルとターゲットファイルは同じ形式にすること。例えば、InDesignファイルとWordファイルでは翻訳メモリシステムでの処理がわずかに違います。フォーマットや可変情報は翻訳用のファイルにおいてタグに変換されます。整合ツールはこうしたタグをガイドとして使用しますが、ソースファイルとターゲットファイルでタグが異なっていると、本来可能なはずのセグメントの一致ができくなる恐れがあります。
ソースファイルとターゲットファイルが同じバージョンであること。ソースファイルは、最初の翻訳作業が完了したのち、情報の追加や余分なテキストの削除など、内容が更新されている可能性があります。一致に際して、翻訳されたターゲットファイルも同様に更新されていなければ、整合のプロセスは一層複雑になってしまいます。
翻訳されたファイルの言語品質が良好であること。原則として、整合のプロセスに既存翻訳の言語レビューは含まれません。そのため、お客様がこれらの翻訳の質に満足していることが重要です。作業を進めながら、リンギストがファイルのレビューを行うことも可能ですが、作業完了までに要する時間に影響します。

翻訳メモリの整合に要する時間は？

作業にかかる時間は、ソースファイルのワード数およびそのファイル形式に基づいて計算されます。SimulTransでは、MS Wordファイルの場合、1日あたり40,000ワードの整合が可能と見積られ、一方、InDesignやFramemakerなどその他の形式の場合には1日あたり20,000から25,000ワードほどになります。これには自動整合とリンギストによるチェックを含みます。

しかし、上述の要素も見積りの際に考慮する必要があります。

翻訳メモリの整合にかかる費用は？

費用はプロジェクトの大きさにより異なります。通常、このタイプの整合作業は時間単位で請求されます。そのため、ファイルや言語の組合せを確認した上で、見積りを作成します。

ファイルが翻訳メモリの整合に対応しているか確認しますか？

完全な記事を表示