2024/10/10 / 執筆 Margarita Núñez
AIを活用した機械翻訳
弊社のお客様から、翻訳業界における人工知能(AI)の活用に関してよく質問を受けます。AIとは何か、また、ビジネスコンテンツの翻訳時にAIがどのように活用されるかについて、混乱が生じているようです。AIを活用した機械翻訳システムを説明する際、高度な機械翻訳、AI翻訳、AI言語翻訳、またはAI言語翻訳ツールと呼ばれたりします。用語をシンプルにするため、このブログでは「AI翻訳」と呼ぶこととします。
このトピックに関してお客様から最もよく寄せられる質問への回答については、以下をお読みください。
人工知能とは何ですか?
人工知能(AI)とは、通常は人間が行うタスクを実行する能力を備えたコンピュータシステムの構築です。AIには、その機能を推進する様々な主要コンポーネントや技術が含まれます。
翻訳業界に関連する3つの例を以下に示します。
- 機械学習(ML):アルゴリズムと統計モデルを利用し、膨大なデータを活用して時間の経過とともにコンピュータのパフォーマンスを向上させます。
- ニューラルネットワーク:情報を処理して伝達する相互接続されたノード、つまりニューロンで構成されています。
- 自然言語処理(NLP):自然言語を使用したコンピュータと人間の対話を円滑にします。これにより、機械は人間の言語を理解し、解釈し、生成できるようになります。
これらのコンポーネントはAIの基盤を形成し、様々な業界でのAIの活用を可能にし、タスクの達成方法に革命をもたらします。
翻訳におけるAIの役割とは?
翻訳におけるAIとは、人工知能技術、特に機械学習や自然言語処理を使用して、テキストまたは音声を、ある言語から別の言語に自動的に翻訳することを指します。目標は、人間の介入なしに、様々な言語間でコンテンツの意味を正確かつ流暢に伝えることができる自動翻訳システムを構築することです。
統計モデルやルールモデルに依存する従来の機械翻訳と比較して、AIを活用したシステムには次のような利点があります。
- より高いレベルの精度の提供
- 実装とカスタマイズが容易
- よりコスト効率の高いプロセスの実現
AI翻訳はニューラル機械翻訳と同じですか?
AIはそれ自体、ニューラル機械翻訳の基本的なコンポーネントです。これにより、高度なアルゴリズムとデータ駆動型モデルに依存して、機械は自然言語処理を使用してテキストと音声を解釈し、ある言語から別の言語に変換できるようになります。
同時に、AI翻訳システムには、文脈と言語構造の理解を強化する最先端のニューラルネットワークとディープラーニングの手法が組み込まれており、翻訳の精度と流暢さが保証されます。
AI翻訳は大規模言語モデルとは異なりますか?
ChatGPTのような大規模言語モデル(LLM)は、自動ローカリゼーションプロセスを変革し、一般的なコンテンツを比較的正確に翻訳するのに役立ちます。しかし、翻訳にLLMを使用すると、AI/ニューラル機械翻訳と比較して、専門性と文脈理解の欠如、用語集やスタイル、または口語表現の使用における一貫性の欠如、品質管理の弱さ、「幻覚」(事実上は不正確または無意味であるが、筋が通っていて文法的に正しい翻訳)の採用、文化的ニュアンスの対応不足など、特定の欠点があります。しかし、LLMは急速に進化しているため、近い将来、AI/ニューラル機械翻訳ソリューションにさらに密接に統合されるようになるのも、不思議ではありません。
AI翻訳の導入
AI翻訳システムは、より多くのデータを処理するにつれて継続的に学習し、パフォーマンスを向上させます。次のような様々なアプリケーションに導入できます。
- Webサイトのローカライズ:様々な言語のユーザ向けに、Webサイトを適応させます。
- 文書の翻訳:文書、記事、その他の書面によるコンテンツを自動的に翻訳します。
- リアルタイム翻訳:生の会話やイベント中に即時翻訳を提供します。
- チャットボットとバーチャルアシスタント:顧客サポートやバーチャル アシスタント アプリケーションで多言語コミュニケーションを可能にします。
AI翻訳にかかる費用はどのくらいですか?
高度なAI翻訳システムを使用してコンテンツを翻訳する場合のコストは、言語によって異なります。通常、発生するコストは、AI翻訳用のコンテンツの準備、AI翻訳エンジンとの統合、AI翻訳されたコンテンツの生成に関連するものです。
情報提供のみを目的としている場合は、AIのみで翻訳された文書を免責事項付きで公開することも選択できます。ただし、AI翻訳されたコンテンツは、通常、ある程度のポストエディットを行わない限り、プロフェッショナルな、顧客向けの公開には適しません。
ポストエディットとは、AI翻訳されたテキストを修正し、クライアントが求める、公開可能な品質の「合意レベル」を満たすようにすることです。レベルには2種類あります:フルポストエディット(人間による翻訳出力と類似したレベル)とライトポストエディット(正確性、流暢さ、構文、文法のみに重点を置いたレベル)です。ポストエディットはエディットと同じではありません。エディットとは、人間が作成したテキストを修正するプロセスです。
ポストエディットディスタンスとは、AI翻訳後のテキストにリンギストが加えた変更の割合であり、正確性、流暢さ、構文、文法の点で期待される品質レベルに準拠したコンテンツを生成します。
AI翻訳されたコンテンツのポストエディットにかかるコストは、ポストエディットする単語数、期待されるポストエディットのレベル、修正にかかる時間によって異なります。
AI翻訳に適したファイル形式は何ですか?
AI翻訳は、ローカリゼーションに適した形式であれば、あらゆる種類のファイルを処理できます。これらには以下が含まれます:
- OfficeやAdobe Creativeなどの一般的なアプリのデスクトップファイル
- XML、HTML、XLIFFなどのタグベースのファイル
- キーバリュー型のソフトウェアファイル:JSON、YAML、Strings、POなど
SimulTransは、翻訳前の準備または翻訳後の処理によって、その他のファイル形式にも対応することができます。
AIローカリゼーションの専門家との有料コンサルテーションを予約し、ローカリゼーションプロセスの一部としてAIを統合する方法について相談してみませんか。
AI翻訳に適したコンテンツの種類は何ですか?
AI翻訳は、ほとんどのコンテンツタイプのローカライズに適していますが、非常にクリエイティブなマーケティングコピーの翻訳には推奨されません。コピーライティングでは、メッセージを伝えるために、文化的背景に合わせた翻訳にすることが多いためです。AI翻訳に適したコンテンツの種類には、ドキュメント、コミュニケーション、説明文、ユーザインターフェイス、ヘルプやナレッジベース、および一般的な法律、医療、マルチメディアコンテンツが含まれます。
AI翻訳はどの言語をサポートしていますか?
最先端のエンジンは、アルバニア語からズールー語まで、100以上の言語に対応しています。また、英語以外の限られた言語セットのソースコンテンツを処理することもできます。
AI翻訳にはどのくらい時間がかかりますか?
SimulTransは、AI翻訳を使用してあらゆる予定に対応できます。コンテンツへのAI翻訳の適用にはそれほど時間はかかりませんが、プロジェクトでポストエディットが必要な場合、スケジュールはワード数、コンテンツの複雑さ、担当するリンギストの数によって異なります。ポストエディタは通常、1日に約7,000ワードを処理できます。SimulTransの複数のリンギストが同時に作業を行うため、お客様の予定が対象言語の数に左右されることはありません。
AI翻訳の品質をどのように測定しますか?
従来、機械翻訳出力の品質測定を行うために、BLEU、TER、METEORなどの自動化された品質スコアや指標が使用されてきました。しかし、AI翻訳の出力が大幅に改善されたため、これらは現在では時代遅れになっています。
翻訳品質の評価は、翻訳品質を評価するために最近開発されたAIを活用した機能に依存しています。これらの機能は、どの程度のポストエディットが必要になるかを予測できるアルゴリズムに基づいています。人間の翻訳者が様々なエンジンからの翻訳を比較して、特定のコンテンツに最適な出力を提供するエンジンを判定することで、品質を評価することもできます。
最後に
AIを活用したアプリケーションは、医療、金融、製造、輸送など、様々な業界で普及しています。これらのテクノロジーは機械翻訳の分野で目覚ましい進歩を遂げてきましたが、特に高度に専門化されたコンテンツやコンテキストに依存するコンテンツを扱う場合には、その限界を認識することが重要です。そのため、正確性を確保し、文化的なニュアンスを捉えるために、出力をレビューして改良する上で、人間の翻訳者が重要な役割を果たします。
トピック: 記事, ローカライズテクノロジ, eラーニングのローカライズ
執筆 Margarita Núñez
Margaritaは、SimulTransのグローバル市場担当ディレクターで、複数のチャンネルを使った社内外に向けたキャンペーンのためのコンテンツの作成、管理、公開を行い、SimulTransのデジタルマーケティングを指揮しています。ローカライズ業界のセールスと管理に25年以上の経験があります。また、多くのローカライズの組織に携わり、現在はグローバルな非営利団体であるWomen in Localizationにおいても積極的に活動しています。